要約

BARTでのBERTとの違いは以下の３つの特徴

図のようにエンコーダーとデコーダーの両方を使って事前学習を行った。事前学習の手法は以下の７つを行った

図にあらあわすと上図の通り。

単語マスキングでは予測する単語に＿というマスキングを施す単語削除では任意の単語を削除して.で置き換える単語列のマスキングでは複数単語（BC）に＿というマスキングを施す単語の並び替えでは単語の順番を入れ替える。文章回転では、単語の並びを保持したまま最初の単語を入れ替える