CommonLit 2023 振り返り

CommonLitのコンペに参加したので振り返り

コンペ概要

promptが与えられ、その中にはquestion, title, textがある。

それを生徒？が要約した内容に対し、content, wordingというスコアを着ける。

コンペではそのcontent, wordingのスコアを予測する。

詳細はリポジトリにある。ここでは簡単にまとめる。

これでは全く上位には届かなかったので、上位解法見ていく。

debertaの入力値を'Think through this step by step : ' + prompt_question + [SEP] + 'Pay attention to the content and wording : ' + text + [SEP] + prompt_textとした
- prompt enginneringがこんなところでも・・・
- SEPで囲まれた部分はmaskさせる
別コンペで学習させたモデルの予測値をつかった？
モデルの最大長は1280~2048
- 最終的には2048で学習？
GroupKFoldで0.4581
アンサンブル
- deverta-large
  - mean pooling, lstm pooling
- deberata-base
  - mean pooling, lstm pooling
- OpenAssistant/reward-model-deberta-v3-large-v2
  - mean pooling

prompt_question, summary_textを入力にし、content, wordingを予測
- 似ているサマリ文章同士で単語の置換を行った（これ思いついたのすごすぎ）
- 上記でData Augmentationをした
deberta
- poolingには、cls tokenとmean poolintを使った
- token_type_idsを使って、prompt, question, textを区別した（token_type_idsってこういう使い方するんですね）
- max_lengthは1500

大量のモデルのアンサンブル
- deberta large, base
  - layer freeze
  - max_length 1500 ~ 868
- poolings
  - cls, mean
GBDTを使ったアンサンブルを使っていたが、最終的にはcvが低かったのでアンサンブルはしなかった
- 自分の場合途中結果のcvを比較可能にしていなかったのでこれは反省点…

と勝つために必要だったことを並べてみると、rtx3060とkaggle notebookだけでは戦えなかった気がする。

deberta largeは試したが、4fold学習しようとするとtimeoutになるし。。

今回は縁がなかったコンペだった。早めに撤退するべきだった。いいグラボを手に入れた時にまた頑張ろう。

もしこの記事が役に立ったなら、こちらから ☕ を一杯支援いただけると喜びます