コンペ概要

コンペページはこことは

ドイツ最大級のオンラインショップOTTOを題材に特定のユーザがどの商品に対し、クリック、カート追加、注文するかを予測する。

データはアイテム数180万、ユーザ数1200万人、インタラクション数2.2億が与えられる。これらのデータは4週間のインタラクション履歴からなる。 3週間分をtrain, 残り1週間をtestとして扱う。また、train, testでユーザの重複はない。

評価は、各インタラクション(click, cart, order)ごとにRecall@20の重み付き平均和で計算される。

解法の概要

  • Model
    • Candidate Generation (Recall)
    • Rerank
  • CV Strategy
    • 5%のユーザを使う

上位解法

1st place solution

  • Candidate Generation
    • NNでEmbeddingを作成
      • session embedding
      • aid embedding
    • 学習時は上記を使って、positive, negativeサンプリングをそれぞれ行いRerankerが学習するデータを選出
      • cos similiarityが (avg + min) / 2 以上のものをpositiveとする?
  • Reranker
    • LGBMRanker
      • Feature
        • session * aidを使ったcandi

まとめ

See Also

Support

もしこの記事が役に立ったなら、 こちらから ☕ を一杯支援いただけると喜びます