クックパッドが社内データでBERTを自前学習した経験談 BERT with SentencePiece で日本語専用の pre-trained モデルを学習し、それを基にタスクを解く - クックパッド開発者ブログ
-
BERT の multilingual モデルは日本語の扱いには適さないので SentencePiece を使う
-
pre-training にはクックパッドの調理手順のテキスト(約1600万文)を使用
-
学習は p3.2xlarge インスタンスで 3.5 日程度学習
- p3.2xlargeは3USD/hourなので2.5万ぐらい