独自にクロールした約15億件の URL から取得したコンテンツを元に、日本語 Web コーパスを作成しました。本公演ではその作成方法と社内からの利用方法について紹介します。
平田航大 / LINEヤフー
engineer at search company
2023年新卒入社。Web クローラの開発、クロールデータを活用したプロジェクトに従事。