DAY 1 16:55-17:10 Seminar Room B
JaEnKo
配信なし

大規模独自クロールデータをもとに構築したWebコーパスの紹介

独自にクロールした約15億件の URL から取得したコンテンツを元に、日本語 Web コーパスを作成しました。本公演ではその作成方法と社内からの利用方法について紹介します。

Speaker

平田航大

平田航大 / LINEヤフー

engineer at search company

  • GitHub

2023年新卒入社。Web クローラの開発、クロールデータを活用したプロジェクトに従事。

Back to Sessions