DAY 1 16:55-17:10 Seminar Room B
JaEnKo
스트리밍 없음

대규모 독자 크롤링 데이터를 기반으로 구축된 웹 코퍼스 소개

독자적으로 크롤링한 약 15억건의 URL로부터 취득한 컨텐츠를 바탕으로 일본어 웹 코퍼스를 작성했습니다.

Speaker

Hirata Kodai

Hirata Kodai / LY Corporation

engineer at search company

  • GitHub

2023년 신졸입사.웹 크롤러 개발, 크롤링 데이터를 활용한 프로젝트에 종사.

Back to Sessions