OpenSubtitles2018データセットのダウンロード

OpenSubtitles2018[Lison et al., 2018]は映画字幕データの多言語パラレルコーパスである。

日本語-英語対訳コーパスはおよそ2,000件の映画からなる200万文のパラレルコーパスであり、機械翻訳の分野や、映画字幕という特徴を活かした他タスクにおける利用が検討される。

参考文献

シェアする

  • このエントリーをはてなブックマークに追加

フォローする