Parallel corpus

[ˈpærəlɛl ˈkɔːrpəs] パラレルコーパス

1. ある言語のテキストと、それが別の言語に翻訳されたテキストを対にしたものの集まり。

ある言語で書かれたテキストと、そのテキストが別の言語に正確に翻訳されたテキストをセットにしたデータ群を指します。主に機械翻訳システムの学習データや、言語間の比較研究に用いられます。
A parallel corpus is essential for training machine translation models. (並行コーパスは機械翻訳モデルの学習に不可欠です。)
関連
bilingual corpus
comparable corpus
monolingual corpus