平行语料库(parallel corpora),理学-计算机科学技术-人工智能-自然语言处理-﹝语言知识资源﹞-语料库,能将源语文本和其译语文本进行全文检索并对照显示的语料库。属双语语料库(Bilingual Corpus)。平行语料库较之词典和单语语料库有其独特优势,如双语对照、语言实例数量多、语域广、时效性强、语境丰富等。平行语料库按翻译方向的不同有单向平行语料库(uni-directional parallel corpora)、双向平行语料库(bi-directional parallel corpora)和多向平行语料库(multidirectional parallel corpora)等三种形式。由于双语语料收集和对齐整理有一定难度,平行语料库的建设比单语语料库建设要艰难许多。与普通语料库一样,平行语料库也必须以电子文本的形式存储,可以利用计算机进行识别、检索和分析。创建平行语料库最关键也最困难的步骤是进行双语语料间的对齐,即将原文与译文建立起篇章、段落、句子甚至是词语层面的对应。