文档详情

基于短语的汉维维汉统计机器翻译.pdf

发布:2017-05-11约2.28万字共3页下载文档
文本预览下载声明
第37 卷 第9 期 计 算 机 工 程 2011 年5 月 Computer Engineering May 2011 Vol.37 No.9 文献标识码文献标识码::A 文献标识码文献标识码:: 中图分类号中图分类号::TP391.1 文章编号文章编号::1000——3428(2011)09——0016——03 中图分类号中图分类号:: ·博士论文·博士论文·· 文章编号文章编号:: —— —— —— ··博士论文博士论文·· 基于短语基于短语的汉维的汉维 维汉统计机器翻译维汉统计机器翻译 / 基于短语基于短语的汉维的汉维 维汉统计机器翻译维汉统计机器翻译 董兴华董兴华 1 ,周俊林,周俊林 2 ,郭树盛,郭树盛 1 ,吐尔洪,吐尔洪 吾司曼吾司曼 1 · 董兴华董兴华 ,,周俊林周俊林 ,,郭树盛郭树盛 ,,吐尔洪吐尔洪 吾司曼吾司曼 (1. 中国科学院新疆理化技术研究所 ,乌鲁木齐 830011 ;2. 中国科学院新疆分院,乌鲁木齐 830011) 摘摘 要:要 :利用电话录音的汉维平行语料库和开源的 Moses 系统构建一个基于短语的统计机器翻译系统 。针对汉维平行语料库规模较小和维 摘摘 要要 :: 吾尔语形态变化比较丰富的特点 ,通过对词级的语料库进行切分得到词素级的语料库,并分别进行词一级的实验和词素级的实验。实验表 明,词素级的实验能降低无法识别的词的概率,提高翻译的质量。 关键词关键词:汉维: ;维汉;词素;预处理;后处理 关键词关键词:: Phrase-based Chinese-Uyghur/Uyghur-Chinese Statistical Machine Translation 1 2 1
显示全部
相似文档