基于实例的机器翻译-方法和问题.pdf
文本预览下载声明
维普资讯
· 语言信息处理 · 术‘语标准化与信患技术 003年第2期
基于实倒昀觚器翻译——方法和问题
◇王厚峰(北京大学)
关键词:基于实例的机器翻译,双语对齐,相似度计算,模板获取
摘 要:介绍了基于实例的机器翻译方法,并对基于实例的机器翻译 中的若干问题,如双语实
例的加工对齐、实例的相似度计算和实例模板提取等问题作了说明。
M ethodandIssues0fExample—BasedM achineTranslation
ⅣGHoufeng
Keywords:EBMT,BilingualAlignment,SimilarityMeasure,TemplateAcquisition.
Abstract:ThebasicframeofExamplebasedmachinetranslationisconcernedinthispaper.Some
keyissues,suchas bilinugal alignment,similaritymeasurebetween inputsentencenadexma ple,nad
templateacuq isition,areintroduced.
一 、 引 言 二、EBMT的基本思想
早期的机器翻译本质上都是基于语言规则或 长尾真认为,人们在翻译简单句子时并没有
语言知识 RBMT(RuleBasedMachineTranslation) 做语言的深层分析,而是先将句子分解为几个片
的。如,词法规则,句法分析规则,转换规则,目标 断 (短语),然后,借助于已有片断的翻译,将分解
语生成规则等。这些规则都是根据语言专家的经 的每个片断翻译成 目标短语,最后再将这些短语
验总结归纳出来的。直译法、转换生成方法、中间 组合起来形成一个长的句子。
语言方法等都可以归为这一类。在 1980年代中后 基于上述思想,长尾真提出了基于实例的机
期,这种纯粹基于语言知识的状况渐渐被基于语 器翻译EBMT的思想。对应地,EBMT也分为三大
料库的机器翻译 CBMT(Corpus—BasedMachine 部分:将实例划分为片断,确定各个片断的翻译以
Translation)方法打破 。 及重组片断。例 1:
语料库方法 中最有影响的是 IBM公司 的 (a)她买了一本计算语言学人门书
P.Brown提 出的基 于统计 的机器 翻译 SBMT 假定计算机内已经存储了如下的实例对:
(StatisticsBasedMachineTranslation)o受语音处理 (b)她买了一件时髦的夹克衫 .
的启发,P.Brown 在 1988年第二届TMI会议上提 Sheboughtasharpjacket.
— —
出了用 隐马尔科夫模
显示全部