文档详情

基于实例的机器翻译-方法和问题.pdf

发布:2017-05-08约6.43千字共3页下载文档
文本预览下载声明
维普资讯 · 语言信息处理 · 术‘语标准化与信患技术 003年第2期 基于实倒昀觚器翻译——方法和问题 ◇王厚峰(北京大学) 关键词:基于实例的机器翻译,双语对齐,相似度计算,模板获取 摘 要:介绍了基于实例的机器翻译方法,并对基于实例的机器翻译 中的若干问题,如双语实 例的加工对齐、实例的相似度计算和实例模板提取等问题作了说明。 M ethodandIssues0fExample—BasedM achineTranslation ⅣGHoufeng Keywords:EBMT,BilingualAlignment,SimilarityMeasure,TemplateAcquisition. Abstract:ThebasicframeofExamplebasedmachinetranslationisconcernedinthispaper.Some keyissues,suchas bilinugal alignment,similaritymeasurebetween inputsentencenadexma ple,nad templateacuq isition,areintroduced. 一 、 引 言 二、EBMT的基本思想 早期的机器翻译本质上都是基于语言规则或 长尾真认为,人们在翻译简单句子时并没有 语言知识 RBMT(RuleBasedMachineTranslation) 做语言的深层分析,而是先将句子分解为几个片 的。如,词法规则,句法分析规则,转换规则,目标 断 (短语),然后,借助于已有片断的翻译,将分解 语生成规则等。这些规则都是根据语言专家的经 的每个片断翻译成 目标短语,最后再将这些短语 验总结归纳出来的。直译法、转换生成方法、中间 组合起来形成一个长的句子。 语言方法等都可以归为这一类。在 1980年代中后 基于上述思想,长尾真提出了基于实例的机 期,这种纯粹基于语言知识的状况渐渐被基于语 器翻译EBMT的思想。对应地,EBMT也分为三大 料库的机器翻译 CBMT(Corpus—BasedMachine 部分:将实例划分为片断,确定各个片断的翻译以 Translation)方法打破 。 及重组片断。例 1: 语料库方法 中最有影响的是 IBM公司 的 (a)她买了一本计算语言学人门书 P.Brown提 出的基 于统计 的机器 翻译 SBMT 假定计算机内已经存储了如下的实例对: (StatisticsBasedMachineTranslation)o受语音处理 (b)她买了一件时髦的夹克衫 . 的启发,P.Brown 在 1988年第二届TMI会议上提 Sheboughtasharpjacket. — — 出了用 隐马尔科夫模
显示全部
相似文档