文档详情

《计算机辅助翻译系统漫谈》-(精选)课件.ppt

发布:2019-09-14约7.93千字共22页下载文档
文本预览下载声明
计算机辅助翻译系统漫谈 陈群秀 清华大学计算机科学与技术系 智能技术与系统国家实验室 北京 100084 cqx@s1000e.cs.tsinghua.edu.cn * * 摘要 本文首先简单介绍机器翻译研究发展简史和研究动向。然后本文阐述机器翻译系统的分类及特点:机器翻译系统从系统研制的方法分为基于规则的机器翻译系统和基于语料库的机器翻译系统,后者又分为基于统计的机器翻译系统、基于实例的机器翻译系统和翻译记忆系统;从自动化程度分为全自动机器翻译系统、人助机译系统和机助人译系统,后两种合称为计算机辅助翻译系统;从翻译转换方式分为直译式系统、基于转换方式的翻译系统和基于中间语言(枢轴式)的翻译系统;从翻译用户的需求分为为浏览者研制、为修订者研制、为翻译者研制和为写作者研制的系统等四种类型。进而本文提出机器辅助翻译系统最好同时包含基于翻译记忆技术和基于实例模式翻译这两种翻译功能并且这两种翻译方法和翻译过程最好分阶段进行。最后本文对基于翻译记忆技术的辅助翻译有关技术和基于实例模式翻译的有关技术进行了讨论。 关键词 计算机辅助翻译系统;机器翻译系统的分类及特点;基于翻译记忆技术的辅助翻译有关技术;基于实例模式翻译的有关技 机器翻译研究发展简史和研究动向 随着因特网的日益普及应用和全球一体化日益进展,不同语种间人们交流的语言障碍日益显得更为突出。为解决这一难题而进行的机器翻译研究是一个涉及语言学、计算机科学、认知科学等多学科的综合性研究领域。目前,机器翻译研究是国际上激烈竞争的高科技研究领域之一,也是信息处理的实用学科。机器翻译研究是1946年计算机产生后的第一个应用。机器翻译研究自1947年美国洛克菲勒基金会自然科学部主任华伦·韦弗提出用现代电子计算机进行语言翻译的设想至今,已有五十多年近六十年的历史,它的发展历史波波折折、起起复复。它经历过最初近二十年的初创期和第一个兴旺期,但由于当时人们对机器翻译的期望值过高,而机器翻译当时的研究水平和技术的历史局限,也因为当时的大学科人工智能研究没抓住本质而又头脑发热盲目乐观,致使人工智能和机器翻译的研究进入了低谷期,即机器翻译自1966年美国发表了ALPAC报告(黑皮书)后经历了1966年~1976年长达十年的萧条低迷期。到二十世纪七十年代中期机器翻译研究才开始逐渐复苏并进入了第二个兴旺期。特别是八十年代以来,机器翻译研究得到了长足的发展,进入了发展的黄金时代。这个时代有四个显著特点: (1) 机器翻译研究走出实验室开始进入实用阶段。 这个阶段相继出现了一些实用型的机器翻译系统,例如美国的SYSTRAN系统(1975年)、加拿大蒙特利尔大学的TAUM-METEO系统(1976年)、日本富士通公司的ATLAS系统、法国纺织研究所的TITUS-IV系统(翻译编织专业文摘)等。机器翻译研究面向应用、走向应用、迈向商品化,同时又以应用推动更高层次的研究,是这一时代最主要的特点。 (2) 电子和软件产业部门直接卷入机器翻译研究是这个时代的第二个特点。产业部门的直接卷入对机器翻译研究发展产生深远的影响。 (3) 国际间的交流与合作十分活跃是这个时代的又一特点。 国家政府间的合作、民间组织间的合作形式都有。国家间的合作主要有欧洲共同体EUROTRA计划和亚洲由日本政府支持的ODA计划。EUROTRA计划开始于1978年,主要目的在于开发一个能处理欧洲共同体成员国语言的机器翻译系统,当时就投入4000万美元,参加的国家有法国、德国、比利时、丹麦、荷兰、希腊、爱尔兰、意大利、卢森保和美国,大约有100多名的研究人员。ODA计划是由日本通产省发起和资助、由日本国际情报协力中心CICC组织、有中国、泰国、马来西亚和印度尼西亚参加的机译合作计划,开始于1987年,预定1992年完成(实际1993年结束),政府投资60亿日元,翻译策略为中间语言表示和概念词典。 (4) 加速吸收和采用新理论和新技术是这个时代的第四个特点。 机器翻译研究虽然进入了全面发展的黄金时代,但仍然面临着重重的困难,困难归困难,但因机器翻译的市场是巨大的,前景也是远大的,因此各个国家对机器翻译研究的兴趣正在持续增长,特别是日本,热情有增无减。全世界从事机器翻译的研究人员有几千人,其中日本就将近占了一半。机器翻译面临一些严峻问题,例如,机器翻译系统的译准率长期徘徊在70%左右(大规模真实语料文本下更低),译文的可读性、系统对语言现象的覆盖面、系统的鲁棒性尤其是开放性都不尽人意。社会迫切需要对真实文本(尤其是网上海量文本)进行大规模的处理,而机器翻译系统同当今社会对大规模真实文
显示全部
相似文档