计算语言学-厦大应用语言学.pptx
计算语言学;计算语言学的定义:是利用计算计;二、计算语言学的发展:计算语;1946年,美国研制出第一台电;人们在失败中得到启发,认为要搞;三、计算语言学的学科分类:就理;一般来说,完整的语音识别要经历;清华大学电子工程系,非特定人汉;计算词汇学:研究如何用计算机处;语料库语言学:语料库(corp;四、汉字的信息处理(一)、汉字;(二)、汉字输入01汉字输入0;1、汉字键盘输入汉字形码输入汉;编码的优缺点(1)单击此处可添;编码的优缺点(2)与人的语音思;2、汉字识别电脑的汉字识别功能;印刷汉字识别技术主要包括:扫描;五、词语的信息处理自动分词的必;分词不当的例子:在Google;自动分词的方法:机械切分、智能;正向最大匹配法的缺点:表设计困;逆向最大匹配法:一般说来,逆向;智能切分:模拟人的思维,采用词;基于统计的分词方法:通过对大;自动分词的问题:歧义字段交集型;交集型歧义字段的消解:伪歧义:;组合型歧义字段:汉字串AB被称;未登录词的处理:未登录词:词典;固有名词主要的是人名,地名,单;01未登录词的识别:人名02如;讨论:中文加个空格行不行?;八、机器翻译添加标题机器翻译在;恢复期:20世纪70年代:开始;美国在乔治敦大学机器翻译系统的;机器翻译在中国的发展我国是继美;复苏时期:1975-1987:;繁荣时期:1987-至今这一时;机器翻译存在的问题:计算机、互;单击此处添加小标题目前机器翻译;TM绕开了语言学的瓶颈,其原理;作业:添加标题作业:添加标题计