纲要语言领域总目标.docx
文本预览下载声明
纲要语言领域总目标
中文领域的总目标是建立一个智能型人机系统,能够识别和理解中文文本,改善自然语言处理(NLP)、机器翻译(MT)、自动摘要(SA)、自然语言理解(NLU)等应用。
该目标要实现,需要在建立具有正确理解能力的中文自然语言模型、提升知识表示技术、开发以语义为中心的智能处理架构、改善机器学习算法,以及全面提高中文语料库质量等方面都开展科学研究,并能在多样的上下文环境中取得落实结果的相关科学技术。
具体而言,首先要注重探究中文语言的本质特征,优先挖掘中文语言和互联网数据特征,分析中文语言表征、理解机制等,加强语义层面和句法层面的研究,强化应用型研究与基础型研究,增强中文语料库及中文语言处理技术的研发能力,实现可移植性的技术标准,提升算法的时速和决策能力,建立可评估的中文语料库和分析模型,解决自然语言处理中信息丢失和常识被忽略等问题,建立在中文语言中数据挖掘的相关研究方法,针对不同应用背景提出有效的自然语言理解方法,更进一步,可以改进机器学习和神经网络等技术,提升计算机对中文抽象认知的能力。
总之,中文领域的研究目标是通过对中文的科学研究、开发、整合和应用,让人机智能可以正确准确地理解中文文本,包括语用、语义和句法层面的深度理解,从而将中文文本转化为机器可以高效利用的信息资源,实现真正智能的中文应用。
未来的中文 NLP 将不仅仅是一个易行的体系,而将是一种真正的智能体系,它将以更强大的方式来理解中文,有关自然语言处理、机器翻译、自动摘要等技术也将有更好的应用前景。
显示全部