关于人机交互技术的综合研究报告.doc
文本预览下载声明
关于人机交互的综合研究报告
张玉 刘珊珊 武明 吴丽艳 梁媛媛 张文静
(济南大学 信息科学与工程学院计0903班)
摘要 人机交互是研究人与计算机之间通过相互理解的交流与通信,在最大程度上为人们完成信息管理,服务和处理等功能的一门技术科学。本文对人机交互中有关情感、手势和人脸识别的技术进行了概要介绍与叙述并且阐述可一些对人机交互的认知与理解。在更深入了解人机交互知识的过程中我们也可以看到人机交互技术的广阔发展前景。
关键词: 人机交互的认知 人机交互 情感 手势 人脸识别
引言
机交互(Human-Computer Interaction, 简写HCI):是指人与计算机之间使用某种对话语言,以一定的交互方式,为完成确定任务的人与计算机之间的信息交换过程。
专业和普通人群生活,学习,工作的必备助手和工具,并对改变社会生活与工作的模式起到深远的影响。正是这个原因,世界各国信息领域的学者和企业巨头都部署了发展新一代人机交互领域的中长期发展计划。着人机交互技术的发展,人们越来越关注这一门科学,通过本文的综述,读者可以对人机交互技术的几个方面进行概括性了解。
关于人机交互的认知
ACM图灵奖1992年获得者、微软研究院软件总工程师Butler Lampson在题为“二十一世纪的计算研究”报告中[1]指出“计算机有三个作用:第一是模拟;第二是计算机可以帮助人们进行通信;第三个是互动,也就是与实际世界的交流”;“人们希望计算机能够看、听、讲,甚至比人做得更好,并能够进行实时处理”。关于对人机交互的认知,要从认知心理学开始说起,认知心理学研究的是人们如何获得外部世界信息,信息在人脑内如何表示并转化为知识,而知识是怎样存储的又如何用来指导人们的注意和行。认知心理学涉及心理活动的全部过程——从感觉到知觉、识别、注意、学习、记忆、概念的形成、思维、表象、回忆、语言、情绪和发展过程。认知有很多个过程,包括感知、关注、记忆、学习、识别、 阅读、说话和聆听、规划、推理和决策等。
感知和认知:人的感知是通过人体器官和组织进行人与外部世界的信息的交流和传递;而认知是人们在进行日常活动时发生于头脑中的事情,它涉及思维、记忆、学习、幻想、决策、看、读、写和交谈等。感知和认知又是密切关系不可分开独立存在的,人的感知是认知的基础,认知是将感知获取的信息综合运用。
认知过程与交互原则:许多认知过程是相互依赖的,一个活动可同时涉及多个不同的过程,只涉及一个过程的情况非常罕见,例如人们在选购商品时就涉及关注、感知、识别、说话、思考、决策等过程。
由人的关注特点,在设计人机交互界面时应做到。信息的显示应醒目,以便执行任务时使用,可使用动画图形、彩色、下划线,对条目及不同的信息进行排序,在条目之间使用间隔符等。避免在界面上安排过多的信息。尤其要谨慎使用色彩、声音和图像,人们倾向于使用过多的这类表示,而导致界面混杂,分散用户的注意力,让用户反感。朴实的界面更容易使用。 在人机交互的发展中,一大批专家为此做出了卓越的贡献.:(1)1945年,美国罗斯福总统的科学顾问Bush
(1894~1974)在《大西洋月刊》上发表的“a5 we maythink”的著名论文[2],提出了虚采用设备或技术米帮助科学家检索、记录、分析及传输各种信息的新思路和名为“Memex”的一种工作站构想,影响着一大批最著名计算机科学家.
关于情感
情感在人类的认识和人机交互中起着关键性的作用.具有情感能力的计算机就是让计算机能够在和人类相处时更有智能、更为敏感和更为和谐和亲切 情感是一种内部的主观体验,但总是伴随着某种外部表情。面部表情不仅是人们常用的较自然的表现情感的方式,也是人们鉴别情感的主要外部标志。例如,愉快时额眉平展、面颊上提、嘴角上翘,而悲伤时额眉紧锁、嘴角下拉。使用特定的仪器可以对面部的微小表情变化进行研究,甚至可以区分真笑和假:
.面部情感识别
.肢体情感识别
.生理情感识别
语音情感识别系统结构
语音情感识别过程:对语音信号根据需要进行预处理,
提取跟情感相关特征信息,
根据这些特征进行分类,
最后得出识别结果
语音情感特征:国际上对情感语音的研究主要侧重于情感的声学特征的分析这一方面。
一般来说,语音中的情感特征往往通过语音韵律的变化表现出来。例如,当一个人发怒的时候,讲话的速率会变快,音量会变大,音调会变高等,同时一些音素特征(共振峰、声道截面函数等)也能反映情感的变化。中国在人机交互语音方面的研究也已经有一些很好的研究成果并已经应用于实际市场之中[4]。1999年,在国家智能计算机研究开发中心、中国科技大学人机语音通信实验室的基础上组建了科大讯飞公司,技术上更着眼于合成语音的自然度、可懂度和音质,设计了基于L/VIA声道模型的语音合成器、基于数字串的韵律规则分层构
显示全部