从心理学解读人机交互|人机交互系统

从心理学解读人机交互|人机交互系统,第1张

  不少人都翘首以盼,计算机会变得越来越聪明,在不久的将来,它就能像人一样具有情感,与人进行自然、亲切和生动的智能交互。 认知科学(Cognitive Science)是在心理学、计算机科学、人工智能、神经科学、科学语言学、科学哲学以及其他基础科学(如数学、理论物理学)共同感兴趣的界面上,即理解人类的、乃至机器的智能的共同兴趣上,涌现出来的高度跨学科的新兴科学。认知科学试图依靠众多学科的共同努力,理解心智的性质,可能的话,在此基础上制造出能思维的机器。而认知心理学由于关注和研究人的心智活动,在认知科学中发挥着重要的作用。

认知心理学: 人脑与计算机类比

认知心理学是20世纪60年代兴起的心理学研究取向,它不仅研究心智活动的“软件”(即心智活动的过程,如人对信息的编码、储存和提取),而且研究心智活动的“硬件”(即心智活动的结构,如认知功能的脑定位或脑机制),提出了极富特色的理论,促进了对人类心智活动的细微剖析和准确理解,成为现代心理学的主流方向。

信息加工系统(Information-Processing System)也被称为符号操作系统(Symbol Operation System)或物理符号系统(Physical Symbol System)。一个完整的物理符号系统具有信息的输入(Input)、输出(Output)、存储(Store)、复制(Copy)、建立符号结构(Build Symbol Structure)和条件性迁移(Conditional Transfer)六种功能。物理符号系统假设提出,任何一个系统,如果能够表现出智能的话,就必能执行上述六种功能; 反之,任何系统如果具有这六种功能,就能表现出智能。其推论自然是: 人具有智能,人一定是个物理符号系统; 计算机是个物理符号系统,计算机一定能表现出智能。既然人是一个物理符号系统,计算机也是一个物理符号系统,那么我们就可以用计算机来模拟人的智能活动。认知心理学所做的,就是试图用物理符号系统假设中的基本规律来解释人类复杂的心理现象。

心智的计算-表征理解(Computa-tional-Representational Understanding of Mind,简称CRUM)是一种对心智问题的理解方式,认为对思维最恰当的理解是将其视为心智中的表征结构以及在这些结构上进行操作的计算程序。 心智表征属于系统的内部状态,是相对于外部事件或事件的语义加以界定的,是一种形式化的符号表达式; 而所有与系统有关的语义内容,都依照深层的符号表达式及其变换的形式和符号关系结构加以规定,这是一种物理符号操作,是一种计算。表征与计算二者的关系密不可分,因为一定的计算总是建立在一定的表征之上,表现为对表征的某种操作和转换; 而一定的计算也总是会产生某种新的表征。

认知心理学研究心智结构和信息加工过程的方法主要由四个步骤构成,即理论、模型、程序和平台。一个认知理论首先要假定一套表征结构和一套在这些结构上进行操作的加工过程; 然后,通过与由数据结构和算法构成的计算机程序进行类比,设计一个计算模型使得这些表征结构和过程更为精确。有关表征的模糊概念可以用准确的关于数据结构的计算概念予以补充,而心理过程则可由算法来定义; 为了测试该模型,必须用一种编程语言将其在一个软件程序中实现; 最后,该程序应该可以在各种软硬件平台上运行。实际上,无论是信息加工取向对规则和搜索策略等进行的抽象的串行的分析,还是联结主义取向强调的分布式表征和平行加工,各种心智结构和信息加工过程均可采用上述方法进行研究。理论、模型、程序、平台一起构成了认知心理学的基本研究构架。大量研究都遵循着这个途径,并通过实验将各个步骤贯穿起来。

情感计算: 人与计算机交互

显然,情感交流是个复杂的过程,不仅受时间、地点、环境、人物对象和经历的影响,而且有表情、语言、动作或身体的接触。情感计算研究试图通过不断加深对人的情感状态和机制的理解,创建一种能感知、识别和理解人的情感,并能针对人的情感做出智能、灵敏、友好反应的计算系统。

作者简介:傅小兰

研究员,现任中国科学院心理研究所副所长,研究领域为认知心理学,主要关注人的基本认知过程、信息加工动态机制、知识表征、认知绩效以及人机交互中的心理与行为问题。担任脑与认知科学国家重点实验室副主任,中国心理学会常务理事、副秘书长、中国人类工效学会理事、认知工效学专业委员会副主任委员,全国人类工效学标准化技术委员会副主任委员等。

情感计算研究有助于提高计算机感知情境,理解人的情感和意图,做出适当反应的能力。情境化是人与计算机交互研究中的新热点。在人与计算机的交互中,计算机需要捕捉关键信息,觉察人的情感变化,形成预期,进行调整,做出反应。例如,通过对不同类型的用户建模(例如: 操作方式、表情特点、态度喜好、认知风格、知识背景等),以识别用户的情感状态,利用有效的线索选择合适的用户模型(例如,根据可能的用户模型主动提供相应有效信息的预期),并以适合当前类型用户的方式呈现信息(例如: 呈现方式、操作方式、与知识背景有关的决策支持等); 在对当前的操作做出即时反馈的同时,还要对情感变化背后的意图形成新的预期,并激活相应的数据库,及时主动地提供用户需要的新信息。

情感计算是一个高度综合化的技术领域。目前情感计算研究面临的挑战仍是多方面的: (1)情感信息的获取与建模,例如细致和准确的情感信息获取、描述及参数化建模,海量的情感数据资源库,多特征融合的情感计算理论模型; (2)情感识别与理解,例如多模态的情感识别和理解; (3)情感表达,例如多模态的情感表达(图像、语音、生理特征等),自然场景对生理和行为特征的影响; (4)自然和谐的人性化和智能化的人计交互的实现,例如情感计算系统需要将大量广泛分布的数据整合,然后再以个性化的方式呈现给每个用户。

情感计算有广泛的应用前景。计算机通过对人类的情感进行获取、分类、识别和响应,进而帮助使用者获得高效而又亲切的感觉,并有效减轻人们使用电脑的挫败感,甚至帮助人们理解自己和他人的情感世界。计算机的情感化设计能帮助我们增加使用设备的安全性,使经验人性化,使计算机作为媒介进行学习的功能达到最佳化。在信息检索中,通过情感分析的概念解析功能,可以提高智能信息检索的精度和效率。

在电子商务领域,在设计购物网站和股票交易网站等时充分利用人的情感因素的作用,以改变客流量。多模式的情感交互技术能构筑更贴近人们生活的智能空间或虚拟场景,而机器人、智能玩具、游戏等产业则能构筑出更加拟人化的风格和更加逼真的场景。

目前,计算机理论界所开展的针对各种生理指标方面的“情感计算”方法,主要存在如下危机根本无法解决:

1、要建立情感的识别系统和表达系统,就必须对情感的基本类型进行划分,以确立情感的基本模态。然而,情感的基本类型究竟应该根据什么原则和标准来划分,有何理论根据?

2、对于同一类型情感,无论是情感感受强度,还是情感表达强度和情感生理唤醒程度,都可以采用不同的生理指标进行计算和测量,究竟应该选用哪一个生理指标为主要尺度呢?

3、对于同一类型情感采用同一个生理指标进行测量和计算时,由于受到许多环境因素、人体其它生理因素和精神因素的影响,其测量值的差异性和波动性如何消除。

4、不同的情感类型所产生的不同生理指标之间往往没有通约性,那么,不同类型的情感之间如何进行相互比较和统一度量?

5、人的情感内容和感情方式是极为丰富的,各种情感之间相互渗透、相互作用、相互转化,往往有着相当复杂而且变化频繁的关系,那么对于情感的计算就需要真正天文数字般的情感数据资源库,还需要海量的计算模型与计算工作量,而人脑为何并不需要?

6、有些复杂而微妙的情感,如怀疑、犹豫、迷茫、怜悯、尴尬、自我表现等,其生理指标的变化往往极其微弱而且短暂,对于它们的计算和测量如何进行?

7、有些情感(如“对敌人的仇恨”与“对亲人的生气”)往往具有相同或相近的生理指标,但两者所表达的价值内涵往往相差很大,如何进行区别?

8、情感的感受强度和表达强度与各种生理指标的变化量度通常不是成线性函数关系,大部分都是呈非线性的、不连续的、模糊的、概率性的、波动的函数关系,因此采用生理指标的变化量来计算情感的感受强度和表达强度,如何消除其误差性和不确定性。

9、假如能够计算出人的情感感受强度、表达强度和生理唤醒程度,这些计算值又代表了什么样的客观价值意义?如何使电脑或机器人具有和谐、友好、灵活的人机界面?

总之,对于情感的感受强度、表达强度和生理唤醒指标的计算实际上只是对于情感的表面形式的计算,而不是对于情感的客观内容的计算,因此不可能实现真正意义的“情感计算”。 目前,“情感计算”理论中主要存在如下唯心主义和形而上学的哲学错误,必须进行深刻的反思:

1、唯心主义错误。目前的“情感计算”理论以唯心主义的观点来看待情感的哲学本质,把情感与它所对应的客观存在割裂开来,局限于在主观范畴内来分析情感现象与情感规律。唯心主义者常常把主观与客观割裂开来,它否认,任何主观意识都产生于客观存在,都是人脑对某一种客观存在的反映,那怕有时是一种不真实的、不正确的、不全面的、甚至是颠倒的反映;它不知道,要认识一种主观意识的哲学本质必须从它所反映的客观存在中找答案,要分析一种主观意识的变化规律性应该从它所反映的客观存在的规律性上着手;它不知道,情感作为人脑的一种主观心理活动,必然对应着某一种客观存在,必然是人脑对某一种客观存在的主观反映;它在分析情感现象与情感规律时,总是试图在“需要”、“欲望”、“体验”、“态度”等主观心理范畴内找答案,而不能从其所反应的客观存在中找答案。

2、形而上学的表面性错误。目前的“情感计算”理论以形而上学的表面性观点来看待情感的客观内容,混淆了情感的客观内容与其表现形式的本质区别,它认为情感计算的核心就是对情感所激发的生理指标的计算。形而上学的表面性观点总是倾向于从事物的表现形式(或外部现象)来认识事物。它否认,事物的表现形式与其客观内容有着本质的区别,事物的表现形式通常只能片面地、不准确地、不稳定地反映事物的客观内容;它总是把情感的表现形式当作情感的客观内容本身。

3、形而上学的孤立性错误。目前的“情感计算”理论以形而上学的孤立性观点来看待情感的运行程序,把情感与认知及意志割裂开来,认为情感是独立运行的,与人的认知过程和意志过程无关。形而上学的孤立性观点总是倾向于根据事物本身的运动与变化情况来认识该事物,而不是根据事物与其它事物的相互联系与相互影响上来认识该事物。他们只看到了情感对于人的活动的影响与制约作用,往往看不到情感与认知、意志的相互联系与相互影响。

人为了生存和发展就必须首先感知和了解各种事物的事实关系,其次要掌握这些事物对于人的价值关系,第三要掌握人的每个反作用于这些事物的生产行为或生活行为的价值关系,并且判断、选择、组织和实施一个最佳的行动方案。第一步由认知活动来完成,第二步由情感活动来完成,第三步由意志活动来完成,因此从认知到情感,再从情感到意志,是一条基本的、不可分割的人类自控行为的流水线。

由此看来,仅仅进行狭义的、孤立的情感计算,仍然不能解决人的心智活动的全部计算问题,还需要实施对意志的计算,并实施对知情意的交互计算。由于意志是一种特殊情感,因此意志计算以及知情意的交互计算都是广义的情感计算。

4、形而上学的片面性错误。目前的“情感计算”理论以形而上学的片面性观点看待情感的客观目的,认为 “情感计算”的研究主要是基于两个现实目的:一是建立和谐的人机交互环境,使计算机或机器人具有良好的人机界面,以降低使用者的劳动强度,提高使用者的工作效率,解放人的双手;二是制作可穿戴式的计算机,以替代、补偿与增强人的辅助感知功能和行为功能,特别是帮助提高残疾人的感知功能和行为功能。

是图灵的平台货币,在雷达-图灵生态系统中完全流通。雷达图灵TUR是雷达图灵TUR创建的唯一价值令牌。它连接了数字资产系统,是社区治理的基石。它是支持生态系统的重要枢纽。它用于所有业务,例如数字资产交易,财务咨询和财务工件。

雷达图灵TUR

Turing OS提供了多模态交互方式,运用了思维强化引擎、情感计算引擎以及自学习引擎。据图灵机器人创始人俞志晨透露,图灵机器人平台一年时间内已经有超过23万名合作伙伴接入,累计响应了超1461亿次请求。

另外他还透露图灵机器人平台的语义理解准确率也从2014年的11月提高到了947%,人机对话准确率达到882%。同时Turing OS采用了D-RNN自学习引擎,图灵机器人平台每天提供大数据支持,利用超级计算机“天河二号”进行数据处理。

TuringOS15新增了11个视觉能力,包括人脸识别、人脸检测、人脸跟踪等多项视觉技术。

运动控制方面,TuringOS15增强了对17~20自由度双足步态机器人的支持,而在硬件模块方面,TuringOS15则完善了主板及麦克风阵列,激光雷达正内测中。并且这些功能对Turing OS15的使用方完全免费。

6月21日,理想汽车2022夏季发布会圆满举行,现场正式发布了为家庭打造的全球智能旗舰SUV——理想L9。

从理想ONE到全新理想L9,思必驰与理想汽车一路同行,携手赋予了“理想同学”智能语音交互能力,为用户带来更便捷的驾乘体验。

五屏交互,全家出游的理想之选

发布会上,此前已官方剧透几拨的理想L9终于正式与大家见面。作为理想汽车推出的第二款车型,理想L9为旗舰级全尺寸SUV,六座超大空间,全车座椅配备电动调节和座椅加热,前两排独立座椅拥有座椅通风和SPA级十点按摩,满足家庭多人出行需求。动力方面,理想L9采用旗舰级底盘控制系统与增程电动系统,标配空气悬架,百公里加速53秒,CLTC综合续航1315公里,无惧里程焦虑。

智能方面,亮点满满。理想L9车内拥有6颗麦克风和3DToF传感器,配合理想汽车自研的以深度学习为基础的多模态三维空间交互技术,沿用了思必驰的语音技术服务,提供交互能力支持,在车内实现以人类最自然的方式进行交互,开创三维空间交互的全新时代。

同时,理想L9开创了五屏三维空间交互的全新时代,把智能车的视听和娱乐体验提升到一个全新的高度。位于方向盘上方的安全驾驶交互屏,车辆中控屏、副驾娱乐屏、后舱娱乐屏则采用了三个157英寸车规级3K OLED屏,旗舰级音响系统的21个扬声器和734全景声音响布局,配合二排的4D沉浸式影音系统,将提供身临其境的视听娱乐体验。

此外,由两颗高通骁龙8155芯片及24GB内存和256GB高速存储组成的超强计算平台,为理想L9智能座舱AI、软件和娱乐提供了强大的算力支持。而且,理想L9还搭载全新的

标配理想AD Max智能驾驶系统,配备128线激光雷达、6颗800万像素摄像头和5颗200万像素摄像头,让全家出行更安全。

携手同行,持续升级的自由对话

伴随着汽车智能化快速发展,智能座舱不断升级,语音交互成为最为便捷自然的互动方式。作为智能电动汽车品牌的佼佼者,理想汽车也一直致力于为用户提供极致的交互体验,加持思必驰AI对话交互技术,“理想同学”说起话来也自然流畅。

2021年9月,理想ONE迎来OTA22版本的升级,受到广大车主的关注。全新的“理想同学”智商、情商达到双高,依托思必驰对话式AI底层技术,车主可以通过语音完成更多的车控操作,例如调节氛围灯的亮度,打开车窗的程度。双方联合开发的可见即可说功能,实现20秒内可连续对话、看见什么说什么,为车主带来了更自由对话体验。

在此后的 OTA 30版本中,“理想同学”又进一步优化了自由对话功能。同时,理想汽车还创新性提出了自由对话的两个层面:指令自由和对话自由。通过全车车控控制和可见即可说实现的指令自由,与依靠连续对话、想说就说、无效文本拒识和四音区对话等多种技术的结合实现的对话自由,让“理想同学”朝着类人交互方向更进一步。

本次,理想L9通过多模态融合实现的三维空间交互,使“理想同学”不仅能“耳听八方”,还能“眼观六路”。再度携手思必驰,聚焦在全家人、跨屏幕的语音交互体验的持续提升上。打造出的“理想同学”,除了其本地语义性能的提升,响应速度提升了300ms,在弱网环境下,也仍能开展流畅的对话;新增影视点播功能,增加服务专家模块,并打造了全车可见即可说能力,随时拥有最新的服务体验;全车车控的语音指令更加丰富,车内全场景智联轻松出行。

随着车载语音助手的日益普及,深耕语音交互技术的当局者们,不仅要持续深挖语音识别、语义理解、语音合成等底层关键技术,更要拓展AI技术在垂直场景下的应用。

思必驰围绕生态和内容为智能座舱提供全场景交互的深度融合。未来,也将继续深化全双工技术,融合多模态交互、情感交互等技术,与合作伙伴一起共探智能交互发展,为广大车主带来更便捷、更安全、更有温度的语音交互体验。

@2019

在近期举办的ISO/IECJTC1/SC35德国柏林会议上,由中国科学院软件研究所、中国电子技术标准化研究院、小i机器人三家中国科研机构和企业共同提出的“信息技术—情感计算用户界面—框架”提案获得正式立项。这是用户界面分委会首个关于情感计算的标准,也是中国在用户界面领域第一个立项的国际标准。

本次立项的标准是情感计算用户界面系列标准的第一个框架标准,该标准共有五部分内容,涉及基本术语、情感交互过程、情感交互框架等方面的规范性描述。后续将对情感的分类和表达、情感计算用户界面的功能接口、情感表达与呈现和情感数据集等四个部分内容制定更详细的标准。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/751037.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-08
下一篇2023-07-08

发表评论

登录后才能评论

评论列表(0条)

    保存