人们期盼着能拥有并使用更为人性化和智能化的计算机。在人机交互中,从人操作计算机,变为计算机辅助人;从人围着计算机转,变为计算机围着人转;计算机从认知型,变为直觉型。显然,为实现这些转变,人机交互中的计算机应具有情感能力。情感计算研究就是试图创建一种能感知、识别和理解人的情感,并能针对人的情感做出智能、灵敏、友好反应的计算系统。
情感被用来表示各种不同的内心体验(如情绪、心境和偏好),情绪被用来表示非常短暂但强烈的内心体验,而心境或状态则被用来描述强度低但持久的内心体验。情感是人与环境之间某种关系的维持或改变,当客观事物或情境与人的需要和愿望符合时会引起人积极肯定的情感,而不符合时则会引起人消极否定的情感。
情感具有三种成分:⑴主观体验,即个体对不同情感状态的自我感受;⑵外部表现,即表情,在情感状态发生时身体各部分的动作量化形式。表情包括面部表情(面部肌肉变化所组成的模式)、姿态表情(身体其他部分的表情动作)和语调表情(言语的声调、节奏、速度等方面的变化);⑶生理唤醒,即情感产生的生理反应,是一种生理的激活水平,具有不同的反应模式。
概括而言,情感的重要作用主要表现在四个方面:情感是人适应生存的心理工具,能激发心理活动和行为的动机,是心理活动的组织者,也是人际通信交流的重要手段。从生物进化的角度我们可以把人的情绪分为基本情绪和复杂情绪。基本情绪是先天的,具有独立的神经生理机制、内部体验和外部表现,以及不同的适应功能。人有五种基本情绪,它们分别是当前目标取得进展时的快乐,自我保护的目标受到威胁时的焦虑,当前目标不能实现时的悲伤,当前目标受挫或遭遇阻碍时的愤怒,以及与味觉(味道)目标相违背的厌恶。而复杂情绪则是由基本情绪的不同组合派生出来的。
情感测量包括对情感维度、表情和生理指标三种成分的测量。例如,我们要确定一个人的焦虑水平,可以使用问卷测量其主观感受,通过记录和分析面部肌肉活动测量其面部表情,并用血压计测量血压,对血液样本进行化验,检测血液中肾上腺素水平等。
确定情感维度对情感测量有重要意义,因为只有确定了情感维度,才能对情感体验做出较为准确的评估。情感维度具有两极性,例如,情感的激动性可分为激动和平静两极,激动指的是一种强烈的、外显的情感状态,而平静指的是一种平稳安静的情感状态。心理学的情感维度理论认为,几个维度组成的空间包括了人类所有的情感。但是,情感究竟是二维,三维,还是四维,研究者们并未达成共识。情感的二维理论认为,情感有两个重要维度:⑴愉悦度(也有人提出用趋近-逃避来代替愉悦度);⑵激活度,即与情感状态相联系的机体能量的程度。研究发现,惊反射可用做测量愉悦度的生理指标,而皮肤电反应可用做测量唤醒度的生理指标。
在人机交互研究中已使用过很多种生理指标,例如,皮质醇水平、心率、血压、呼吸、皮肤电活动、掌汗、瞳孔直径、事件相关电位、脑电EEG等。生理指标的记录需要特定的设备和技术,在进行测量时,研究者有时很难分离各种混淆因素对所记录的生理指标的影响。情感计算研究的内容包括三维空间中动态情感信息的实时获取与建模,基于多模态和动态时序特征的情感识别与理解,及其信息融合的理论与方法,情感的自动生成理论及面向多模态的情感表达,以及基于生理和行为特征的大规模动态情感数据资源库的建立等。
欧洲和美国的各大信息技术实验室正加紧进行情感计算系统的研究。剑桥大学、麻省理工学院、飞利浦公司等通过实施“环境智能”、“环境识别”、“智能家庭”等科研项目来开辟这一领域。例如,麻省理工学院媒体实验室的情感计算小组研制的情感计算系统,通过记录人面部表情的摄像机和连接在人身体上的生物传感器来收集数据,然后由一个“情感助理”来调节程序以识别人的情感。如果你对电视讲座的一段内容表现出困惑,情感助理会重放该片段或者给予解释。麻省理工学院“氧工程”的研究人员和比利时IMEC的一个工作小组认为,开发出一种整合各种应用技术的“瑞士军刀”可能是提供移动情感计算服务的关键。而目前国内的情感计算研究重点在于,通过各种传感器获取由人的情感所引起的生理及行为特征信号,建立“情感模型”,从而创建个人情感计算系统。研究内容主要包括脸部表情处理、情感计算建模方法、情感语音处理、姿态处理、情感分析、自然人机界面、情感机器人等。
情境化是人机交互研究中的新热点。自然和谐的智能化的人机界面的沟通能力特征包括:⑴自然沟通:能看,能听,能说,能触摸;⑵主动沟通:有预期,会提问,并及时调整;⑶有效沟通:对情境的变化敏感,理解用户的情绪和意图,对不同用户、不同环境、不同任务给予不同反馈和支持。而实现这些特征在很大程度上依赖于心理科学和认知科学对人的智能和情感研究所取得的新进展。我们需要知道人是如何感知环境的,人会产生什么样的情感和意图,人如何做出恰当的反应,从而帮助计算机正确感知环境,理解用户的情感和意图,并做出合适反应。因此,人机界面的“智能”不仅应有高的认知智力,也应有高的情绪智力,从而有效地解决人机交互中的情境感知问题、情感与意图的产生与理解问题,以及反应应对问题。
显然,情感交流是一个复杂的过程,不仅受时间、地点、环境、人物对象和经历的影响,而且有表情、语言、动作或身体的接触。在人机交互中,计算机需要捕捉关键信息,觉察人的情感变化,形成预期,进行调整,并做出反应。例如,通过对不同类型的用户建模(例如,操作方式、表情特点、态度喜好、认知风格、知识背景等),以识别用户的情感状态,利用有效的线索选择合适的用户模型(例如,根据可能的用户模型主动提供相应有效信息的预期),并以适合当前类型用户的方式呈现信息(例如,呈现方式、操作方式、与知识背景有关的决策支持等);在对当前的操作做出即时反馈的同时,还要对情感变化背后的意图形成新的预期,并激活相应的数据库,及时主动地提供用户需要的新信息。
情感计算是一个高度综合化的技术领域。通过计算科学与心理科学、认知科学的结合,研究人与人交互、人与计算机交互过程中的情感特点,设计具有情感反馈的人机交互环境,将有可能实现人与计算机的情感交互。迄今为止,有关研究已在人脸表情、姿态分析、语音的情感识别和表达方面取得了一定的进展。
目前情感计算研究面临的挑战仍是多方面的:⑴情感信息的获取与建模,例如,细致和准确的情感信息获取、描述及参数化建模,海量的情感数据资源库,多特征融合的情感计算理论模型;⑵情感识别与理解,例如,多模态的情感识别和理解;⑶情感表达,例如,多模态的情感表达(图像、语音、生理特征等),自然场景对生理和行为特征的影响;⑷自然和谐的人性化和智能化的人机交互的实现,例如,情感计算系统需要将大量广泛分布的数据整合,然后再以个性化的方式呈现给每个用户。
情感计算有广泛的应用前景。计算机通过对人类的情感进行获取、分类、识别和响应,进而帮助使用者获得高效而又亲切的感觉,并有效减轻人们使用电脑的挫败感,甚至帮助人们理解自己和他人的情感世界。计算机的情感化设计能帮助我们增加使用设备的安全性,使经验人性化,使计算机作为媒介进行学习的功能达到最佳化。在信息检索中,通过情感分析的概念解析功能,可以提高智能信息检索的精度和效率。
展望现代科技的潜力,我们预期在未来的世界中将可能会充满运作良好、操作容易、甚至具有情感特点的计算机。
不少人都翘首以盼,计算机会变得越来越聪明,在不久的将来,它就能像人一样具有情感,与人进行自然、亲切和生动的智能交互。 认知科学(Cognitive Science)是在心理学、计算机科学、人工智能、神经科学、科学语言学、科学哲学以及其他基础科学(如数学、理论物理学)共同感兴趣的界面上,即理解人类的、乃至机器的智能的共同兴趣上,涌现出来的高度跨学科的新兴科学。认知科学试图依靠众多学科的共同努力,理解心智的性质,可能的话,在此基础上制造出能思维的机器。而认知心理学由于关注和研究人的心智活动,在认知科学中发挥着重要的作用。
认知心理学: 人脑与计算机类比
认知心理学是20世纪60年代兴起的心理学研究取向,它不仅研究心智活动的“软件”(即心智活动的过程,如人对信息的编码、储存和提取),而且研究心智活动的“硬件”(即心智活动的结构,如认知功能的脑定位或脑机制),提出了极富特色的理论,促进了对人类心智活动的细微剖析和准确理解,成为现代心理学的主流方向。
信息加工系统(Information-Processing System)也被称为符号操作系统(Symbol Operation System)或物理符号系统(Physical Symbol System)。一个完整的物理符号系统具有信息的输入(Input)、输出(Output)、存储(Store)、复制(Copy)、建立符号结构(Build Symbol Structure)和条件性迁移(Conditional Transfer)六种功能。物理符号系统假设提出,任何一个系统,如果能够表现出智能的话,就必能执行上述六种功能; 反之,任何系统如果具有这六种功能,就能表现出智能。其推论自然是: 人具有智能,人一定是个物理符号系统; 计算机是个物理符号系统,计算机一定能表现出智能。既然人是一个物理符号系统,计算机也是一个物理符号系统,那么我们就可以用计算机来模拟人的智能活动。认知心理学所做的,就是试图用物理符号系统假设中的基本规律来解释人类复杂的心理现象。
心智的计算-表征理解(Computa-tional-Representational Understanding of Mind,简称CRUM)是一种对心智问题的理解方式,认为对思维最恰当的理解是将其视为心智中的表征结构以及在这些结构上进行操作的计算程序。 心智表征属于系统的内部状态,是相对于外部事件或事件的语义加以界定的,是一种形式化的符号表达式; 而所有与系统有关的语义内容,都依照深层的符号表达式及其变换的形式和符号关系结构加以规定,这是一种物理符号操作,是一种计算。表征与计算二者的关系密不可分,因为一定的计算总是建立在一定的表征之上,表现为对表征的某种操作和转换; 而一定的计算也总是会产生某种新的表征。
认知心理学研究心智结构和信息加工过程的方法主要由四个步骤构成,即理论、模型、程序和平台。一个认知理论首先要假定一套表征结构和一套在这些结构上进行操作的加工过程; 然后,通过与由数据结构和算法构成的计算机程序进行类比,设计一个计算模型使得这些表征结构和过程更为精确。有关表征的模糊概念可以用准确的关于数据结构的计算概念予以补充,而心理过程则可由算法来定义; 为了测试该模型,必须用一种编程语言将其在一个软件程序中实现; 最后,该程序应该可以在各种软硬件平台上运行。实际上,无论是信息加工取向对规则和搜索策略等进行的抽象的串行的分析,还是联结主义取向强调的分布式表征和平行加工,各种心智结构和信息加工过程均可采用上述方法进行研究。理论、模型、程序、平台一起构成了认知心理学的基本研究构架。大量研究都遵循着这个途径,并通过实验将各个步骤贯穿起来。
情感计算: 人与计算机交互
显然,情感交流是个复杂的过程,不仅受时间、地点、环境、人物对象和经历的影响,而且有表情、语言、动作或身体的接触。情感计算研究试图通过不断加深对人的情感状态和机制的理解,创建一种能感知、识别和理解人的情感,并能针对人的情感做出智能、灵敏、友好反应的计算系统。
作者简介:傅小兰
研究员,现任中国科学院心理研究所副所长,研究领域为认知心理学,主要关注人的基本认知过程、信息加工动态机制、知识表征、认知绩效以及人机交互中的心理与行为问题。担任脑与认知科学国家重点实验室副主任,中国心理学会常务理事、副秘书长、中国人类工效学会理事、认知工效学专业委员会副主任委员,全国人类工效学标准化技术委员会副主任委员等。
情感计算研究有助于提高计算机感知情境,理解人的情感和意图,做出适当反应的能力。情境化是人与计算机交互研究中的新热点。在人与计算机的交互中,计算机需要捕捉关键信息,觉察人的情感变化,形成预期,进行调整,做出反应。例如,通过对不同类型的用户建模(例如: 操作方式、表情特点、态度喜好、认知风格、知识背景等),以识别用户的情感状态,利用有效的线索选择合适的用户模型(例如,根据可能的用户模型主动提供相应有效信息的预期),并以适合当前类型用户的方式呈现信息(例如: 呈现方式、操作方式、与知识背景有关的决策支持等); 在对当前的操作做出即时反馈的同时,还要对情感变化背后的意图形成新的预期,并激活相应的数据库,及时主动地提供用户需要的新信息。
情感计算是一个高度综合化的技术领域。目前情感计算研究面临的挑战仍是多方面的: (1)情感信息的获取与建模,例如细致和准确的情感信息获取、描述及参数化建模,海量的情感数据资源库,多特征融合的情感计算理论模型; (2)情感识别与理解,例如多模态的情感识别和理解; (3)情感表达,例如多模态的情感表达(图像、语音、生理特征等),自然场景对生理和行为特征的影响; (4)自然和谐的人性化和智能化的人计交互的实现,例如情感计算系统需要将大量广泛分布的数据整合,然后再以个性化的方式呈现给每个用户。
情感计算有广泛的应用前景。计算机通过对人类的情感进行获取、分类、识别和响应,进而帮助使用者获得高效而又亲切的感觉,并有效减轻人们使用电脑的挫败感,甚至帮助人们理解自己和他人的情感世界。计算机的情感化设计能帮助我们增加使用设备的安全性,使经验人性化,使计算机作为媒介进行学习的功能达到最佳化。在信息检索中,通过情感分析的概念解析功能,可以提高智能信息检索的精度和效率。
在电子商务领域,在设计购物网站和股票交易网站等时充分利用人的情感因素的作用,以改变客流量。多模式的情感交互技术能构筑更贴近人们生活的智能空间或虚拟场景,而机器人、智能玩具、游戏等产业则能构筑出更加拟人化的风格和更加逼真的场景。
情感文案素材查找方法:
1、直接用工具找
这个方法简单粗暴,就是直接用易撰自媒体工具去找素材,易撰有个自媒体库,大家只要搜索关键词就可以出来很多相关的素材,可以直接选择内容的发布时间,还有发布平台,易撰视频库也可以批量下载视频素材。
2、自媒体平台找
这个方法也有很多人用,各大自媒体平台上都有很多相同领域的作者,你可以关注他们,就可以获得创作的灵感,然后结合你的自己的观点,这样创作出来的内容也会很吸引读者观看。
3、阅读书籍
多读书真的有用,大家在放假或者空闲的时候可以多阅读书籍或者在手机上查看相关的资讯,然后觉得有好的素材可以直接记录下来给下次内容创作做好准备,而且书上的知识点有很多,也可以丰富大家的思维。
答:现在商品由质量竞争开始不断的升级转变,为了更好的销量和更广阔的市场前景,我们开始着眼于产生适合用户情感需求的商品,只有让产品的理念更人格化,更加满足受众的需求,才能真的立足于市场的激烈竞争的不败之林。我们可以在以下几个角度进行把控。
1目标客户群的针对性:每个人对产品都有很多全方位立体户多层次的情感需要,想要把握用户的方法和需求,我们需要定位产品的目标客户群。比如我们给孩子推荐学习用品的简单化,成年人的产品的智能化,老年人产品的宜人性等,产品的针对客户群不同,所需要设计和把握的理念也会有很多质的差异性。用户的情感需求的把控离不开对群体的特定性的考量。
2深入群体做调研。用户的需求是什么,产品的设计理念追本溯源需要带给消费群体的是什么,并不是嘴巴上随便说说,更重要的是需要去进行市场调研,去深度挖掘客户的需求,而不是自己理论上的想一想,调研的途径种类繁多,我们可以选择去调查问卷、问卷星、当然也可以选择去实地考察调研,等等。形式尽可能的多样化,让样本更加具有代表性,同时调查的群体要尽可能的多样化,样本容量要足够大,这样才能最大限度的减少误差,从而导致我们的把握用户需求更完善科学合理。
3培养种子用户,和用户做朋友。想要满足用户需求,首先要拿出态度和诚意,只有和用户交朋友,深入的了解他的需求,才能够更好的完善产品的服务和输出,更大限度的把控用户消费心理和对产品的服务要求和体验。有利于更好的产业机构的调整和转移。
4永远保持学习的态度。随时大数据时代的到来,互联网的普及,用户的需求越来越多,层级要求也越来越多,是一个动态的不变的需求模式,因此需要我们去永远保持学习的态度和理念,动态把握用户的需求,而不是远点,需要不断的反馈,不断的做出调整。只有这样才能跟上时代发展和进步的潮流。
综上所诉,无论产品的质量有多高,技术有多先进,但是不符合用户需求的产品,终将被市场所淘汰,我们要确定目标客户群,进行深度调研和用户做朋友,与此同时要动态的把控用户的产品需求,相信做到以下几点,就能最大限度的提升产品的用户满意度了。
本次实验将加载两个数据,一个是已经标注好的用户评论数据,另外一个是用户评价主题句,通过标注过的用户评论数据进行基于集成模型的情感极性模型训练,然后利用模型对主题句进行情感极性推理,最后通过数据聚合可视化得出主题情感极性。
使用 Pandas 加载在线数据表格,并查看数据维度和前 5 行数据。
数据属性如下表所示
加载我们之前通过主题词典提取出来的主题句。
数据属性如下表所示
用户评论分词
jieba 分词器预热,第一次使用需要加载字典和缓存,通过结果看出返回的是分词的列表。
批量对用户评价进行分词,需要一些时间,并打印第一行情感极性训练集的分词结果。
批量对用户评价主题句进行分词,并打印第一句用户主题句分词结果。
依据统计学模型假设,假设用户评论中的词语之间相互独立,用户评价中的每一个词语都是一个特征,我们直接使用 TF-IDF 对用户评价提取特征,并对提取特征后的用户评价输入分类模型进行分类,将类别输出为积极的概率作为用户极性映射即可。
用户评论向量化
TF-IDF 是一种用于信息检索与数据挖掘的常用加权技术,当某个词在文章中的TF-IDF越大,那么一般而言这个词在这篇文章的重要性会越高,比较适合对用户评论中的关键词进行量化。
数据集合划分
按照训练集 8 成和测试集 2 成的比例对数据集进行划分,并检查划分之后的数据集数量。
我们在系列实验的开始使用朴素贝叶斯模型来训练情感分析模型,下面我们新增逻辑回归模型作为对比模型。逻辑回归(Logistic Regression)是一种用于解决二分类问题的机器学习方法,在线性回归的基础上,套用了一个 sigmod 函数,这个函数将线性结果映射到一个概率区间,并且通常以 05 分界线,这就使得数据的分类结果都趋向于在 0 和 1 两端,将用户评论进行向量化之后也可以用此方式预测用户情感。本实验直接对标注过的用户情感数据进行训练,并验证单一模型和集成模型在情感分析性能上的差异。
模型加载
通过传入原始的标签和预测的标签可以直接将分类器性能进行度量,利用常用的分类模型评价指标对训练好的模型进行模型评价,accuracy_score 评价被正确预测的样本占总样本的比例,Precision 是衡量模型精确率的指标,它是指模型识别出的文档数与识别的文档总数的比率,衡量的是模型的查准率。Recall 召回率也称为敏感度,它是指模型识别出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率,表示正样本在被正确划分样本中所占的比例,f1_score 值是精确率与召回率的调和平均数,是一个综合性的指数。
我们分别对不同模型使用相同的数据集进行训练和测试,以此来比较单模型之间的差异,并打印模型运行时间供大家参考,批量处理不同的模型需要一些时间进行计算,清耐心等待。
通过求得的指标进行模型评价,我们发现使用相同的数据进行模型训练,朴素贝叶斯模型和逻辑回归模型性能基本持平,相差很微弱,逻辑回归稍稍占一些优势。
Stacking 堆栈模型训练
集成学习是地结合来自两个或多个基本机器学习算法的优势,学习如何最好地结合来自多个性能良好的机器学习模型的预测结果,并作出比集成中的任何一个模型更好的预测。主要分为 Bagging, Boosting 和 Stacking,Stacking 堆栈模型是集成机器学习模型的一种,具体是将训练好的所有基模型对整个训练集进行预测,然后将每个模型输出的预测结果合并为新的特征,并加以训练。主要能降低模型的过拟合风险,提高模型的准确度。
开始对两个模型进行集成训练,训练的时间要比单一模型时间久一些,清耐心等待。
评测结果收集。
结果分析
将结果存入 Dataframe 进行结果分析,lr 表示逻辑回归,nb 表示朴素贝叶斯,model_stacking 将两个单模型集成后的模型。从结果来看集成模型准确度和 f1 值都是最高的,结合两个模型的优势,整体预测性能更好,鲁棒性更好。
样例测试
通过测试样例发现,分类器对正常的积极和消极判断比较好。但是当我们改变语义信息,情感模型则不能进行识别,模型鲁棒性较差。作为早期的文本分类模型,我们使用 TFIDF 的特征提取方式并不能很好的解决语义问题,自然语言是带有语序和语义的关联,其词语之间的关联关系影响整句话的情感极性,后续我们继续试验深度情感分析模型研究解决此类问题。
加载民宿主题数据。
模型预测
将情感分析模型推理的结果写入 DataFrame 中进行聚合。
单主题聚合分析
挑选一个主题进行主题情感分析。
对民宿“设施”进行描述统计,此次我们使用主题词典的出来的用户关于民宿“设施”主体的讨论条数为 4628 条,平均用户情感极性为 040 表示为整体呈现不满意的情况,有超过一半的关于“设施”的民宿评论中表现用户不满意的情况,重庆民宿需要在“设施”进行改善,以此提高用户满意度。
单主题情感极性可视化
我们开始进行“设置”主题下的用户主题情感进行可视化,首先加载画图模块。
对“设施”主题下的用户情感极性进行可视化,我们利用集成模型对主题句进行情感极性预测,如下所示。
在近期举办的ISO/IECJTC1/SC35德国柏林会议上,由中国科学院软件研究所、中国电子技术标准化研究院、小i机器人三家中国科研机构和企业共同提出的“信息技术—情感计算用户界面—框架”提案获得正式立项。这是用户界面分委会首个关于情感计算的标准,也是中国在用户界面领域第一个立项的国际标准。
本次立项的标准是情感计算用户界面系列标准的第一个框架标准,该标准共有五部分内容,涉及基本术语、情感交互过程、情感交互框架等方面的规范性描述。后续将对情感的分类和表达、情感计算用户界面的功能接口、情感表达与呈现和情感数据集等四个部分内容制定更详细的标准。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)