人为什么会有情感?

人为什么会有情感?,第1张

人为什么会有情感?对于这个问题的回答五花八门:因为有爱;这是由人的本性决定的;人若没有情感,就如行尸走肉;等等,这些回答都是答非所问,牵强附会。要正确回答这个问题,必须从情感的本质及情感对于人生存与发展的实际意义上考察。

一、情感的本质是什么?

心理学把情感定义为:“人对客观现实的一种特殊反映形式,是人对于客观事物是否符合人的需要而产生的态度的体验”。从这个定义可以了解到:情感是一种主观体验、主观态度或主观反映,属于主观意识范畴,而不属于客观存在范畴。辩证唯物主义认为,任何主观意识都是人对客观存在的反映,情感是一种特殊的主观意识,必定对应着某种特殊的客观存在,问题的关键在于能否找到这种特殊的客观存在。

不难发现,“人对于客观事物是否符合人的需要”实际上是一个典型的价值判断问题,“符合人的需要”就是事物的价值特性,是一种客观存在,“态度”和“体验”均是人对事物的价值特性的认识方式或反映方式,这样,心理学的情感定义又可表述为:“情感是人对事物的价值特性所产生的主观反映”。情感所对应的客观存在应该是事物的价值特性。由此可得

情感的本质:情感就是人类主体对于客观事物的价值关系或利益关系的一种主观反映。

二、情感与价值的辩证关系

情感与价值的关系是主观与客观、意识与存在的关系,而后者是哲学的基本问题,因此价值与情感的关系问题也是价值理论和情感理论的基本问题。价值与情感是一个辩证统一的关系,主要表现在四个方面。

1、情感以价值为基础。情感是人对价值的主观反映,尽管这种反映总会或多或少地存在着一些偏差,甚至还会存在着严重的偏差和完全的颠倒,但从总体上讲,情感的变化总是以价值为基础,主要表现在:情感的基本状态取决于价值的基本状态,情感的总体规模取决于价值的总体规模,情感的变化范围取决于价值的变化范围,情感的作用方式取决于价值的作用方式,情感的强度与方向取决于价值的大小与正负,价值一旦变化,情感迟早要发生变化。

对于商人来说,互利互惠的经济往来是维持和发展彼此情感的客观基础,如果没有这种互惠性,商人之间的情感是不能持久的;对于政治家而言,政治上的相互支持、相互配合是维持和发展彼此情感的客观基础,如果没有这种互助性,政治家之间的情感是不能持久的;对于青年男女而言,工作和生活上的相互支持与配合是维持和加深爱情的客观基础,如果没有这种支持与配合,男女之间的爱情是不能持久的;朋友之间的友情主要取决于他们之间的利益关系,只有不断加深彼此的利益联系,其友情才会越来越深厚,如果彼此产生了根本的利益冲突,则其感情迟早会衰减下来,并最终会转化为仇恨。

2、情感对价值具有反作用。情感对于价值并不是完全被动的,可以产生一定程度上的反作用,主要表现在:⑴情感可以在一定程度上阻止、压抑、诱发、转移、强化或诱导人对某种价值的需要,可以相对自主地选择生存环境和发展方向。⑵人在情感的驱动下,可以对事物施加反作用力,并使之发生价值增值。这是人类与其它动物的根本区别。当然,这种反作用不能任意地和无限地施加,它在整体上受制于或服从于价值对情感的决定作用。

3、情感具有相对独立性。人的情感产生并运行于大脑,这就不可避免地受到大脑内部众多因素的制约和干扰,从而在一定程度上偏离它所反映的价值,这种偏离现象就是情感的相对独立性,主要表现在:时间上的异步性、量度上的差异性、方式上的局限性、机制上的异化性。情感的相对独立性限制了人对于复杂价值关系的应变能力,限制了人对于复杂环境的适应能力,但这将有利于排除各种外部或内部因素对情感运行过程的干扰,有利于保持价值消费活动和价值创造活动的连续性和稳定性。

4、情感与价值存在复杂的对应性。⑴它是一种多元变量的函数对应关系,而不是一种一元变量的函数对应关系。⑵它是一种统计概率的对应关系,而不是一种个体动力学的对应关系。⑶它是一种时间上的同向对应关系,而不是一种时间上的同步对应关系。⑷它是一种联系的对应关系,而不是一种孤立的对应关系。⑸它是一种多形式上的价值对应关系,而不是一种单一形式上的价值对应关系。⑹它是一种多层次上的价值对应关系,而不是一种单一层次上的价值对应关系。⑺、它是针对事物的价值特征,而不是针对事物的其它特征。⑻它是一种动态的对应关系,而不是一种静态的对应关系。⑼它是一种复杂的、对立统一的对应关系。⑽它是一种非线性的对应关系。⑾它是一种三因素的对应关系,而不是一种单因素的对应关系。

三、情感的数学分析

情感和价值观都是人类一种特殊的思维形式,其客观目的在于识别事物的价值关系,用以指导人的思想和行为,对于不同的价值事物形成不同的选择倾向性。研究表明,人们对于事物之间的竞争并不是对其价值量的竞争,也不是对其“价值投入产出比”的竞争,而是对其价值率的竞争,在经济领域就是对于利润率的竞争:事物的价值率越大,价值资源向其分配的方向就越明确,向其流动的速度也就越快,其发展速度就越迅猛。因此事物的价值率是事物非常重要的价值参量,体现了该事物与人之间最为基本的价值关系,它必然会反映到人的头脑中来,价值观的客观目的就是用以反映事物的价值率,即

价值观的哲学意义:就是事物价值率的主观反映值。

然而,仅仅认识事物的价值率是不够的,人仍然无法真正确定对于该事物的价值资源的投入原则(投入方向和投入规模)。理论证明(即中值价值率分界定理):当事物的价值率大于主体的中值价值率时,主体就会不断扩大其作用规模或增加其价值资源投入量;相反,当事物的价值率小于主体的中值价值率时,主体就会不断缩小其作用规模或减少其价值资源投入量。可以看出,事物的价值率与主体的中值价值率的差值(即价值率高差),是事物最为重要的价值参量,它从根本上决定着人对于该事物基本的“立场、态度、原则和行为取向”,决定着人对该事物的价值投入方式和投入规模,因而必然会反映了人的头脑中来。情感的客观目的就是用以反映事物的价值率高差,即

情感的哲学意义:就是事物的价值率高差的主观反映值。

人对于所有事物所产生的情感可以组成一个数学矢量,称为情感矢量。

情感矢量:人对于所有事物的情感所组成的数学矢量,称为情感矢量,用M来表示,即

M={μ1,μ2,…,μn} (1)

其中,μi是指人对于第i个事物所产生的情感。

情感矩阵:如果其中的每个事物又由多个更具体的事物所组成,则人的情感可用一个二维的情感矩阵来描述。

M={μi×j}m×n (2)

同理,可以定义n维情感矩阵。

进一步发现,情感可以进行各种并集运算、交集运算和合成运算。在此基础上,可以建立起一个完整的情感数学模型。理论证明,情感的强度与事物的价值率高差的对数成正比,因此情感的运算在本质上就是价值的运算。

情感数学模型的建立,为情感机器人的研制奠定了理论基础。如果机器人一旦具有了情感和意志,就能够在复杂的环境条件下,了解和猜测主人的价值取向和决策思路,灵活性、积极地、创造性地进行活动,使其运行过程具有更明确的目标性、更高的主动性和更强的创造性,圆满完成主人交给的各种复杂的工作任务,从而在更大的工作范围取代人。总之,情感不仅是人情味的唯一来源,还是灵活性、积极性和创造性的唯一来源,情感的赋予将使机器人具有了信息的自组织功能,使其具有自我生产、吸收和传播信息的能力,因此情感机器人的出现是人类进入成熟期信息社会主要标志。

四、情感强度第一定律

情感是事物的价值率高差在人的头脑中的主观反映值,虽然,事物的价值率高差在根本上决定着人的情感强度,但在一般情况下,情感的强度并不与事物的价值率高差成正比,而是一种特殊的函数关系。为了探索这种特殊的函数关系,首先了解一般意义的刺激与感受的生理过程及强度定律。

外界某种物理刺激或化学刺激可以引起人的相应感受器官的反映,而每一种感受器官只对一种或两种形式的能量特别敏感,如眼睛对于光能,耳朵对于声能,皮肤对于热能和机械能,舌头对于化学能等。心理学指出,刺激强度与感觉强度服从韦伯定律。

韦伯定律:刺激强度的增加量与刺激强度之比值为一常数,即:

△I/I=Km (3)

这个定律最初是从人的眼睛对光波的感受性研究中得出来的,以后又发现人的其它器官的刺激感受性也遵循这个定律,最后发现整个生物界的刺激感受性都遵循这个定律,因此韦伯定律实际上是一条基本的生物规律。如果把这个定律进行数学变换,可得:

费希纳定律:感觉强度与刺激强度的对数成正比,即:

μ=KmlogI+C (4)

其中,Km,C为常数,μ为感觉强度,I为刺激强度。

选取一定的刺激强度单位,就可以使费希纳定律变换为:

μ=Kmlog(1+I) (5)

情感是一种特殊的主观反映,其发生过程实际上是人脑对于事物价值特性的刺激与感受的生理过程,它与一般意义的刺激与感受生理过程的不同之处在于:刺激信号不是事物的物理或化学特性,而是事物的价值特性,具体地讲就是事物的“价值率高差”(即事物的价值率与主体的平均价值率之差)。这种刺激信号往往是一种抽象化的、复合型的关系信号,它既可以是复合的色彩、形状、体积、重量、声音、图象等物理化学信号,也可以是语言与文字所组成的第二信号系统,这些复合型信号代表着事物的价值特性,而不是代表着事物的某种物理化学特性。当事物的价值特性作用于或即将作用于人时,人脑将以一定的情感强度来感受它。

既然情感的产生过程是一种特殊的刺激与感受的生理过程,那么情感强度与事物的价值率高差的关系同样应该遵循“费希纳定律”,由此可得:

情感强度第一定律:情感强度与事物的价值率高差的对数成正比,即:

μ=Kmlog(1+ΔP) (6)

其中,Km为强度系数,ΔP为价值率高差,μ为情感强度。

不难发现:当情感强度很小时,情感强度与价值率高差近似地成正比;当情感强度很大时,情感强度与价值率高差的对数成正比;当价值率高差为0时,情感强度亦为0;当价值率高差趋近于-1时,情感强度趋近于负无穷大。

五、情感的五大功能

情感对于人类的生存与发展具有十分重要的意义,归纳起来,有五个方面的功能。

1、识别价值。帮助人如何来识别价值的大小,具体而言就是识别事物的价值率大小:价值率越大的事物,就越能引起人的正向情感;价值率越小的事物,就越能引起人的负向情感。

2、消费价值。帮助人如何来消费价值。一般来说,具有正向价值的事物能够使人产生愉悦的情感,从而可以加强人对于该事物的消费规模或消费速度;具有负向价值的事物能够使人产生痛苦的情感,从而可以削弱人对于该事物的消费规模或消费速度。

3、计算价值。帮助人如何来计算价值。各种客观事物的价值状态通过情感来识别以后,再通过情感的相应运算方式来计算各种客观事物之间的价值联系,通过意志来计算自己的相应行为所产生的价值,并选择出最佳的行为方案。

4、创造价值。帮助人如何来创造价值。一般来说,具有较大价值率的事物能够使人产生强大的推动力来发展该事物的生产规模;事物的价值率越小,人对于创造该事物的积极性就越低。

5、表达价值。帮助人如何来表达价值的大小。人与人之间为了更好地实现分工与合作,一方面必须及时准确地识别他人的价值状态,另一方面必须及时准确地向他人表达自己的价值状态,包括个人的价值需要、价值观、健康、能力、素质、地位、职业、学识等,这就需要借助语言表情、面部表情、姿态表情、仪表服饰等具体的价值表达方式。

--------------------------------来自知道团队“揭秘吸引力法则”

本次实验将加载两个数据,一个是已经标注好的用户评论数据,另外一个是用户评价主题句,通过标注过的用户评论数据进行基于集成模型的情感极性模型训练,然后利用模型对主题句进行情感极性推理,最后通过数据聚合可视化得出主题情感极性。

使用 Pandas 加载在线数据表格,并查看数据维度和前 5 行数据。

数据属性如下表所示

加载我们之前通过主题词典提取出来的主题句。

数据属性如下表所示

用户评论分词

jieba 分词器预热,第一次使用需要加载字典和缓存,通过结果看出返回的是分词的列表。

批量对用户评价进行分词,需要一些时间,并打印第一行情感极性训练集的分词结果。

批量对用户评价主题句进行分词,并打印第一句用户主题句分词结果。

依据统计学模型假设,假设用户评论中的词语之间相互独立,用户评价中的每一个词语都是一个特征,我们直接使用 TF-IDF 对用户评价提取特征,并对提取特征后的用户评价输入分类模型进行分类,将类别输出为积极的概率作为用户极性映射即可。

用户评论向量化

TF-IDF 是一种用于信息检索与数据挖掘的常用加权技术,当某个词在文章中的TF-IDF越大,那么一般而言这个词在这篇文章的重要性会越高,比较适合对用户评论中的关键词进行量化。

数据集合划分

按照训练集 8 成和测试集 2 成的比例对数据集进行划分,并检查划分之后的数据集数量。

我们在系列实验的开始使用朴素贝叶斯模型来训练情感分析模型,下面我们新增逻辑回归模型作为对比模型。逻辑回归(Logistic Regression)是一种用于解决二分类问题的机器学习方法,在线性回归的基础上,套用了一个 sigmod 函数,这个函数将线性结果映射到一个概率区间,并且通常以 05 分界线,这就使得数据的分类结果都趋向于在 0 和 1 两端,将用户评论进行向量化之后也可以用此方式预测用户情感。本实验直接对标注过的用户情感数据进行训练,并验证单一模型和集成模型在情感分析性能上的差异。

模型加载

通过传入原始的标签和预测的标签可以直接将分类器性能进行度量,利用常用的分类模型评价指标对训练好的模型进行模型评价,accuracy_score 评价被正确预测的样本占总样本的比例,Precision 是衡量模型精确率的指标,它是指模型识别出的文档数与识别的文档总数的比率,衡量的是模型的查准率。Recall 召回率也称为敏感度,它是指模型识别出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率,表示正样本在被正确划分样本中所占的比例,f1_score 值是精确率与召回率的调和平均数,是一个综合性的指数。

我们分别对不同模型使用相同的数据集进行训练和测试,以此来比较单模型之间的差异,并打印模型运行时间供大家参考,批量处理不同的模型需要一些时间进行计算,清耐心等待。

通过求得的指标进行模型评价,我们发现使用相同的数据进行模型训练,朴素贝叶斯模型和逻辑回归模型性能基本持平,相差很微弱,逻辑回归稍稍占一些优势。

Stacking 堆栈模型训练

集成学习是地结合来自两个或多个基本机器学习算法的优势,学习如何最好地结合来自多个性能良好的机器学习模型的预测结果,并作出比集成中的任何一个模型更好的预测。主要分为 Bagging, Boosting 和 Stacking,Stacking 堆栈模型是集成机器学习模型的一种,具体是将训练好的所有基模型对整个训练集进行预测,然后将每个模型输出的预测结果合并为新的特征,并加以训练。主要能降低模型的过拟合风险,提高模型的准确度。

开始对两个模型进行集成训练,训练的时间要比单一模型时间久一些,清耐心等待。

评测结果收集。

结果分析

将结果存入 Dataframe 进行结果分析,lr 表示逻辑回归,nb 表示朴素贝叶斯,model_stacking 将两个单模型集成后的模型。从结果来看集成模型准确度和 f1 值都是最高的,结合两个模型的优势,整体预测性能更好,鲁棒性更好。

样例测试

通过测试样例发现,分类器对正常的积极和消极判断比较好。但是当我们改变语义信息,情感模型则不能进行识别,模型鲁棒性较差。作为早期的文本分类模型,我们使用 TFIDF 的特征提取方式并不能很好的解决语义问题,自然语言是带有语序和语义的关联,其词语之间的关联关系影响整句话的情感极性,后续我们继续试验深度情感分析模型研究解决此类问题。

加载民宿主题数据。

模型预测

将情感分析模型推理的结果写入 DataFrame 中进行聚合。

单主题聚合分析

挑选一个主题进行主题情感分析。

对民宿“设施”进行描述统计,此次我们使用主题词典的出来的用户关于民宿“设施”主体的讨论条数为 4628 条,平均用户情感极性为 040 表示为整体呈现不满意的情况,有超过一半的关于“设施”的民宿评论中表现用户不满意的情况,重庆民宿需要在“设施”进行改善,以此提高用户满意度。

单主题情感极性可视化

我们开始进行“设置”主题下的用户主题情感进行可视化,首先加载画图模块。

对“设施”主题下的用户情感极性进行可视化,我们利用集成模型对主题句进行情感极性预测,如下所示。

与其他的人工智能技术相比,情感分析(Sentiment Analysis)显得有些特殊,因为其他的领域都是根据客观的数据来进行分析和预测,但情感分析则带有强烈的个人主观因素。情感分析的目标是从文本中分析出人们对于实体及其属性所表达的情感倾向以及观点,这项技术最早的研究始于2003年Nasukawa和Yi两位学者的关于商品评论的论文。

随着推特等社交媒体以及电商平台的发展而产生大量带有观点的内容,给情感分析提供了所需的数据基础。时至今日,情感识别已经在多个领域被广泛的应用。例如在商品零售领域,用户的评价对于零售商和生产商都是非常重要的反馈信息,通过对海量用户的评价进行情感分析,可以量化用户对产品及其竞品的褒贬程度,从而了解用户对于产品的诉求以及自己产品与竞品的对比优劣。在社会舆情领域,通过分析大众对于社会热点事件的点评可以有效的掌握舆论的走向。在企业舆情方面,利用情感分析可以快速了解社会对企业的评价,为企业的战略规划提供决策依据,提升企业在市场中的竞争力。在金融交易领域,分析交易者对于股票及其他金融衍生品的态度,为行情交易提供辅助依据。

目前,绝大多数的人工智能开放平台都具备情感分析的能力,如图所示是玻森中文语义开放平台的情感分析功能演示,可以看出除了通用领域的情感分析外,还有汽车、厨具、餐饮、新闻和微博几个特定领域的分析。

那么到底什么是情感分析呢?从自然语言处理技术的角度来看,情感分析的任务是从评论的文本中提取出评论的实体,以及评论者对该实体所表达的情感倾向,自然语言所有的核心技术问题,例如:词汇语义,指代消解,此役小气,信息抽取,语义分析等都会在情感分析中用到。因此,情感分析被认为是一个自然语言处理的子任务,我们可以将人们对于某个实体目标的情感统一用一个五元组的格式来表示:(e,a,s,h,t)

以图为例,e是指某餐厅,a为该餐厅的性价比属性,s是对该餐厅的性价比表示了褒义的评价,h为发表评论者本人,t是19年7月27日。所以这条评论的情感分析可以表示为五元组(某餐厅,性价比,正向褒义,评论者,19年7月27日)。

情感分析根据处理文本颗粒度的不同,大致可以分为三个级别的任务,分别是篇章级、句子级和属性级。我们分别来看一下。

1 篇章级情感分析

篇章级情感分析的目标是判断整篇文档表达的是褒义还是贬义的情感,例如一篇书评,或者对某一个热点时事新闻发表的评论,只要待分析的文本超过了一句话的范畴,即可视为是篇章级的情感分析。

对于篇章级的情感分析而言有一个前提假设,那就是全篇章所表达的观点仅针对一个单独的实体e,且只包含一个观点持有者h的观点。这种做法将整个文档视为一个整体,不对篇章中包含的具体实体和实体属性进行研究,使得篇章级的情感分析在实际应用中比较局限,无法对一段文本中的多个实体进行单独分析,对于文本中多个观点持有者的观点也无法辨别。

例如评价的文本是:“我觉得这款手机很棒。”评价者表达的是对手机整体的褒义评价,但如果是:“我觉得这款手机拍照功能很不错,但信号不是很好”这样的句子,在同一个评论中出现了褒义词又出现了贬义词,篇章级的分析是无法分辨出来的,只能将其作为一个整体进行分析。

不过好在有很多的场景是不需要区分观点评价的实体和观点持有者,例如在商品评论的情感分析中,可以默认评论的对象是被评论的商品,评论的观点持有者也是评论者本人。当然,这个也需要看被评论的商品具体是什么东西,如果是亲子旅游这样的旅游服务,那么评论中就很有可能包含一个以上的观点持有者。

在实际工作中,篇章级的情感分析无法满足我们对于评价更细致,如果需要对评论进行更精确,更细致的分析,我们需要拆分篇章中的每一句话,这就是句子级的情感分析研究的问题。

2 句子级情感分析

与篇章级的情感分析类似,句子级的情感分析任务是判断一个句子表达的是褒义还是贬义的情感,虽然颗粒度到了句子层级,但是句子级分析与篇章级存在同样的前提假设是,那就是一个句子只表达了一个观点和一种情感,并且只有一个观点持有人。如果一个句子中包含了两种以上的评价或多个观点持有人的观点,句子级的分析是无法分辨的。好在现实生活中,绝大多数的句子都只表达了一种情感。

既然句子级的情感分析在局限性上与篇章级是一样的,那么进行句子级的情感分析意义何在呢?关于这个问题,需要先解释一下语言学上主观句与客观句的分别。在我们日常用语当中,根据语句中是否带有说话人的主观情感可以将句子分为主观句和客观句,例如:“我喜欢这款新手机。”就是一个主观句,表达了说话人内心的情感或观点,而:“这个APP昨天更新了新功能。”则是一个客观句,陈述的是一个客观事实性信息,并不包含说话人内心的主观情感。通过分辨一个句子是否是主观句,可以帮助我们过滤掉一部分不含情感的句子,让数据处理更有效率。

但是在实操过程中,我们会发现这样的分类方法似乎并不是特别准确,因为一个主观句也可能没有表达任何的情感信息,知识表达了期望或者猜测,例如:“我觉得他现在已经在回家的路上了。”这句话是一个主观句,表达了说话人的猜测,但是并没有表达出任何的情感。而客观句也有可能包含情感信息,表明说话者并不希望这个事实发生,例如:“昨天刚买的新车就被人刮花了。”这句话是一个客观句,但结合常识我们会发现,这句话中其实是包含了说话人的负面情感。

所以,仅仅对句子进行主客观的分类还不足以达到对数据进行过滤的要求,我们需要的是对句子是否含有情感信息进行分类,如果一个句子直接表达或隐含了情感信息,则认为这个句子是含有情感观点的,对于不含情感观点的句子则可以进行过滤。目前对于句子是否含有情感信息的分类技术大多都是采用有监督的学习算法,这种方法需要大量的人工标注数据,基于句子特征来对句子进行分类。

总之,我们可以将句子级的情感分析分成两步,第一步是判断待分析的句子是否含有观点信息,第二步则是针对这些含有观点信息的句子进行情感分析,发现其中情感的倾向性,判断是褒义还是贬义。关于分析情感倾向性的方法与篇章级类似,依然是可以采用监督学习或根据情感词词典的方法来处理,我们会在后续的小节详细讲解。

句子级的情感分析相较于篇章级而言,颗粒度更加细分,但同样只能判断整体的情感,忽略了对于被评价实体的属性。同时它也无法判断比较型的情感观点,例如:“A产品的用户体验比B产品好多了。”对于这样一句话中表达了多个情感的句子,我们不能将其简单的归类为褒义或贬义的情感,而是需要更进一步的细化颗粒度,对评价实体的属性进行抽取,并将属性与相关实体之间进行关联,这就是属性级情感分析。

3 属性级情感分析

上文介绍的篇章级和句子级的情感分析,都无法确切的知道评价者喜欢和不喜欢的具体是什么东西,同时也无法区分对某一个被评价实体的A属性持褒义倾向,对B属性却持贬义倾向的情况。但在实际的语言表达中,一个句子中可能包含了多个不同情感倾向的观点,例如:“我喜欢这家餐厅的装修风格,但菜的味道却很一般。”类似于这样的句子,很难通过篇章级和句子级的情感分析了解到对象的属性层面。

为了在句子级分析的基础上更加细化,我们需要从文本中发现或抽取评价的对象主体信息,并根据文本的上下文判断评价者针对每一个属性所表达的是褒义还是贬义的情感,这种就称之为属性级的情感分析。属性级的情感分析关注的是被评价实体及其属性,包括评价者以及评价时间,目标是挖掘与发现评论在实体及其属性上的观点信息,使之能够生成有关目标实体及其属性完整的五元组观点摘要。具体到技术层面来看,属性级的情感分析可以分为以下6个步骤:

关于文本中的实体抽取和指代消解问题,我们已经在知识图谱的相关章节中做了介绍,这里就不再赘述。针对篇章级、句子级、属性级这三种类型的情感分析任务,人们做了大量的研究并提出了很多分类的方法,这些方法大致可以分为基于词典和基于机器学习两种,下面我们进行详细的讲解。

做情感分析离不开情感词,情感词是承载情感信息最基本的单元,除了基本的词之外,一些包含了情感含义的短语和成语我们也将其统称为情感词。基于情感词典的情感分析方法,主要是基于一个包含了已标注的情感词和短语的词典,在这个词典中包括了情感词的情感倾向以及情感强度,一般将褒义的情感标注为正数,贬义的情感标注为负数。

具体的步骤如图所示,首先将待分析的文本先进行分词,并对分词后的结果做去除停用词和无用词等文本数据的预处理。然后将分词的结果与情感词典中的词进行匹配,并根据词典标注的情感分对文本进行加法计算,最终的计算结果如果为正则是褒义情感,如果为负则是贬义情感,如果为0或情感倾向不明显的得分则为中性情感或无情感。

情感词典是整个分析流程的核心,情感词标注数据的好坏直接决定了情感分类的结果,在这方面可以直接采用已有的开源情感词典,例如BosonNLP基于微博、新闻、论坛等数据来源构建的情感词典,知网(Hownet)情感词典,台湾大学简体中文情感极性词典(NTSUSD),snownlp框架的词典等,同时还可以使用哈工大整理的同义词词林拓展词典作为辅助,通过这个词典可以找到情感词的同义词,拓展情感词典的范围。

当然,我们也可以根据业务的需要来自己训练情感词典,目前主流的情感词词典有三种构建方法:人工方法、基于字典的方法和基于语料库的方法。对于情感词的情感赋值,最简单的方法是将所有的褒义情感词赋值为+1,贬义的情感词赋值为-1,最后进行相加得出情感分析的结果。

但是这种赋值方式显然不符合实际的需求,在实际的语言表达中,存在着非常多的表达方式可以改变情感的强度,最典型的就是程度副词。程度副词分为两种,一种是可以加强情感词原本的情感,这种称之为情感加强词,例如“很好”相较于“好”的情感程度会更强烈,“非常好”又比“很好”更强。另外一种是情感减弱词,例如“没那么好”虽然也是褒义倾向,但情感强度相较于“好”会弱很多。如果出现了增强词,则需要在原来的赋值基础上增加情感得分,如果出现了减弱词则需要减少相应的情感得分。

另一种需要注意的情况是否定词,否定词的出现一般会改变情感词原本的情感倾向,变为相反的情感,例如“不好”就是在“好”前面加上了否定词“不”,使之变成了贬义词。早期的研究会将否定词搭配的情感词直接取相反数,即如果“好”的情感倾向是+1,那么“不好”的情感倾向就是-1。但是这种简单粗暴的规则无法对应上真实的表达情感,例如“太好”是一个比“好”褒义倾向更强的词,如果“好”的值为+1,那么“太好”可以赋值为+3,加上否定词的“不太好”变成-3则显然有点过于贬义了,将其赋值为-1或者-05可能更合适。

基于这种情况,我们可以对否定词也添加上程度的赋值而不是简单的取相反数,对于表达强烈否定的词例如“不那么”赋值为±4,当遇到与褒义词的组合时褒义词则取负数,与贬义词的组合则取正数,例如贬义词“难听”的赋值是-3,加上否定词变成“不那么难听”的情感得分就会是(-3+4=1)。

第三种需要注意的情况是条件词,如果一个条件词出现在句子中,则这个句子很可能不适合用来做情感分析,例如“如果我明天可以去旅行,那么我一定会非常开心。”,在这句话中有明显的褒义情感词,但是因为存在条件词“如果”,使得这个句子的并没有表达观点持有者的真实情感,而是一种假设。

除了条件句之外,还有一种语言表达也是需要在数据预处理阶段进行排除的,那就是疑问句。例如“这个餐厅真的有你说的那么好吗?”,虽然句子中出现了很强烈的褒义情感词“那么好”,但依然不能将它分类为褒义句。疑问句通常会有固定的结尾词,例如“……吗?”或者“……么?”,但是也有的疑问句会省略掉结尾词,直接使用标点符号“?”,例如“你今天是不是不开心?”,这个句子中含有否定词和褒义词组成的“不开心”,但不能将其分类为贬义情感。

最后一种需要注意的情况是转折词,典型词是“但是”,出现在转折词之前的情感倾向通常与转折词之后的情感倾向相反,例如:“我上次在这家酒店的住宿体验非常好,但是这次却让我很失望。”在这个转折句中,转折词之前的“非常好”是一个很强的褒义词,但真实的情感表达却是转折词之后的“很失望”,最终应该将其分类为贬义情感。当然,也存在出现了转折词,但语句本身的情感并没有发生改变的情况,例如“你这次考试比上次有了很大的进步,但是我觉得你可以做得更好”,这里的转折词没有转折含义,而是一种递进含义。在实际操作中,我们所以需要先判断转折句真实的情感表达到底是哪个,才能进行正确的分析计算。

构建情感词典是一件比较耗费人工的事情,除了上述需要注意的问题外,还存在精准度不高,新词和网络用语难以快速收录进词典等问题。同时基于词典的分析方法也存在很多的局限性,例如一个句子可能出现了情感词,但并没有表达情感。或者一个句子不含任何情感词,但却蕴含了说话人的情感。以及部分情感词的含义会随着上下文语境的变化而变化的问题,例如“精明”这个词可以作为褒义词夸奖他人,也可以作为贬义词批评他人。

尽管目前存在诸多问题,但基于字典的情感分析方法也有着不可取代的优势,那就是这种分析方法通用性较强,大多数情况下无需特别的领域数据标注就可以分析文本所表达的情感,对于通用领域的情感分析可以将其作为首选的方案。

我们在机器学习算法的章节介绍过很多分类算法,例如逻辑回归、朴素贝叶斯、KNN等,这些算法都可以用于情感识别。具体的做法与机器学习一样需要分为两个步骤,第一步是根据训练数据构建算法模型,第二步是将测试数据输入到算法模型中输出对应的结果,接下来做具体的讲解。

首先,我们需要准备一些训练用的文本数据,并人工给这些数据做好情感分类的标注,通常的做法下,如果是褒义和贬义的两分类,则褒义标注为1,贬义标注为0,如果是褒义、贬义和中性三分类,则褒义标注为1,中性标注为0,贬义标注为-1

在这一环节中如果用纯人工方法来进行标注,可能会因为个人主观因素对标注的结果造成一定影响,为了避免人的因素带来的影响,也为了提高标注的效率,有一些其他取巧的方法来对数据进行自动标注。比如在电商领域中,商品的评论除了文本数据之外通常还会带有一个5星的等级评分,我们可以根据用户的5星评分作为标注依据,如果是1-2星则标注为贬义,如果是3星标注为中性,4-5星标注为褒义。又比如在社区领域中,很多社区会对帖子有赞和踩的功能,这一数据也可以作为情感标注的参考依据。

第二步是将标注好情感倾向的文本进行分词,并进行数据的预处理,前文已经对分词有了很多的介绍,这里就不再过多的赘述。第三步是从分词的结果中标注出具备情感特征的词,这里特别说一下,如果是对情感进行分类,可以参考情感词典进行标注,也可以采用TF-IDF算法自动抽取出文档的特征词进行标注。如果分析的是某个特定领域的,还需要标注出特定领域的词,例如做商品评价的情感分析,需要标注出商品名称,品类名称,属性名称等。第四步根据分词统计词频构建词袋模型,形成特征词矩阵,如表所示。在这一步可以根据业务需要给每个特征词赋予权重,并通过词频乘以权重得到特征词分数。最后一步就是根据分类算法,将特征词矩阵作为输入数据,得到最终的分类模型。

当训练好分类模型之后,就可以对测试集进行分类了,具体的流程与建模流程类似,先对测试的文本数据进行分词并做数据预处理,然后根据特征词矩阵抽取测试文本的特征词构建词袋矩阵,并将词袋矩阵的词频数据作为输入数据代入之前训练好的模型进行分类,得到分类的结果。

采用基于机器学习的方法进行情感分析有以下几个不足之处,第一是每一个应用领域之间的语言描述差异导致了训练得到的分类模型不能应用与其他的领域,需要单独构建。第二是最终的分类效果取决于训练文本的选择以及正确的情感标注,而人对于情感的理解带有主观性,如果标注出现偏差就会对最终的结果产生影响。

除了基于词典和基于机器学习的方法,也有一些学者将两者结合起来使用,弥补两种方法的缺点,比单独采用一种方法的分类效果要更好,另外,也有学者尝试使用基于LSTM等深度学习的方法对情感进行分析,相信在未来,情感分析会应用在更多的产品中,帮助我们更好的理解用户需求,提升用户使用智能产品的体验。

随着深度神经网络等算法的应用,情感分析的研究方向已经有了非常大的进展,但依然存在着一些难题是目前尚未解决的,在实操过程中需特别注意以下几种类型数据:

情绪轮在用户体验设计上被广泛的应用,很多情感化设计都是基于情绪轮进行的。但是在人工智能领域,将情绪进行多分类比情感分析的三分类任务要难得多,目前大多数分类方法的结果准确性都不到50%。这是因为情绪本身包含了太多的类别,而且不同的类别之间又可能具有相似性,一个情绪词在不同的语境下有可能表达的是不同的情绪类别,算法很难对其进行分类。即使是人工对文本进行情绪类别标注也往往效果不佳,因为情绪是非常主观性的,不同的人对不同的文本可能产生不同的理解,这使得人工标注情绪类比的过程异常困难。如何让机器可以理解真实的情绪目前还是一个未能攻克的难题。

自20世纪70年代中期起,专家学者对顾客满意度进行了大量的研究,提出了许多理论模型。其中,奥立佛提出的 “期望一实绩”模型和情感模型,韦斯卜洛克(Robert A Westbrook)和雷利(Michael D Reilly)提出的 “顾客感知的价值差异”模型、ACSI理论模型是较著名的几个模型。

1“期望一实绩”模型

1980年,奥立佛提出了如图1-2所示的 “期望一实绩”模型。奥立佛认为:在消费过程中或消费后,顾客会根据自己的期望,评估产品和服务的实绩。如果实绩低于期望,顾客就会不满意;如果实绩符合或超过期望,顾客就会满意。1982年,美国学者邱吉尔(Gibert A Churchill)和塞普纳(Carol Surprenant)的实证研究结果表明:在许多情况下,期望和实绩都会影响顾客对期望与实绩比较结果的主观感受,也会直接影响顾客满意度。

图1-2 “期望一实绩”模型

2情感模型

根据奥立佛的观点,满意度是顾客在自己的需要得到满足之后产生的心理反应(包括产品和服务没有满足顾客的需要或超额满足顾客的需要而引起的顾客情感反应),在消费过程中或消费后,顾客会根据自己的期望、需要、理想以及其他可能的实绩标准,评估产品和服务。顾客对实绩的评估结果,以及顾客对评估结果的归因,都会影响顾客的情感,顾客的情感会直接影响顾客满意度。此外,美国路易斯安那州立大学助理教授杰亚特(RamaKJayanti)和杰克逊(AJacks)指出,顾客很难根据某些具体的属性评估服务实绩,因此 “期望一实绩”模型并不能全面解释顾客满意度的形成过程。由于顾客亲自参与服务过程,所以企业管理人员在衡量顾客满意度时应参考顾客在消费过程中的情感反应。芬兰学者李佳得(Verouica Liljaneler)和斯占得克(Tore Strandvik)也发现,顾客在消费过程中的情感直接影响顾客的满意程度。奥立佛在不断完善顾客满意度定义的基础上,于2000年提出了如图1-3所示的顾客满意度形成过程模型。

图1-3 顾客满意度形成过程模型

3“顾客感知的价值差异”模型

美国学者韦斯卜洛克和雷利于1984年提出了“顾客感知的价值差异”模型。他们认为:顾客满意度是顾客对自己感觉中的产品和服务实绩与自己需要的消费价值(需要、愿望、期望)进行比较之后产生的一种情绪反应。产品和服务的实绩越符合顾客需要的消费价值,顾客就越满意;产品和服务的实绩越不符合顾客需要的消费价值,顾客就越不满意。但是,韦斯卜洛克和雷利的实证研究方法存在一些的错误。他们的研究结果并不支持他们提出的 “顾客感知的价值差异会直接影响顾客满意程度”的假设。美国康奈尔大学博士汪纯本于1990年在美国对这个模型进行了实证检验,他的研究结果表明,顾客感知的价值差异是影响顾客满意度的重要因素。1991年,美国学者梅耶斯(JamesHMyers)对 “期望一实绩”模型和“顾客感知的价值差异模型”进行了一次比较研究,他的研究结果表明:与实绩和期望之差相比,顾客感知的价值差异对顾客满意度的影响更大。1993年,斯普兰(RichardASpreng)等人的实证研究结果表明:顾客感知的价值差异对顾客满意度有显著影响,而实绩与期望之差对顾客满意程度却没有显著的影响。

4ACSI理论模型

ACSI基于这样一个理论,即顾客满意度同顾客在产品购买前的期望和在产品购买中及购买后的感知有密切关系,并且,顾客的满意程度低或高将会导致两种基本结果:顾客抱怨和顾客忠诚。ACSI使用的是一种由多重指标(问题)支持的6种潜在变量组成的模型(图1-4)。

图1-4 ACSI模型

ACSI的模型显示在6个潜在变量中,顾客期望、顾客对质量的感知和顾客对价值的感知是3个前提变量;顾客满意度、顾客抱怨、顾客忠诚是3个结果变量,前提变量综合影响并决定着结果变量。展开来说就是,顾客满意度是由顾客在购买和使用产品的经历中,产生对产品质量和价值的实际感知,并将这种感知同购买前或使用前的期望值作比较而得到的感受和体验所决定的;若顾客满意度低就将导致顾客抱怨以至投诉,而顾客满意度高就会提高顾客的忠诚程度;如果重视并妥善处理好顾客的投诉,化解了顾客抱怨,同样可以提高顾客忠诚程度。

通过本能层、行为层和反思层的设计,增强产品设计中的情感体验。

要成为一名出色的设计师,仅仅了解用户的反应是不够的,你还得了解为什么用户会做出这样的反应。为什么有些用户会对这个界面感到愉悦,而其他用户却不高兴?为什么我们修改了配色后,转化率变低了?为什么有些用户会去分享他们的体验,而其他用户不会?

在《情感化设计》一书中,Don Norman探讨了三种不同层次的设计:本能、行为和反思。告诉了我们用户是如何在情感上与事物发生联系。

愉悦

“愉悦”是本能、行为和反思在情感化设计的交叉点(我们将进一步探讨)。至关重要的是,设计师要理解这些情感反应不是偶然的,它们可以通过以人为本的设计方法来培养和创造,提供持久和印象深刻的价值。

首先,在用户使用产品的过程中,必须让用户获得一些预期的价值。如果用户跟产品的第一次见面,就感受到了产品的价值,那么用户会更乐意去使用它,产品的留存就会高。所以产品设计一定要突出核心价值。

然后,在我们培养这些情感体验之前,必须满足一套先决条件,即产品的可用性和易用性。

最后,如果体验能引起积极的本能、行为和反思性的情绪反应,人们会喜欢这个产品并分享给其他人。

现在,我们将探讨这些层次的基本知识,以及它们如何应用于产品设计的例子。我们还将从认知科学的角度来构建这些层次。

情感化设计元素

情感化设计可以将功能性产品转化为难忘和持久的体验。

这通常表现为4个方面:

情感记忆链接 -情感会不停地在我们的记忆中发酵,超出了产品的基本功能价值。我们会记得让我们有某种感觉的事情。

美观的可用性效果 -美观增强了可用性,增加了用户学习和适应的意愿。

说服性情感(直觉) -情感使用户能够做出直觉和快速的决定。我们用认知来理解和解释我们的世界,但是我们的情绪会加快我们的决策。

所有权效应 -用户将花更多的精力在其感到有主导权的地方,就像产品是他们自己的延伸。所以要让用户参与到产品中来,让用户可以一起建设产品。

在任何设计中,本能、行为和反思这三个不同的层面都是互相交织的。没有一种设计能完全独立于这三个层面之外。——诺曼,《情感化设计》

接下来就让我们一起走进情感化设计的三个层面:本能、行为、反思。

一、本能情感设计

本能反应是由最初的感官体验触发的。正是这种第一印象决定了用户将要探索其他一切功能的心情和最初的框架。

MacBook Pro开箱

强烈而积极的本能反应有以下好处:

他们为每个后续的交互创建了一个积极的环境。

如果最初的体验是非常积极的,那么用户更容易原谅错误。

“一见钟情”将更易于引导用户分享产品。

本能设计包括用户的意识状态、产品的最初吸引力和用户的整体感受。

二、行为情感设计

行为反应是我们沉浸在产品体验中的感受。这就是我们如何对产品交互做出反应,继而从产品中获得价值,也就是常说的可用性。

从情感的角度来看,当交互是流畅的、熟悉的、符合预期的,那么用户就会从产品的可用性中获得快乐和满足。

行为设计包括可用性、产品功能、性能和使用效果。

捷豹气温控制系统

强有力和积极的行为反应有以下好处:

它们让用户感受到一种控制感。

通过在用户的行为和预期价值之间建立直接的联系来培养信任和可靠性。

我们应鼓励重复的反应,因为人们更倾向于再次体验那种快乐。

三、反思情感设计

反思性的反应是用户沉浸在某种体验后的感受。用户会记住这个体验给他带来的感受,它决定了用户是再次体验,还是回避它。

强烈而积极的反思反应有以下好处:

他们鼓励用户与他人分享他们的体验。

通过使用延伸到产品本身之外的情境来唤起一种自豪感和认同感。

总的来说,反思性情感设计捕捉到了产品的意义、思想的影响、体验的分享以及文化的影响。

情感化设计技巧

为了创造愉悦的体验,设计师必须掌握情感化设计的技巧。以下是情感化设计技巧:

个性化和定制 -个性化用户体验,让您的用户感受到主导权。允许用户将体验定制为自己的延伸

富有表现力的图像 -使用用户可以与之产生共鸣的、插图和动画-视觉效果本身可以展示情感并帮助用户移情。

正面惊喜 -通过让你的用户惊喜来引起正面的情绪反应。

人性化口吻 -使用更人性化的口吻与用户交谈。通过对话表达情感、同理心和鼓励。

幽默 -笑声和欢乐是非常强烈的积极情绪,可以减轻恐惧和不确定性,同时唤起一种快乐的感觉。

讲故事 -有助于人们理解体验的历程,构建他们的互动框架,甚至在使用产品后也能回忆起他们的体验。

微交互 -微妙的暗示使界面更加活跃和有趣,更能促进互动。

总结

本能的、行为的和反思性的情感设计创造了持久和愉快的产品体验。

情感化设计三层模型

设计师必须了解情感设计是如何涵盖整个体验的,从最初发现产品到使用产品,再到产品使用后的思考。

仅仅用“一见钟情”来培养体验是不够的。这种爱必须是永久的、持久的和可分享的。

本篇文章偏理论,意在先树立情感化设计的意识和理论基础。我还会再写一篇文章,更加具象化的阐述如何进行情感化设计。

产品系列文章

汤涌:干货 | 产品经理入门完整版—能力模型、常用工具、书单、快速入门法​zhuanlanzhihucom 汤涌:如何进行需求收集?​zhuanlanzhihucom 汤涌:需求分析方法论​zhuanlanzhihucom 汤涌:从需求到落地,产品全链路实现流程​zhuanlanzhihucom 汤涌:从需求到产品,如何做一份无懈可击的产品设计​zhuanlanzhihucom 汤涌:情感的艺术—诺曼·情感化设计​zhuanlanzhihucom 汤涌:情感化设计·实战案例篇​zhuanlanzhihucom

在这个高速发展的时代,满足了物质功能要求后,人们开始追求一种有活力、有情趣、物质与精神共繁荣的生活方式。情感化设计就是在这样的时代背景下应运而生的。

人类的情感基本情绪有5种:快乐、悲伤、愤怒、恐惧和厌恶,除快乐之外,其余都是负面情绪。设计艺术中的情感具有多样性的特点,设计师通过设计作品使人产生或兴奋或悲伤、或愉悦或恐惧的各种体验,依此发挥情绪的驱动、监察等作用,从而干预人的认知、行为和判断。

本质上情感是自然选择的产物。自然选择所保存的性状,必定是对人类生存有利的性状。所有情绪都有其正面意义,因而负面情绪并不应被人类摒弃,是完全值得人类重视的。情绪本身就是一种能量,设计师只要善加运用,可以使作品更具感染力,更好地与受众交流。

悲哀是指所爱的人或事物的丧失或盼望的事物的幻灭,而引起的消极的情绪体验。悲伤的程度取决于失去事物的价值或原本期盼的热切程度。它是一种保护性的情绪,能促进深沉思考的反应,能更好地从失去中取得智慧,从而更珍惜目前所拥有的。

例如:公益广告《如果你不使用,请关掉它》反映了如果人类过度使用能源会引起自然灾害的问题。画面只有房间里在使用着的产品和有可能导致出现问题的画框,非常明确地告诉了受众是什么东西引起了什么问题。而预防这个问题发生的解决方法也很简单 -- 如果你不使用,请关掉它。

黯淡的色彩、灰暗的光线、空旷而无生命的画框、僵硬几乎无变化的线条和轮廓,以对这种结果的悲哀促进人们思考,使人类能更好地从失去中取得教训,从而更珍惜环境。

恐惧是指企图摆脱、逃避某种情境而又苦于无能为力的情感体验。恐惧在全部情绪中最具压抑作用,它会引起逃脱和退缩。从生理适应的角度看,它能保护人们逃避危险。它使人类获得本不能得到的信息,它使人类迅速作出反应,并在必要条件下选择逃避不甘愿付出本来自己认为需要自己付出或者觉得付出的大过得到的。它促使人类对所期望的东西重新进行评价及对实现期望采取的方法进行重新调整。

例如:安全行车公益广告,作品中使用真实的人造成很强的视觉冲击力,但并未把画面处理得很血腥。虽然并没有过于恐怖的画面出现,车如塑料般支离破碎的样子还是给人带了深刻的恐惧。

此作品正是希望以恐惧的情感提高可能潜在存在的危险,让人们对安全行车有个深刻印象,促使人们加深对不安全驾车行为的顾虑。

厌恶是一种反感的情绪。不仅味觉、嗅觉、触觉或者想象、耳闻、目睹会导致厌恶感,而且人的外表、行为甚至思想都会导致同样的结果。有些人类行为也让人无法忍受,你也许会因此而感到憎恶。

例如:生产皮草的过程是极其残忍的,但人们往往只看到了华贵的皮草成品而没有机会知道惨绝人寰的生产过程。PETA正是针对这点,制作了这组反皮草运动的宣传广告,广告中动物都失去了光鲜的皮毛,惨不忍睹的肌肉裸露在外,促使人们直视这一残忍的实事。画面中的模特拒穿皮草,也是想说明没有买卖就没有杀害这个问题,希望以此让人厌恶这种不人道的商业行为。

本文介绍了3种负面情感在公益广告中的应用,然而在更多的设计过程中,这些负面情感并不是孤立的,而是相互交叉、相互重叠的。正面情绪可以拓展思维的广度,提高创造性;负面情绪则会加深思维的深度,帮助人们集中精力在认知上,避免注意力分散。推荐阅读:公益广告注意事项!

正确合理地将其运用到设计中,能使作品自身的情感化语言更好地与受众交流沟通,用情感化的表现方式达到一种非生命的作品与受众的沟通,使平淡无奇的作品与受众之间产生一种极为微妙的情感,从而提高作品的感染力。

传统的人机交互,主要通过键盘、鼠标、屏幕等方式进行,只追求便利和准确,无法理解和适应人的情绪或心境。而如果缺乏这种情感理解和表达能力,就很难指望计算机具有类似人一样的智能,也很难期望人机交互做到真正的和谐与自然。由于人类之间的沟通与交流是自然而富有感情的,因此,在人机交互的过程中,人们也很自然地期望计算机具有情感能力。情感计算(Affective Computting)就是要赋予计算机类似于人一样的观察、理解和生成各种情感特征的能力,最终使计算机像人一样能进行自然、亲切和生动的交互。 有关人类情感的深入研究,早在19世纪末就进行了。然而,除了科幻小说当中,过去极少有人将“感情”和无生命的机器联系在一起。只有到了现代,随着数字信息技术的发展,人们才开始设想让机器(计算机)也具备“感情”。从感知信号中提取情感特征,分析人的情感与各种感知信号的关联,是国际上近几年刚刚兴起的研究方向(图1)。

人的情绪与心境状态的变化总是伴随着某些生理特征或行为特征的起伏,它受到所处环境、文化背景、人的个性等一系列因素的影响。要让机器处理情感,我们首先必须探讨人与人之间的交互过程。那么人是如何表达情感,又如何精确地觉察到它们的呢?人们通过一系列的面部表情、肢体动作和语音来表达情感,又通过视觉、听觉、触觉来感知情感的变化。视觉察觉则主要通过面部表情、姿态来进行;语音、音乐则是主要的听觉途径;触觉则包括对爱抚、冲击、汗液分泌、心跳等现象的处理。

情感计算研究的重点就在于通过各种传感器获取由人的情感所引起的生理及行为特征信号,建立“情感模型”,从而创建感知、识别和理解人类情感的能力,并能针对用户的情感做出智能、灵敏、友好反应的个人计算系统,缩短人机之间的距离,营造真正和谐的人机环境(图2)。 在生活中,人们很难保持一种僵硬的脸部表情,通过脸部表情来体现情感是人们常用的较自然的表现方式,其情感表现区域主要包括嘴、脸颊、眼睛、眉毛和前额等。人在表达情感时,只稍许改变一下面部的局部特征(譬如皱一下眉毛),便能反映一种心态。在1972年,著名的学者Ekman提出了脸部情感的表达方法(脸部运动编码系统FACS)。通过不同编码和运动单元的组合,即可以在脸部形成复杂的表情变化,譬如幸福、愤怒、悲伤等。该成果已经被大多数研究人员所接受,并被应用在人脸表情的自动识别与合成(图3)。

随着计算机技术的飞速发展,为了满足通信的需要,人们进一步将人脸识别和合成的工作融入到通信编码中。最典型的便是MPEG4 V2视觉标准,其中定义了3个重要的参数集:人脸定义参数、人脸内插变换和人脸动画参数。表情参数中具体数值的大小代表人激动的程度,可以组合多种表情以模拟混合表情。

在目前的人脸表情处理技术中,多侧重于对三维图像的更加细致的描述和建模。通常采用复杂的纹理和较细致的图形变换算法,达到生动的情感表达效果。在此基础上,不同的算法形成了不同水平的应用系统(图4,图5) 人的姿态一般伴随着交互过程而发生变化,它们表达着一些信息。例如手势的加强通常反映一种强调的心态,身体某一部位不停地摆动,则通常具有情绪紧张的倾向。相对于语音和人脸表情变化来说,姿态变化的规律性较难获取,但由于人的姿态变化会使表述更加生动,因而人们依然对其表示了强烈的关注。

科学家针对肢体运动,专门设计了一系列运动和身体信息捕获设备,例如运动捕获仪、数据手套、智能座椅等。国外一些著名的大学和跨国公司,例如麻省理工学院、IBM等则在这些设备的基础上构筑了智能空间。同时也有人将智能座椅应用于汽车的驾座上,用于动态监测驾驶人员的情绪状态,并提出适时警告。意大利的一些科学家还通过一系列的姿态分析,对办公室的工作人员进行情感自动分析,设计出更舒适的办公环境。 在人类的交互过程中,语音是人们最直接的交流通道,人们通过语音能够明显地感受到对方的情绪变化,例如通过特殊的语气词、语调发生变化等等。在人们通电话时,虽然彼此看不到,但能从语气中感觉到对方的情绪变化。例如同样一句话“你真行”,在运用不同语气时,可以使之成为一句赞赏的话,也可以使之成为讽刺或妒忌的话。

目前,国际上对情感语音的研究主要侧重于情感的声学特征的分析这一方面。一般来说,语音中的情感特征往往通过语音韵律的变化表现出来。例如,当一个人发怒的时候,讲话的速率会变快,音量会变大,音调会变高等,同时一些音素特征(共振峰、声道截面函数等)也能反映情感的变化。中国科学院自动化研究所模式识别国家重点实验室的专家们针对语言中的焦点现象,首先提出了情感焦点生成模型。这为语音合成中情感状态的自动预测提供了依据,结合高质量的声学模型,使得情感语音合成和识别率先达到了实际应用水平。 虽然人脸、姿态和语音等均能独立地表示一定的情感,但人在相互交流的过程中却总是通过上面信息的综合表现来进行的。所以,惟有实现多通道的人机界面,才是人与计算机最为自然的交互方式,它集自然语言、语音、手语、人脸、唇读、头势、体势等多种交流通道为一体,并对这些通道信息进行编码、压缩、集成和融合,集中处理图像、音频、视频、文本等多媒体信息。

目前,多模态技术本身也正在成为人机交互的研究热点,而情感计算融合多模态处理技术,则可以实现情感的多特征融合,能够有力地提高情感计算的研究深度,并促使出现高质量、更和谐的人机交互系统。

在多模态情感计算研究中,一个很重要的研究分支就是情感机器人和情感虚拟人的研究。美国麻省理工学院、日本东京科技大学、美国卡内基·梅隆大学均在此领域做出了较好的演示系统。目前中科院自动化所模式识别国家重点实验室已将情感处理融入到了他们已有的语音和人脸的多模态交互平台中,使其结合情感语音合成、人脸建模、视位模型等一系列前沿技术,构筑了栩栩如生的情感虚拟头像,并正在积极转向嵌入式平台和游戏平台等实际应用(图6)。 情感状态的识别和理解,则是赋予计算机理解情感并做出恰如其分反应的关键步骤。这个步骤通常包括从人的情感信息中提取用于识别的特征,例如从一张笑脸中辨别出眉毛等,接着让计算机学习这些特征以便日后能够准确地识别其情感。

为了使计算机更好地完成情感识别任务,科学家已经对人类的情感状态进行了合理而清晰的分类,提出了几类基本情感。目前,在情感识别和理解的方法上运用了模式识别、人工智能、语音和图像技术的大量研究成果。例如:在情感语音的声学分析的基础上,运用线性统计方法和神经网络模型,实现了基于语音的情感识别原型;通过对面部运动区域进行编码,采用HMM等不同模型,建立了面部情感特征的识别方法;通过对人姿态和运动的分析,探索肢体运动的情感类别等等。

不过,受到情感信息的捕获技术的影响,并缺乏大规模的情感数据资源,有关多特征融合的情感理解模型的研究还有待深入。随着未来的技术进展,还将提出更有效的机器学习机制。 情感计算与智能交互技术试图在人和计算机之间建立精确的自然交互方式,将会是计算技术向人类社会全面渗透的重要手段。未来随着技术的不断突破,情感计算的应用势在必行,其对未来日常生活的影响将是方方面面的,目前我们可以预见的有:

情感计算将有效地改变过去计算机呆板的交互服务,提高人机交互的亲切性和准确性。一个拥有情感能力的计算机,能够对人类的情感进行获取、分类、识别和响应,进而帮助使用者获得高效而又亲切的感觉,并有效减轻人们使用电脑的挫败感,甚至帮助人们便于理解自己和他人的情感世界。

它还能帮助我们增加使用设备的安全性(例如当采用此类技术的系统探测到司机精力不集中时可以及时改变车的状态和反应)、使经验人性化、使计算机作为媒介进行学习的功能达到最佳化,并从我们身上收集反馈信息。例如,一个研究项目在汽车中用电脑来测量驾车者感受到的压力水平,以帮助解决所谓驾驶者的“道路狂暴症”问题。

情感计算和相关研究还能够给涉及电子商务领域的企业带来实惠。已经有研究显示,不同的图像可以唤起人类不同的情感。例如,蛇、蜘蛛和枪的能引起恐惧,而有大量美元现金和金块的则可以使人产生非常强烈的积极反应。如果购物网站和股票交易网站在设计时研究和考虑这些因素的意义,将对客流量的上升产生非常积极的影响。

在信息家电和智能仪器中,增加自动感知人们的情绪状态的功能,可以提供更好的服务。

在信息检索应用中,通过情感分析的概念解析功能,可以提高智能信息检索的精度和效率。

在远程教育平台中,情感计算技术的应用能增加教学效果。

利用多模式的情感交互技术,可以构筑更贴近人们生活的智能空间或虚拟场景等等。

情感计算还能应用在机器人、智能玩具、游戏等相关产业中,以构筑更加拟人化的风格和更加逼真的场景。 由于缺乏较大规模的情感数据资源,情感计算的发展受到一定的限制,而且多局限在语音、身体语言等具体而零散的研究领域,仅仅依靠这些还难以准确地推断和生成一个人的情感状态,并进行有效的情感交互。目前,科学家们正在积极地探索多特征融合的情感计算理论模型。很多人认为,今后几年情感计算将在这些方面需要取得突破:

更加细致和准确的情感信息获取、描述及参数化建模。

多模态的情感识别、理解和表达(图像、语音、生理特征等)。

自然场景对生理和行为特征的影响。

更加适用的机器学习算法。

海量的情感数据资源库。 不久前,为了推动我国在这一领域的研究,探讨情感计算和智能交互技术的发展动态与趋势,促进我国科研人员在此领域的交流与合作,中国科学院自动化研究所、中国自动化学会、中国计算机学会、中国图象图形学会、中国中文信息学会、国家自然科学基金委员会和国家863计划计算机软硬件技术主题作为主办单位,在北京主办了第一届中国情感计算与智能交互学术会议。

事实证明,情感计算的概念尽管诞生不久,但已受到学术界和产业界的高度重视,相关领域的研究和应用正方兴未艾,国家自然科学基金委也将其列入重点项目的指南中。值得注意的是,近几年来,与情感计算有密切关系的普适计算和可穿戴式计算机的研究也已获得了蓬勃发展,并同样得到了国家的大力支持。这为情感信息的实时获取提供了极大的便利条件,也为情感计算在国内的发展提供了更好的发展平台。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/3983594.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-08-19
下一篇2023-08-19

发表评论

登录后才能评论

评论列表(0条)

    保存