情感分析器的研究方法

情感分析器的研究方法,第1张

监督学习

目前,基于监督学习的情感分析仍然是主流,除了(Li et al,2009)基于非负矩阵三分解(Non-negative Matrix Tri-factorization),(Abbasi et al,2008)基于遗传算法(Genetic Algorithm)的情感分析之外,使用的最多的监督学习算法是朴素贝叶斯,k最近邻(k-Nearest Neighbor,k-NN),最大熵和支持向量机的。而对于算法的改进主要在对文本的预处理阶段。

基于规则/无监督学习

和基于监督学习的情感分析相比,基于规则和无监督学习方面的研究不是很多。除了(Turney,2002)之外,(朱嫣岚 et al,2002)利用HowNet对中文词语语义的进行了情感倾向计算。(娄德成 et al,2006)利用句法结构和依存关系对中文句子语义进行了情感分析,(Hiroshi et al,2004)通过改造一个基于规则的机器翻译器实现日文短语级情感分析,(Zagibalov et al,2008)在(Turney,2002)的SO-PMI算法的基础上通过对于中文文本特征的深入分析以及引入迭代机制从而在很大程度上提高了无监督学习情感分析的准确率。

跨领域情感分析

跨领域情感分析在情感分析中是一个新兴的领域,目前在这方面的研究不是很多,主要原因是目前的研究还没有很好的解决如何寻找两个领域之间的一种映射关系,或者说如何寻找两个领域之间特征权值之间的平衡关系。对于跨领域情感分析的研究开始于(Blitzer et al,2007)将结构对应学习(Structural Correspondence Learning,SCL)引入跨领域情感分析,SCL是一种应用范围很广的跨领域文本分析算法,SCL的目的是将训练集上的特征尽量对应到测试集中。(Tan et al,2009)将SCL引入了中文跨领域情感分析中。(Tan2 et al,2009)提出将朴素贝叶斯和EM算法的一种半监督学习方法应用到了跨领域的情感分析中。(Wu et al,2009)将基于EM的思想将图排序(Graph Ranking)算法应用到跨领域的情感分析中,图排序算法可以认为是一种迭代的k-NN

情感分析的粒度是指定义情感极性的颗粒度大小,即从哪里开始分析情感。它可以分为句子级情感分析和实体级情感分析。

句子级情感分析是基于单个句子进行分析,通过分析文本中的每一个句子来确定该句子的情感倾向,进而判断整段文本的情感趋势,粒度相对较粗。

实体级情感分析是基于文本中的每一个实体进行情感分析,可以识别句子中对实体的情感色彩,例如对人物、组织、产品等进行情感评价。粒度相对较细。

不同的应用场景和需求,需要精细的情感分析,因此不同的应用和目标,其情感分析的粒度也应该有所区别和调整。

分析和研究人的情感是一个复杂的过程,需要结合多个因素和方法。以下是一些常见的方法和技巧:

观察非语言表达:情感通常通过非语言表达来展示,包括面部表情、姿势、手势、眼神等。观察这些非语言信号可以提供关于一个人情感状态的线索。

倾听和观察语言表达:人们在语言中常常流露出情感,包括词语的选择、语调、语速等。倾听和观察一个人的语言表达可以帮助你了解他们的情感体验。

提问和探索:与他人进行深入的对话,提出开放性的问题,探索他们的情感体验和内心感受。通过主动与他人交流,你可以更好地了解他们的情感世界。

了解背景和经历:一个人的情感体验通常受到他们的背景和经历的影响。了解一个人的背景故事、家庭环境、教育背景等,可以提供更多的背景信息来理解他们的情感。

使用情感分析工具:一些科学研究和心理学领域的专业人士使用情感分析工具来研究和测量情感。这些工具可能包括问卷调查、心理测量仪器、脑部扫描等,通过客观的数据来分析和研究情感。

学习心理学和情感科学知识:深入学习心理学和情感科学领域的知识可以提供更多的理论框架和研究成果,帮助你理解情感的本质和影响因素。

需要注意的是,分析和研究他人的情感是一项复杂的任务,需要综合考虑多个因素,并且要尊重他人的隐私和个人边界。在进行情感分析时,保持尊重、开放和理解的态度非常重要。

了解用户情感需求

差异化战略,与他人拉开差距

加强情感营销

情感营销:挖掘用户内心真实情感,了解其内在需求,以便对症下药,设计出用户满意的产品和迎合用户心意的营销方案

情感需求分析就是通过各种方法和手段捕捉用户内心情感方面的信息,并对此进行深度分析,得出用户个人情感差异和内在需求的insight,并以此作为“绘制”产品用户画像的核心,最后借助于这些有价值的用户情感洞察,企业可以进行产品的情感包装、情感促销、情感广告、情感口碑、情感设计等策略,实现产品的各项经营目标。

情感需求分析就是通过各种方法和手段捕捉用户内心情感方面的信息,并对此进行深度分析,得出用户个人情感差异和内在需求的insight,并以此作为“绘制”产品用户画像的核心,最后借助于这些有价值的用户情感洞察,企业可以进行产品的情感包装、情感促销、情感广告、情感口碑、情感设计等策略,实现产品的各项经营目标。

案例

《陈思成:北京爱情故事之后,是上海3p故事》

文章带着一股怒气,替被出轨的女生出气,行为具有感染力,容易引发共鸣,引起好感。

《你永远也叫不醒一个想犯贱的人》

例举案例,得出结论,说明每个人都有跳火坑的权利,看似在骂人,却有一种恨铁不成钢的感觉,感觉朋友在劝你,劝不动容易引起好感。身在迷局中的人会在这一刻感觉咪蒙就是知心的姐姐。

咪蒙的文章非常具有煽动性,唤起用户的情绪,喜欢咪蒙的用户会认为咪蒙是真性情,不喜欢的用户会认为利己,煽动打动的情绪。会把用户的主人公定义为直男癌,low逼等,用户会产生情感的认同

怎么做情感分析?

心理投射的分析方法

投射在心理学上指的是个人思想态度愿望情绪,性格等个体特征不自觉的反应与外界事物和他人的一种心理作用。由于投射的存在,可以从一个人对别人的看法以及自身的兴趣爱好来推测这个人真正的意图或心理特征。

投射的心理过程是无意识运行的结果,对于投射者来说,这个心理过程的发生是毫无觉知和悄无声息的。个体在选择、关注或喜好某事物时,常常不自觉地将隐藏在内心的冲突和欲望融入这些事物中,借助于事物带将其宣泄出来,即把个人的内心世界投射于所参与的事物中。而我们通过对他们的选择、关注或喜好的事物(标签)的分析,从而了解其内心真正的需求。

观察人的思想愿望等,分析出心理特征

为什么要掌握这一项技能?

因为只有知道用户的心理特征,才能用最有效的方式去打动,让粉丝喜欢并支持。

案例:正确投射的例子有王老吉。怕上火喝王老吉。成功男士一年要逛两次海澜之家。买房是为了搞定丈母娘。

心理投射在商业场景中的应用

在无声场景有一句话移动互联网技术正深度影响今天主流的思维。

行为模式和生活方式,小米,苹果等既是一种圈层标签也是在表达自我的态度,微信朋友圈发布一条信息会泄露手机屏幕。同样起到作用的有智能屏幕,游戏电视、iPhone都是我们理解世界的方式。

需要用户的兴趣图幅,使用场景的同时,深入挖掘他们内心的情感需求,以此为依据,为其量身定制设计产品和营销方案,由此由内而外的打动用户。

Censydiam用户动机分析模型

两个维度:自我适应和释放压抑

心理投射是一种分析用户内心情感内在需求的方法论。实现用户情感分析需要将外在的标签转化为更加有价值的用户情感洞察,需要心理工具营销界广泛的一种模型。

自我适应维度表明人们在处理个体与社会关系的态度;释放压力维度体现出个体在对抗自卑情节时的态度

在面临需求问题和解决策略时,归属群体和做独立的自我之间进行权衡,二者经常是此消彼长的关系。

垂直维度:描述的是人们作为个体存在面临需求问题使的解决策略。

遇到一个问题两种选择:一种释放,大胆追求。一种是压制克制自己的欲望,将自己的欲望,泯灭在人性当中。

· 释放内心欲望,积极享受

· 回归内心理性,克制欲望

· 表达成功自我,渴望赞美

· 寻找群体归属,从众和谐

人性特征:享乐释放:一个追求自我释放和享乐的人,会无所顾忌,会在生理上和心理上去最大限度的满足自己的需求和欲望。(晚上推个夜宵)

理性控制:一个极力克制自我情感需求和内心欲望的人,会缺乏激情,甚至是循规蹈矩,没有个人的生活主张。

能力地位:当一个人的行为主要由“能力/地位”支配时,他会由内而外的确认自己的成功,追求内在的从容和坚定,追求外化的绫罗绸缎和锦衣玉食。同时,ta也渴望得到他人的赞美,希望在社会中有属于自己的一席之地。

顺从归属:当一个人的行为主要由“顺从/归属”来主导的时候,ta会希望自己成为某个群体的一份子,渴望从群体中获得支持,加强自己的力量。同时,ta也会尽力去遵守群体中的规则,不会独立特行,剑走偏锋。

两辆象限有交集,催生新的4个象限

活力/探索:就如大科学家牛顿所说,“真理的大海,让未发现的一切事物躺卧在我的眼前,任我去探寻”,拥有活力/探索这一特质的人对这个世界充满了好奇,他们渴望从未知的世界中汲取新的情感,不断冲破自己的极限,挑战自我,获得激情、冒险和速度所带来的快感。

融合/沟通:处在这一象限中的人们,总是愿意融入集体,与大家进行开放式的沟通,分享自己的欢愉与快乐,“感情和睦,没有隔阂”是其他人与他们相处时的感受。

舒适/安全:处在这一象限中的人们,总是希望获得内心的平静、放松与安宁,希望自己被呵护、被关怀,很多时候会,他们会通过捕捉如烟往事中的美好时光而得到慰藉。

个性/独特: 处于这一象限的人们,在保持理性的情况下,极力想获得他人的注意,想凸显自己的与众不同,万众瞩目能带给他们极强的的优越感,但要注意的是,这点和“能力/地位”不尽相同,渴望获得“个性/独特”的人们并不会表现出较强的“侵略性”,不会有强势和控制倾向。

建立模型,了解用户类型,把用户画像往里套

用户画像:爱旅游 美食 IT数码 美女 娱乐 幽默搞笑 体育 明星 音乐 90后

怎么用维度描述用户的情感分析?

制表分析图:

最想了解:放行个体独特型以及活力型

针对三种类型的用户进行针对性策略

享乐释放:一个追求自我释放和享乐的人,会无所顾忌,会在生理上和心理上去最大限度的满足自己的需求和欲望。

活力/探索:就如大科学家牛顿所说,“真理的大海,让未发现的一切事物躺卧在我的眼前,任我去探寻”,拥有活力/探索这一特质的人对这个世界充满了好奇,他们渴望从未知的世界中汲取新的情感,不断冲破自己的极限,挑战自我,获得激情、冒险和速度所带来的快感。

个性/独特: 处于这一象限的人们,在保持理性的情况下,极力想获得他人的注意,想凸显自己的与众不同,万众瞩目能带给他们极强的的优越感,但要注意的是,这点和“能力/地位”不尽相同,渴望获得“个性/独特”的人们并不会表现出较强的“侵略性”,不会有强势和控制倾向。

(90后身份标签)群体特点,带入模型,得出结论。

针对群体,运营战略。

针对父母,可以推出托儿服务。

个性独特:差异性战略

关键是战术和战略要匹配。

产品角度上来说范围成本时间缺一质量就会受到影响。

(以上改编自运营社读书会10 了不起薛定谔)

文学|编辑

情感分析自从2002年由Bo Pang提出之后,获得了很大程度的研究的,特别是在在线评论的情感倾向性分析上获得了很大的发展,目前基于在线评论文本的情感倾向性分析的准确率最高能达到90%以上,但是由于深层情感分析必然涉及到语义的分析,以及文本中情感转移现象的经常出现,所以基于深层语义的情感分析以及篇章级的情感分析进展一直不是很大。情感分析还存在的一个问题是尚未存在一个标准的情感测试语料库,虽然Bo Pang实验用的**评论数据集以及Theresa Wilson等建立的MPQA是目前广泛使用的两类情感分析数据集,但是并没有公认的标准加以确认。

目前研究主要集中于情感词的正面负面分类,标注语料,情感词的提取等。

以下以语义特征为例:

机器学习基于语义特征的情感分析

基于语义特征的情感分析先人已有研究,可以通过情感词典匹配来做,但是应用机器学习在这方面会使精确度更高些。 

以本人参与的一个项目为主,总结下相关技术点。 

背景是:分析用户评论感情色彩是积极还是消极,即是褒还是贬。

具体步骤为: 

1有监督的人工给文本标注类标签。如有5000条评论数据,我们给其中的1000条标为积极的,再选1000条标为消极的,积极和消极就是所谓的类标签。 

2选择特征。从积极的评论数据中按词来选择积极的所有特征。同理,从消极的评论数据中按词来选择消极的所有特征。如“这款游戏非常好玩”->”这款”->“游戏”->”非常”->”好玩”,分为四个特征词,也可以采用双词搭配,“这个游戏”和“非常好玩”作为特征。 

3特征降维,减少特征的数量。如上“这个游戏非常好玩”中的“这个游戏”没有必要作为特征,因为“好玩”或“非常好玩”已经决定了评论是积极的。 

4将语料文本变成使用特征表示。 

5统计所有特征出现的次数,并按倒序排序。 

6从以上结果中选出排序最靠前的一些特征作为最终的评判特征。 

7使用训练数据根据特征训练分类算法,得到分类器。 

8用测试数据检测分类器的准确度。 

我们将数据分为两部分:开发集、测试集。用开发集的数据训练分类算法得到分类器;再用分类器对测试集里的数据进行分类,给出分类预测得到的标签;对比分类标签和人工标注得到的标签的差异,计算出准确度。

有两大类,一类是主观性:主观、客观、中性;一类是情感倾向:褒义、贬义、中性。

文本分析的话,主要是对词、句子中观点的挖掘。你所说的机器学习法,现在基本用于对**观点的打分系统吧。基本上就是利用分类计数,对文档中存在的情感进行分类的。

就我个人理解而言,我认为机器学习法只是情感文本分析的方法论之一,至于数据挖掘,也是通过对文档的数据收取,进行情感分析的。也是对情感文本分析的方法论之一。

所以,情感分析是主体的话,文本分类、机器学习、数据挖掘都是方式方法。这些方法可以共同应用在一个情感分析中,也可以分别独立存在。目前英文类的文本情感分析比较多,中文类的相对少一点,你要做这方面的研究路漫漫其修远啊。嘿嘿。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/7965400.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-09-07
下一篇2023-09-07

发表评论

登录后才能评论

评论列表(0条)

    保存