基于机器学习的情感分析是什么意思

基于机器学习的情感分析是什么意思,第1张

以下以语义特征为例:

机器学习基于语义特征的情感分析

基于语义特征的情感分析先人已有研究,可以通过情感词典匹配来做,但是应用机器学习在这方面会使精确度更高些。 

以本人参与的一个项目为主,总结下相关技术点。 

背景是:分析用户评论感情色彩是积极还是消极,即是褒还是贬。

具体步骤为: 

1有监督的人工给文本标注类标签。如有5000条评论数据,我们给其中的1000条标为积极的,再选1000条标为消极的,积极和消极就是所谓的类标签。 

2选择特征。从积极的评论数据中按词来选择积极的所有特征。同理,从消极的评论数据中按词来选择消极的所有特征。如“这款游戏非常好玩”->”这款”->“游戏”->”非常”->”好玩”,分为四个特征词,也可以采用双词搭配,“这个游戏”和“非常好玩”作为特征。 

3特征降维,减少特征的数量。如上“这个游戏非常好玩”中的“这个游戏”没有必要作为特征,因为“好玩”或“非常好玩”已经决定了评论是积极的。 

4将语料文本变成使用特征表示。 

5统计所有特征出现的次数,并按倒序排序。 

6从以上结果中选出排序最靠前的一些特征作为最终的评判特征。 

7使用训练数据根据特征训练分类算法,得到分类器。 

8用测试数据检测分类器的准确度。 

我们将数据分为两部分:开发集、测试集。用开发集的数据训练分类算法得到分类器;再用分类器对测试集里的数据进行分类,给出分类预测得到的标签;对比分类标签和人工标注得到的标签的差异,计算出准确度。

这是计算机世界的一个尚未开发的前沿:将各种人类情感转化成实实在在的数据。

起源

虽然之前也有一些相关工作,但目前公认的情感分析比较系统的研究工作开始于(Pang et al, 2002)基于监督学习(supervised learning)方法对**评论文本进行情感倾向性分类和(Turney,2002)基于无监督学习(unsupervised learning)对文本情感情感倾向性分类的研究。Pang et al, 2002)基于文本的N元语法(ngram)和词类(POS)等特征分别使用朴素贝叶斯(Naive Bayes),最大熵(Maximum Entropy)和支持向量机(Support Vector Machine,SVM)将文本情感倾向性分为正向和负向两类,将文本的情感进行二元划分的做法也一直沿用至今。同时他们在实验中使用**评论数据集目前已成为广泛使用的情感分析的测试集。(Turney ,2002)基于点互信息(Pointwise Mutual Information,PMI)计算文本中抽取的关键词和种子词(excellent,poor)的相似度来对文本的情感倾向性进行判别(SO-PMI算法)。在此之后的大部分都是基于(Pang et al, 2002)的研究。而相对来说,(Turney et al,2002)提出的无监督学习的方法虽然在实现上更加简单,但是由于单词之间的情感相似度难以准确的计算和种子词的难以确定,继续在无监督学习方向的研究并不是很多的,但是利用SO-PMI算法计算文本情感倾向性的思想却被很多研究者所继承了

1、数据预处理:将原始文本数据进行清洗、分词、去除停用词等预处理操作,得到文本的词袋表示。

2、特征提取:对于每个属性,从词袋中提取出与该属性相关的特征词,例如“价格”、“质量”等。

3、聚类或主题建模:使用聚类或主题建模方法对文本进行无监督学习,将文本按照不同的主题或簇进行分组,从而实现属性级分类,对于聚类方法,可以使用K-means、DBSCAN等算法。对于主题模型,可以使用LDA等算法。

4、情感分析:对于每个属性,计算该属性下文本的情感得分,可以使用情感词典或者情感分类器等方法进行情感分析。

情感分析是自然语言处理中的一个重要应用,它旨在通过分析文本的情感倾向来了解人们对某个主题或事件的情感态度。在干中文分词应用中,情感分析通常是通过对文本进行分词、词性标注、实体识别等处理后,再应用机器学习或深度学习等技术来判断文本的情感倾向。因此,情感分析可以被视为语句关系判断的一种应用,它能够帮助我们更好地理解人们对某个主题或事件的态度和情感倾向,进而为企业、政府等组织提供更加精准的决策支持。

情绪的主要分类

人类有几百种情绪,此外还有很多混合、变种、突变以及具有细微差异的“近亲”。

情绪的微妙之处已经大大超越了人类语言能够形容的范围。情绪不可能被完全消灭,但可以进行有效疏导、有效管理、适度控制。

情绪无好坏之分,一般只划分为积极情绪、消极情绪。由情绪引发的行为则有好坏之分、行为的后果有好坏之分,所以说,情绪管理并非是消灭情绪,也没有必要消灭,而是疏导情绪、并合理化之后的信念与行为。

按照情绪状态可将情绪分为心境、 和应激三种。情绪状态划分来源于情绪维度理论,情绪的维度是指情绪所固有的某些特征,主要指情绪的动力性、激动性、强度和紧张度等方面。

这些特征的变化又具有两极性。冯特提出的三维理论认为:情绪是由三个维度组成的,即愉快-不愉快;激动-平静;紧张-松弛。

每一种具体情绪分布在三个维度的两极之间不同的位置上。他的这种看法为情绪的维度理论奠定了基础。

20世纪50年代,施洛伯格根据面部表情的研究提出,情绪的维度有愉快-不愉快;注意-拒绝和激活水平三个维度,建立了一个三维模式图, 其三维模式图长轴为快乐维度,短轴为注意维度,垂直于椭圆面的轴则是激活水平的强度维度,三个不同水平的整合可以得到各种情绪。60年代末,普拉切克提出,情绪具有强度、相似性和两极性等三个维度,并用一个倒锥体来说明三个维度之间的关系。

顶部是八种最强烈的基本情绪:悲痛、恐惧、惊奇、接受、狂喜、狂怒、警惕、憎恨,每一类情绪中都有一些性质相似、强度依次递减的情绪,如厌恶、厌烦,哀伤、忧郁。美国心理学家伊扎德提出情绪四维理论。

认为情绪有愉快度、紧张度、激动度、确信度等四个维度。黄希庭认为若撇开情绪所指的具体对象,仅就情绪体验的性质来看,可从以下四方面进行分析: 强度、紧张度、 度、复杂度。

按照情绪发生的速度、强度和持续时间对情绪的划分可将情绪分类心境、 和应激三种:(1) 心境。心境是一种微弱、弥散和持久的情绪 , 也即平时说的心情。

心境的好坏 , 常常是由某个具体而直接的原因造成的 , 它所带来的愉快或不愉快会保持一个较长的时段 , 并且把这种情绪带入工作、学习和生活中 , 影响人的感知、思维和记忆。 愉快的心境让人精神抖擞 , 感知敏锐 , 思维活跃 , 待人宽容 ; 而不 愉快的心境让人萎靡不振 ,, 感知和思维麻木 , 多疑,看到的、听到 的全都是不如意、不顺心的事物。

(2) 。 是一种猛烈、迅疾和短暂的情绪 , 类似于平时说的激动。

是由某个事件或原因引起的当场发作 , 情绪表现猛烈,但持续的时间不长 , 并且牵涉的面不广。 通过激 烈的言语爆发出来 , 是一种心理能量的宣泄 , 从一个较长的时段来看 , 对人的身心健康的平衡有益 , 但过激的情绪也会使当时的失衡产生可能的危险。

特别是当 表现为惊恐、狂怒而又爆发不出来的时候 , 全身发抖、手脚冰凉、小便失禁、浑身瘫软 , 那就得赶快送医院了。(3) 应激。

应激是机体在各种内外环境因素及社会、心理因素 时所出现的全身性非特异性适应反应,又称为应激反应。这些 因素称为应激原。

应激是在出乎意料的紧迫与危险情况下引起的高速而高度紧张的情绪状态。应激的最直接表现即精神紧张。

指各种过强的不良 ,以及对它们的生理、心理反应的总和。应激反应指所有对生物系统导致损耗的非特异性生理、心理反应的总和。

应激或应激反应是指机体在受到各种强烈因素(应激原) 时所出现的非特异性全身反应。 早期理论『詹姆斯-兰格理论』 美国心理学家詹姆斯和丹麦生理学家兰格分别提出内容相同的一种情绪理论。

他们强调情绪的产生是植物性神经活动的产物。后人称它为情绪的外周理论。

即情绪 引起身体的生理反应,而生理反应进一步导致情绪体验的产生。詹姆斯提出情绪是对身体变化的知觉。

在他看来,是先有机体的生理变化,而后才有情绪。所以悲伤由哭泣引起,恐惧由战栗引起;兰格认为情绪是内脏活动的结果。

他特别强调情绪与血管变化的关系。詹姆斯-兰格理论看到了情绪与机体变化的直接关系,强调了植物性神经系统在情绪产生中的作用;但是,他们片面强调植物性神经系统的作用,忽视了中枢神经系统的调节、控制作用,因而引起了很多的争议。

『坎农-巴德学说』 认为情绪的中枢不在外周神经系统,而在中枢神经系统的丘脑,并且强调大脑对丘脑抑制的解除,使植物性神经活跃起来,加强身体生理的反应,而产生情绪。外界 引起感觉器官的神经冲动,传至丘脑,再由丘脑同时向大脑和植物性神经系统发出神经冲动,从而在大脑产生情绪的主观体验而由植物性神经系统产生个体的生理变化。

该理论认为,激 绪的 由丘脑进行加工,同时把信息输送到大脑和机体的其他部位,到达大脑皮层的信息产生情绪体验,而到达内脏和骨骼肌肉的信息激活生理反应,因此,身体变化与情绪体验同时发生。『巴甫洛夫的动力定型理论』该理论认为,人们在大脑皮层中执照 物的顺序形成了比较稳固的暂时神经联系系统,这种系统叫做动力定型,是人学习、习惯和需要的。

情绪的基本分类有哪些

七情:

喜:包括喜爱、喜悦、喜好、喜欢、高兴、快乐等情感;

怒:包括愤怒、恼怒、发怒、怨恨、愤恨等情感;

哀:包括悲伤、悲痛、悲哀、怜悯、哀怜、哀愁、哀悯、哀怨、哀思等情感;

乐:指欢乐,身心愉悦,充满幸福的一种情感;

惊:指惊咤、惊愕、惊慌、惊悸、惊奇、惊叹、惊喜、惊讶等情感;

恐:指恐慌、恐惧、害怕、担心、担忧、畏惧等情感;

思:指思念、想念、思慕等情感。

六欲:

食欲:生理本能由于饥饿而产生的想吃东西的欲望加社会环境影响而产生的想吃好、吃多、吃巧、吃奇、吃美的欲望;

:生理由于发育成熟而本能生的一种想与异性触摸接触、发泄能量的欲望加社会环境影响而产生的想猎奇探幽、排遣郁闷寂寞、甚至为了达到某个数目而想往异性的欲望;

情欲:七情导致的欲望。比如喜欢就能导致想与某人朝夕相处交朋友的欲望;愤怒可导致想打击报复的欲望;悲伤可导致自虐、自杀的欲望;惊奇可导致探险的欲望;恐惧害怕可导致求安全的欲望,如装防盗门、找靠山、请保安、结婚生子女等;思念可导致想回家、想重逢的欲望。

占有欲:本能地为扩充活动范围、排除干扰、争取而产生的想据为己有的欲望,如殖民地、私有财产、夫妻等是占有欲导致的一种结果;

求知欲:好奇心引发的对未知领域和未知世界向往探索、想弄清究竟的一种欲望;

出类拔萃欲:这是想得到社会承认的欲望。人人都不愿默默无闻,不愿被社会遗忘在某个角落,人人都想出类拔萃、与众不同、出人头地,都希望能得到他人的尊重、称赞、羡慕。于是就有了出类拔萃欲。

关于情感分析文本相似性和语句推断等都属于常见中文分词应用中的语句关系判断回答如下:

情感分析,文本相似性和语句推断等都属于常见中文分词应用中的语句关系判断如下情感分析、文本相似性和语句推断都是中文自然语言处理中的常见任务,需要进行语句关系判断。

其中,分词是中文自然语言处理中的基础步骤,可以将句子切分成有意义的词语,为后续任务提供基础。

在情感分析任务中,需要对文本的情感进行分类,通常采用机器学习算法,对文本进行特征提取和分类。文本相似性任务是指比较两个文本之间的相似度,通常采用词向量模型进行特征提取和相似度计算。

语句推断任务是指给定前提和假设,判断假设是否可以从前提中推出,通常需要进行逻辑推理和语义理解。这些任务都需要进行语句关系判断,对中文自然语言处理具有重要意义。

资料扩展:

情感分析是指通过文本来挖掘人们对于产品、服务、组织、个人、事件等的观点、情感倾向、态度等。情感分析是随着互联网发展而产生的,早期主要用于对网上销售商品的用户评语的分析,

以便判断用户对其所购商品是“喜欢”还是“不喜欢”。后期随着自媒体的流行,情感分析技术更多地用于识别话题发起者、参与者的情感趋向,

从中判断或挖掘话题中的价值,由此来分析相关舆情。情感分析的应用十分广泛,其研究领域涉及自然语言处理、信息检索、机器学习、人工智能等。

领域依赖是指文本情感分析的模型对某一领域的文本数据非常有效,但是将其应用于其他领域的时候,会使得分类模型的性能严重下降。

情绪的分类如下:

1、高兴

这种情绪很常见,代表着一种开心,比如说发工资了,会使人散发出高兴的情绪,而这种情绪是不需要控制的,这种情绪有利于人的身体健康,还会影响别人变得开心。

2、惊奇

这个情绪常常表现得很意外,所发生的事情在自己的意料之外,当事情发生时,当事人就会出现惊奇的情绪,这种情绪没有持久性,随着事情的进展,自己会渐渐的消散。

比如周末的时候,你明明没有买东西,听到敲门声并且去开门,却看见快递员给你送快递,第一反应肯定是我没有买东西,谁的东西呢?

3、轻蔑

轻蔑的态度可以是针对一个人,也可以是针对一件事,针对一个人的时候,往往是觉得对方不如自己,展现出那种不可一世的情绪,对一件事的时候,往往这件事的难度不大。

对自己来说小菜一碟,所以显露出轻蔑的情绪,但是不论是针对人还是事,轻蔑这种情绪还是要避免,因为我们每时每刻要保持谦虚的态度。

4、厌恶

厌恶也是可以针对一个人或者一件事,对于事物就是对于一个东西比较讨厌,会产生呕吐的现象或者是不喜欢的情绪,对于一个人,形象一点就是比如一个人做了一件错事,但是自己没有意识到。

还在那一直嘚瑟,那么当时从内心是看不起这个人的,那么内心就会产生厌恶的情绪,我想生活中有很多这种容易引起不适的人物,但是人要学会宽容,客观地看待事物,切莫带有主观情绪。

5、愤怒

这个情绪就需要控制,大多是因为一件事或者是一个人生气,会让人产生不舒服的感觉,伴随着这种感觉会出现愤怒的情绪,比如和一个人因为一件事吵架了。

这个时候是最容易产生愤怒情绪的时候,但是这种情绪需要当事人控制,否则不仅影响个人心情还会影响个人健康,通常需要冷静对待。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/732051.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-08
下一篇2023-07-08

发表评论

登录后才能评论

评论列表(0条)

    保存