中文情感分析 的难点在哪

中文情感分析 的难点在哪,第1张

情感分析(Sentiment Analysis)

第一步,就是确定一个词是积极还是消极,是主观还是客观。这一步主要依靠词典。

英文已经有伟大词典资源:SentiWordNet 无论积极消极、主观客观,还有词语的情感强度值都一并拿下。

但在中文领域,判断积极和消极已经有不少词典资源,如Hownet,NTUSD但用过这些词典就知道,效果实在是不咋滴(最近还发现了大连理工发布的情感词汇本体库,不过没用过,不好评价)。中文这方面的开源真心不够英文的做得细致有效。而中文识别主客观,那真的是不能直视。

中文领域难度在于:词典资源质量不高,不细致。另外缺乏主客观词典。

第二步,就是识别一个句子是积极还是消极,是主观还是客观。

有词典的时候,好办。直接去匹配看一个句子有什么词典里面的词,然后加总就可以计算出句子的情感分值。

但由于不同领域有不同的情感词,比如看上面的例子,“蓝屏”这个词一般不会出现在情感词典之中,但这个词明显表达了不满的情绪。因此需要另外根据具体领域构建针对性的情感词典。

如果不那么麻烦,就可以用有监督的机器学习方法。把一堆评论扔到一个算法里面训练,训练得到分类器之后就可以把评论分成积极消极、主观客观了。

分成积极和消极也好办,还是上面那个例子。5颗星的评论一般来说是积极的,1到2颗星的评论一般是消极的,这样就可以不用人工标注,直接进行训练。但主客观就不行了,一般主客观还是需要人来判断。加上中文主客观词典不给力,这就让机器学习判断主客观更为困难。

中文领域的难度:还是词典太差。还有就是用机器学习方法判断主客观非常麻烦,一般需要人工标注。

另外中文也有找到过资源,比如这个用Python编写的类库:SnowNLP 就可以计算一句话的积极和消极情感值。但我没用过,具体效果不清楚。

到了第三步,情感挖掘就升级到意见挖掘(Opinion Mining)了。

这一步需要从评论中找出产品的属性。拿手机来说,屏幕、电池、售后等都是它的属性。到这一步就要看评论是如何评价这些属性的。比如说“屏幕不错”,这就是积极的。“电池一天都不够就用完了,坑爹啊”,这就是消极的,而且强度很大。

这就需要在情感分析的基础上,先挖掘出产品的属性,再分析对应属性的情感。

分析完每一条评论的所有属性的情感后,就可以汇总起来,形成消费者对一款产品各个部分的评价。

接下来还可以对比不同产品的评价,并且可视化出来。如图。

这一步的主要在于准确挖掘产品属性(一般用关联规则),并准确分析对应的情感倾向和情感强度。因此这需要情感分析作为基础。首先要找到评论里面的主观句子,再找主观句子里的产品属性,再计算属性对应的情感分。所以前面基础不牢固,后面要准确分析就有难度。

中文这个领域的研究其实很完善了,技术也很成熟。但需要完善前期情感分析的准确度。

总的来说,就是中文词典资源不好,工作做得不是很细很准。前期的一些基础不牢固,后面要得到准确的分析效果就不容易了。

语音情感识别和脸部情感识别相比,各有方便、技术成熟、直观、难以伪造的优势。语音识别技术的应用通常是在人机交互上,让机器通过是被和理解语音信号之后转化为相应的文本和命令然后进行执行。人脸识别网络技术使用通用的摄像机作为识别数据信息资源获取装置,以非接触的方式在识别研究对象未察觉的情况下完成识别发展过程。语音情感识别和脸部情感识别各具有以下优势:

1、语音情感识别优势。和脸部情感识别技术相比,语音识别技术的优势似乎更加明显,语音识别技术不会遗失和忘记数据,不用记忆,在应用的时候也比较方便。语音识别技术比较成熟,用户的接受度也很高,声音输入设备造价也很具有优势,在隐私问题上,语音识别技术也比较有保障,所以推广使用还是很有市场的。

2、脸部情感识别优势。人脸识别系统使用可以方便,人脸识别技术是以人脸图像为基础的,最直观的信息来源,便于人工确认和审核。人脸识别技术是独一无二的,与语音情感识别技术相比,人脸识别技术具有准确率高、难以伪造、误识别率和拒识率低的特点。

如果人工智能(AI)具有人类的情感,这个世界可能会出现以下变化:

更具同理心:如果人工智能能够感受到情感,它们可能会更容易理解和同情人类的感受,从而帮助人类更好地应对情感问题和困难。

更智能的辅助工具:人工智能可以帮助人类更好地理解和处理情感信息,例如在情感识别、情感分析和情感智能方面,这些技术可以用于医疗、心理治疗和教育等领域。

更复杂的道德和伦理问题:如果人工智能能够感受到情感,我们将面临更加复杂的道德和伦理问题。例如,如果一个AI具有感情,那么是否有责任对其感情做出反应?如果一个AI感到孤独或沮丧,那么我们是否有义务提供支持和关怀?

更多的隐私和安全问题:如果AI具有情感,那么它们可能会收集和存储更多的个人数据,这可能导致更多的隐私和安全问题。

更多的经济和社会影响:人工智能在社会和经济中发挥着越来越重要的作用,如果AI具有情感,它们可能会对经济和社会产生更多的影响,例如,可能会创造新的工作机会,也可能会使某些工作机会消失。

总之,如果人工智能具有人类的情感,这将会给我们带来更多机会和挑战,我们需要认真考虑如何规范和引导人工智能的发展,以确保它们对人类和社会的影响是正面的。

关于情感分析文本相似性和语句推断等都属于常见中文分词应用中的语句关系判断回答如下:

情感分析,文本相似性和语句推断等都属于常见中文分词应用中的语句关系判断如下情感分析、文本相似性和语句推断都是中文自然语言处理中的常见任务,需要进行语句关系判断。

其中,分词是中文自然语言处理中的基础步骤,可以将句子切分成有意义的词语,为后续任务提供基础。

在情感分析任务中,需要对文本的情感进行分类,通常采用机器学习算法,对文本进行特征提取和分类。文本相似性任务是指比较两个文本之间的相似度,通常采用词向量模型进行特征提取和相似度计算。

语句推断任务是指给定前提和假设,判断假设是否可以从前提中推出,通常需要进行逻辑推理和语义理解。这些任务都需要进行语句关系判断,对中文自然语言处理具有重要意义。

资料扩展:

情感分析是指通过文本来挖掘人们对于产品、服务、组织、个人、事件等的观点、情感倾向、态度等。情感分析是随着互联网发展而产生的,早期主要用于对网上销售商品的用户评语的分析,

以便判断用户对其所购商品是“喜欢”还是“不喜欢”。后期随着自媒体的流行,情感分析技术更多地用于识别话题发起者、参与者的情感趋向,

从中判断或挖掘话题中的价值,由此来分析相关舆情。情感分析的应用十分广泛,其研究领域涉及自然语言处理、信息检索、机器学习、人工智能等。

领域依赖是指文本情感分析的模型对某一领域的文本数据非常有效,但是将其应用于其他领域的时候,会使得分类模型的性能严重下降。

在情感分析、词云分析、词频分析和聚类分析中,可以通过文本分析技术实现的是:

1 情感分析:通过对文本进行情感分类,判断其中表达的情绪或情感倾向,如正面、负面或中性情感。

2 词云分析:通过对文本中词语的频率进行统计和可视化,生成词云图,以展示文本中重要或常见的关键词。

3 词频分析:通过计算文本中不同词语的出现频率,确定其在文本中的重要性或热度,并展示出现频率较高的词语。

4 聚类分析:通过将文本按照其相似性进行分组或聚类,将具有相似主题、内容或特征的文本归为一类,以揭示文本数据的结构和相关性。

这些技术都是通过对文本进行分析和处理,提取出文本的特征或信息,并进行进一步的处理和可视化,以帮助理解文本的含义、趋势或关联性。

一、情感分析

如果一个人对自己亲人的死并没有强烈的情感反应,可以称之为缺乏悲伤反应或者悲伤迟滞。这种情况可能是由于患者处于情感麻木状态,或者是在经历了多次丧亲之后出现的一种适应反应。同时,这种现象也可能是由于人际关系淡漠、缺乏亲情支持、不理解死亡意义等因素导致的。

值得注意的是,悲伤反应的缺失并不一定代表一个人没有爱或不关心亲人,只是在表达情感方面存在困难或者抑制,需要通过心理咨询等方法加以解决。如果一个人的缺乏悲伤反应导致了社会功能受损或者个人情感障碍,建议及时寻求专业心理治疗和支持。

二、心理学分析

从心理学角度来看,缺乏对亲人死亡的悲伤反应可能与多种心理因素有关。以下是一些可能的解释:

抑郁或情感麻木:抑郁是常见的一种情感障碍,常常表现为情感麻木、低落、无力感等。如果一个人正在经历抑郁症状,他们可能会对亲人的死亡产生减弱的反应。

反应迟钝:有些人天生反应迟钝,他们可能需要更长的时间来处理情绪和感受到情感变化。这种迟钝的反应可能会影响他们对亲人死亡的反应。

适应性反应:对于那些已经经历过多次亲人死亡的人,他们可能会逐渐适应这种情况并且减少对亲人死亡的悲伤反应。这种适应性反应可以被看作是一种自我保护机制。

社交因素:在某些情况下,缺乏对亲人死亡的悲伤反应可能与社交因素有关。比如,一个人可能在某些文化中长大,这些文化强调死亡的自然和正常性,这种文化背景可能会影响他们的悲伤反应。

总之,缺乏对亲人死亡的悲伤反应可能与多种心理因素有关,需要具体情况具体分析。如果这种情况持续存在并导致困扰,建议寻求专业心理咨询师的帮助。

人工智能产品的定义较为广泛,智能硬件、机器人、芯片、语音助手等都可以叫做人工智能产品。本文讨论的人工智能产品主要是指在互联网产品中运用人工智能技术。

互联网产品主要着手与解决用户的痛点,对于C端产品来说,痛点就是指的个人想解决而无法解决的问题,如个人想要美化自己的照片,但是他不会复杂的PS软件,于是美图秀秀就可以解决这个痛点。从KANO模型中,就是满足用户的基本需求与期望需求。

人工智能产品(在互联网产品中运用人工智能技术)则是要满足用户的兴奋需求。如将情感分析运用到电商的产品评论中,用户则可以通过可视化的数据展示来大致对产品有个全面、直观的了解,而不再需要自己一页一页的翻看评论内容。

互联网产品主要关注点在于用户需求、流程设计、交互设计、商业模式等。着眼于用户需求,设计满足用户需求的产品,通过合理的流程设计、交互设计达到产品目标,进而实现商业目标。典型的思路是发现用户需求——>设计满足用户需求的产品——>迭代完善、产品运营——>商业变现。

人工智能产品关注点在于模型的构建,它不再是对于布局、交互的推敲,而是通过选择合适的数据,构建合适的模型,最终呈现出来的是好的效果。什么是好的效果呢?这就需要引入评测指标。互联网的评测指标有我们熟知的留存率、转化率、日活跃等,那么人工智能的产品主要是通过一些统计指标来描述,以情感分析为例,把情感分析看成一个分类问题,则可以使用P、R、A、F值来描述。

1)查准率(Precision):P值,衡量某类分类中识别正确的比例,如情感分析中,有10条被分类为“正向”,其中8条是分类正确的(由人工审核),那么P=8/10=80%

2)查全率(Recall):R值,又叫查全率,又叫召回度,指的是某类被被正确分类的比例,同样以情感分析为例,100条数据中有10条是正向的,机器分类后,这10条中有7条被分类为正向,则R=7/10=70%

3)F值,因为P值和R值通常是两个相互矛盾的指标,即一个越高另一个越低,F则是两者综合考虑的指标,不考虑调节P、R权重的情况下,F=2PR/(P+R)

4)精确度(Accuracy):这个最好理解,就是被准确分类的比例,也就是正确率。如100条数据,90条是被正确分类的,则A=90/100=90%。

以上指标越高,说明模型效果越好。

我们从上面内容可以知道,人工智能产品设计关注:数据——>模型——>效果评估。

现在我们以情感分析为例子说明产品设计的过程。

1)数据:

数据的选择对最终模型的结果有直接影响,情感分析,根据不同的目的,选择的数据也不同。如将情感分析运用于**票房预测,则一些更新及时、内容丰富的数据源,如微博,是比较好的选择。如果是应用于商品的评价,如电子产品,很多评测内容是无法在短短几句话内描述清楚的,这时候微博不是个好的选择,选择论坛上更新较慢、但是详细的内容就比较适合。

如果能在产品的早期就有引入人工智能的打算,则可以在产品中事先做好数据采集。

2)模型:

在选择模型中,产品需要了解不同的模型的优缺点,进而选择更加合适的模型。在情感分析中,NB、SVM、N-gram都是常用的模型,其中SVM效果最好(这是已有的结论),如果是其他的智能产品,可能需要算法团队进行实验,给出测试数据,进而选择合适的模型。

3)效果评估:

效果评估在上文中已经描述得比较清楚,具体指标不再赘述。

4)产品呈现:

最后这一步,是将结果展示给用户。在情感分析中,我们可以选择雷达图、词云、情感趋势图来展示结果。取决于产品属性,如电商产品评论挖掘,可以使用词云;

如舆论分析,可以使用情感趋势图。

人工智能产品的设计要关注:数据、模型、评判、呈现。

人工智能情绪识别的定义,就是用人工的方法和技术赋予计算机或机器人人类式的情感,使之具有表达、识别和理解喜乐哀怒,模仿、延伸和扩展人的情感的能力。

而情感认知识别则更胜一筹!

比如阅面科技的产品—ReadFace

就被定义为一款情感认知识别引擎而非情绪识别引擎,关键原因是情感认知引擎识别还包含了认知状态识别和面部的动作分析。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/7687682.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-09-07
下一篇2023-09-07

发表评论

登录后才能评论

评论列表(0条)

    保存