情感解析技术现在能做到什么?

情感解析技术现在能做到什么?,第1张

情感解析技术实质上也就是人工智能中的自然语言处理技术中的一种。

也许前两年我还很难回答你这个问题,不过随着机器学习技术、硬件迭代等因素这两年人工智能得到了极大的发展,自然语言处理也就有了越来越多地实用价值。

在正式回答你的问题之前,我们先要明白,作为人工智能技术基础的机器学习,其最重要的就是需要有充分大的样本数据进行训练,即需要先给机器一些已知“情感”的语言数据,才可以获取最终的解析引擎。这一点尤为重要,因为这决定了能产生使用价值的领域一定存在着易获取、易分析的语言数据才行。当然同时又要对顾客/消费者的情感反馈有着积极地需求。

以这两个为条件,那么结果显而易见了:

1、对话机器人。诸如微软小冰、苹果siri等。非常容易理解,因为“对话”本身就是语言数据之间的沟通,而情感数据作为从语言数据中提炼出来的附加价值信息,对智能对话机器人的“人性化”来说当然是有百利而无一弊。而且,对于这些大企业来说,巨量的语言数据也相当容易获取。

3、情绪客服质检。这是一个很容易被忽略的行业,但是确实人工智能情感解析最直接最有效的应用之一。试想一下,客服质检需要做的是什么工作:判断客服人员工作是否到位……传统的客服质检只能通过堆叠人力的方式,主观、抽样判断。而现有的所谓“客服质检”系统也只不过是关键词提取、匹配,根本不是质检。但是情绪解析的出现彻底改变了这一状况,其实也不难理解,因为判断客服工作最直接的指标不就是顾客的“满意程度”嘛,而通过情绪解析获取的顾客通话或文本输入中的“情感状态及变化趋势”不就满足了这一条件。唯一的一个问题就是这需要很强的情绪解析实践能力,对准确率和技术基础有着很高的要求,故目前为止也只有很少几家诸如语忆科技等提供商才有这样的技术。但事实上,客服质检一定会是最需要情绪解析的细分行业之一。

2、各种评论分析。这点也不难理解,在当今电商消费已经变成主流的网络时代,电商上会产生海量的评论数据。在以前,由于评论量不多,且是非结构化数据,文本处理能力又有限,导致品牌方们很难从中获取有用的信息,从而有巨量的评论数据被浪费。但是如今已经不一样了,像以上所提到的一些优秀的引擎提供商,不仅可以从评论中提取关键词、还能通过情绪解析明白用户的满意程度。一些上文提到的供应商有的还能做到对特定关键词的观点提取。这些都能帮助甲方从评论中挖掘非常有价值的消费者洞察。不难想象,一旦技术成熟,像评论一样的非结构化数据作为用户想法的直接传递,其价值将会远超那些“浏览量”“互动率”等结构化数据……

……

除此之外,还有如书籍分析归类、教育辅导优化、歌词台词总结等等很多应用场景,只不过有些商业价值不明显的领域仍然需要大胆的创新者去研究和开拓。不过无论如何,在这个人工智能兴起的时代,情绪解析仍处于朝阳时代,还具备着极大的潜力等待被挖掘~

人工智能产品的定义较为广泛,智能硬件、机器人、芯片、语音助手等都可以叫做人工智能产品。本文讨论的人工智能产品主要是指在互联网产品中运用人工智能技术。

互联网产品主要着手与解决用户的痛点,对于C端产品来说,痛点就是指的个人想解决而无法解决的问题,如个人想要美化自己的照片,但是他不会复杂的PS软件,于是美图秀秀就可以解决这个痛点。从KANO模型中,就是满足用户的基本需求与期望需求。

人工智能产品(在互联网产品中运用人工智能技术)则是要满足用户的兴奋需求。如将情感分析运用到电商的产品评论中,用户则可以通过可视化的数据展示来大致对产品有个全面、直观的了解,而不再需要自己一页一页的翻看评论内容。

互联网产品主要关注点在于用户需求、流程设计、交互设计、商业模式等。着眼于用户需求,设计满足用户需求的产品,通过合理的流程设计、交互设计达到产品目标,进而实现商业目标。典型的思路是发现用户需求——>设计满足用户需求的产品——>迭代完善、产品运营——>商业变现。

人工智能产品关注点在于模型的构建,它不再是对于布局、交互的推敲,而是通过选择合适的数据,构建合适的模型,最终呈现出来的是好的效果。什么是好的效果呢?这就需要引入评测指标。互联网的评测指标有我们熟知的留存率、转化率、日活跃等,那么人工智能的产品主要是通过一些统计指标来描述,以情感分析为例,把情感分析看成一个分类问题,则可以使用P、R、A、F值来描述。

1)查准率(Precision):P值,衡量某类分类中识别正确的比例,如情感分析中,有10条被分类为“正向”,其中8条是分类正确的(由人工审核),那么P=8/10=80%

2)查全率(Recall):R值,又叫查全率,又叫召回度,指的是某类被被正确分类的比例,同样以情感分析为例,100条数据中有10条是正向的,机器分类后,这10条中有7条被分类为正向,则R=7/10=70%

3)F值,因为P值和R值通常是两个相互矛盾的指标,即一个越高另一个越低,F则是两者综合考虑的指标,不考虑调节P、R权重的情况下,F=2PR/(P+R)

4)精确度(Accuracy):这个最好理解,就是被准确分类的比例,也就是正确率。如100条数据,90条是被正确分类的,则A=90/100=90%。

以上指标越高,说明模型效果越好。

我们从上面内容可以知道,人工智能产品设计关注:数据——>模型——>效果评估。

现在我们以情感分析为例子说明产品设计的过程。

1)数据:

数据的选择对最终模型的结果有直接影响,情感分析,根据不同的目的,选择的数据也不同。如将情感分析运用于**票房预测,则一些更新及时、内容丰富的数据源,如微博,是比较好的选择。如果是应用于商品的评价,如电子产品,很多评测内容是无法在短短几句话内描述清楚的,这时候微博不是个好的选择,选择论坛上更新较慢、但是详细的内容就比较适合。

如果能在产品的早期就有引入人工智能的打算,则可以在产品中事先做好数据采集。

2)模型:

在选择模型中,产品需要了解不同的模型的优缺点,进而选择更加合适的模型。在情感分析中,NB、SVM、N-gram都是常用的模型,其中SVM效果最好(这是已有的结论),如果是其他的智能产品,可能需要算法团队进行实验,给出测试数据,进而选择合适的模型。

3)效果评估:

效果评估在上文中已经描述得比较清楚,具体指标不再赘述。

4)产品呈现:

最后这一步,是将结果展示给用户。在情感分析中,我们可以选择雷达图、词云、情感趋势图来展示结果。取决于产品属性,如电商产品评论挖掘,可以使用词云;

如舆论分析,可以使用情感趋势图。

人工智能产品的设计要关注:数据、模型、评判、呈现。

目前市场上有许多文学创作软件和诗歌评价软件,可以帮助诗人评估自己的诗歌作品。以下是一些常见的诗歌评价软件,您可以根据自己的需求选择:

诗歌大师:一款功能强大的诗歌创作与评价工具,支持自动评分、词汇量分析、情感分析等功能。

作家助手:一款集成了诗歌创作和评价功能的写作软件,可以帮助诗人提升创作和表达水平。

诗歌分析器:一款在线诗歌评价工具,可以通过分析诗歌中的语言、意象、韵律等要素来评价诗歌的优劣。

句酷诗歌评分器:一款在线诗歌评价工具,可以通过打分的方式来评估诗歌的质量。

需要注意的是,这些软件只是辅助工具,评价结果并不代表绝对的价值和权威性。最终还是需要诗人自己对作品进行深入思考和审视,从多个角度出发来评价自己的诗歌作品。

这是计算机世界的一个尚未开发的前沿:将各种人类情感转化成实实在在的数据。

起源

虽然之前也有一些相关工作,但目前公认的情感分析比较系统的研究工作开始于(Pang et al, 2002)基于监督学习(supervised learning)方法对**评论文本进行情感倾向性分类和(Turney,2002)基于无监督学习(unsupervised learning)对文本情感情感倾向性分类的研究。Pang et al, 2002)基于文本的N元语法(ngram)和词类(POS)等特征分别使用朴素贝叶斯(Naive Bayes),最大熵(Maximum Entropy)和支持向量机(Support Vector Machine,SVM)将文本情感倾向性分为正向和负向两类,将文本的情感进行二元划分的做法也一直沿用至今。同时他们在实验中使用**评论数据集目前已成为广泛使用的情感分析的测试集。(Turney ,2002)基于点互信息(Pointwise Mutual Information,PMI)计算文本中抽取的关键词和种子词(excellent,poor)的相似度来对文本的情感倾向性进行判别(SO-PMI算法)。在此之后的大部分都是基于(Pang et al, 2002)的研究。而相对来说,(Turney et al,2002)提出的无监督学习的方法虽然在实现上更加简单,但是由于单词之间的情感相似度难以准确的计算和种子词的难以确定,继续在无监督学习方向的研究并不是很多的,但是利用SO-PMI算法计算文本情感倾向性的思想却被很多研究者所继承了

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/4047783.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-08-20
下一篇2023-08-20

发表评论

登录后才能评论

评论列表(0条)

    保存