斯坦福大学自然语言处理第七课“情感分析(Sentiment Analysis)”

斯坦福大学自然语言处理第七课“情感分析(Sentiment Analysis)”,第1张

<article>

课程地址: https://classcourseraorg/nlp/lecture/31

情感分析 (Sentiment analysis)又可以叫做

意见抽取 (Opinion extraction)

意见挖掘 (Opinion mining)

情感挖掘 (Sentiment mining)

主观分析 (Subjectivity analysis)等等。

引用的论文:

Bo Pang, Lillian Lee, and Shivakumar Vaithyanathan 2002 Thumbs up Sentiment Classification using Machine Learning Techniques EMNLP-2002, 79—86

Bo Pang and Lillian Lee 2004 A Sentimental Education: Sentiment Analysis Using Subjectivity Summarization Based on Minimum Cuts ACL, 271-278

另外需注意,Binarized (Boolean feature) Multinomial Naïve Bayes不同于Multivariate Bernoulli Naïve Bayes,MBNB在文本情感分析上的效果并不好。另外课中也提到可以用交叉验证的方式进行训练验证。

下面罗列了一些比较流行的词典:

当我们拿到一个词我们如何判断他在每个类别中出现的概率呢?以IMDB影评为例

但是!我们不能用单纯的原始计数(raw counts)方法来进行打分,如下图

可以看出,这些否定词同样可以作为单词极性的一个判断依据。

具体步骤为:

联合概率 / 独立的两个概率乘积

之后我们可以看一下统计结果,分别来自于用户好评和差评的统计:

可以看到极性划分的还不错

</article>

</main>

转自csdn

人工智能产品的定义较为广泛,智能硬件、机器人、芯片、语音助手等都可以叫做人工智能产品。本文讨论的人工智能产品主要是指在互联网产品中运用人工智能技术。

互联网产品主要着手与解决用户的痛点,对于C端产品来说,痛点就是指的个人想解决而无法解决的问题,如个人想要美化自己的照片,但是他不会复杂的PS软件,于是美图秀秀就可以解决这个痛点。从KANO模型中,就是满足用户的基本需求与期望需求。

人工智能产品(在互联网产品中运用人工智能技术)则是要满足用户的兴奋需求。如将情感分析运用到电商的产品评论中,用户则可以通过可视化的数据展示来大致对产品有个全面、直观的了解,而不再需要自己一页一页的翻看评论内容。

互联网产品主要关注点在于用户需求、流程设计、交互设计、商业模式等。着眼于用户需求,设计满足用户需求的产品,通过合理的流程设计、交互设计达到产品目标,进而实现商业目标。典型的思路是发现用户需求——>设计满足用户需求的产品——>迭代完善、产品运营——>商业变现。

人工智能产品关注点在于模型的构建,它不再是对于布局、交互的推敲,而是通过选择合适的数据,构建合适的模型,最终呈现出来的是好的效果。什么是好的效果呢?这就需要引入评测指标。互联网的评测指标有我们熟知的留存率、转化率、日活跃等,那么人工智能的产品主要是通过一些统计指标来描述,以情感分析为例,把情感分析看成一个分类问题,则可以使用P、R、A、F值来描述。

1)查准率(Precision):P值,衡量某类分类中识别正确的比例,如情感分析中,有10条被分类为“正向”,其中8条是分类正确的(由人工审核),那么P=8/10=80%

2)查全率(Recall):R值,又叫查全率,又叫召回度,指的是某类被被正确分类的比例,同样以情感分析为例,100条数据中有10条是正向的,机器分类后,这10条中有7条被分类为正向,则R=7/10=70%

3)F值,因为P值和R值通常是两个相互矛盾的指标,即一个越高另一个越低,F则是两者综合考虑的指标,不考虑调节P、R权重的情况下,F=2PR/(P+R)

4)精确度(Accuracy):这个最好理解,就是被准确分类的比例,也就是正确率。如100条数据,90条是被正确分类的,则A=90/100=90%。

以上指标越高,说明模型效果越好。

我们从上面内容可以知道,人工智能产品设计关注:数据——>模型——>效果评估。

现在我们以情感分析为例子说明产品设计的过程。

1)数据:

数据的选择对最终模型的结果有直接影响,情感分析,根据不同的目的,选择的数据也不同。如将情感分析运用于**票房预测,则一些更新及时、内容丰富的数据源,如微博,是比较好的选择。如果是应用于商品的评价,如电子产品,很多评测内容是无法在短短几句话内描述清楚的,这时候微博不是个好的选择,选择论坛上更新较慢、但是详细的内容就比较适合。

如果能在产品的早期就有引入人工智能的打算,则可以在产品中事先做好数据采集。

2)模型:

在选择模型中,产品需要了解不同的模型的优缺点,进而选择更加合适的模型。在情感分析中,NB、SVM、N-gram都是常用的模型,其中SVM效果最好(这是已有的结论),如果是其他的智能产品,可能需要算法团队进行实验,给出测试数据,进而选择合适的模型。

3)效果评估:

效果评估在上文中已经描述得比较清楚,具体指标不再赘述。

4)产品呈现:

最后这一步,是将结果展示给用户。在情感分析中,我们可以选择雷达图、词云、情感趋势图来展示结果。取决于产品属性,如电商产品评论挖掘,可以使用词云;

如舆论分析,可以使用情感趋势图。

人工智能产品的设计要关注:数据、模型、评判、呈现。

感情大致分为3种,就是爱情,亲情,友情。“情感”亦称“感情”,是指人的喜怒哀乐等心理表现。

但具体的细分可以分为N种,爱情根据时间排列可以分为过去,现在,未来三种友情根据时间可以分为认识,了解,熟悉,记忆四种亲情根据往来可以分为至深,疏远,知道,很模糊四种。但是感情有根据工作,学习,交往,分为同事,上级,下级,合作,协同等。

(一)情绪的基本分类

1快乐

快乐是一种感受良好时的情绪反应,一般来说是一个人盼望和追求的目的达到后产生的情绪体验。由于需要得到满足,愿望得以实现,心理的急迫感和紧张感解除,快乐随之而生。

2愤怒

愤怒是指在实现目标时受到阻碍,而使愿望无法实现时产生的情绪体验。愤怒时紧张感增加,并且有时不能自我控制,甚至可能出现攻击行为。

3悲哀

悲哀也称也称悲伤,是指心爱的事物失去时,或理想和愿望破灭时产生的情绪体验。悲哀的程度取决于失去的事物对自己的重要性和价值。悲哀时带来的紧张的释放,会导致哭泣。当然,悲哀并不总是消极的,它有时能够转化为前进的动力。

4恐惧

恐惧是企图摆脱和逃避某种危险情景而又无力应付时产生的情绪体验。所以,恐惧的产生不仅仅是由于危险情景的存在,还与个人排除危险的能力和应付危险的手段有关。一个初次出海的人遇到惊骇浪或者鲨鱼袭击会感到恐惧无比,而一个经验丰富的水手对此可能已经司空见惯,泰然自若。

复合情绪是由基本情绪的不同组合派生出来的,在以上这四种基本情绪的基础之上,可以派生出众多的复杂情绪,如厌恶、羞耻、悔恨、嫉妒、喜欢、同情等。

(二)情绪状态的分类

情绪状态是指在一定的生活事件影响下,一段时间内各种情绪体验的一般特征表现。根据情绪状态的强度和持续时间可分为心境、激情和应激。

1心境

心境是指微弱而持久,带有渲染性的情绪状态。一种心境的持续时间依赖于引起心境的客观刺激的性质,如“感时花溅泪,恨别鸟惊心”;一个人取得了重大的成就,在一段时间内处于积极、愉快的心境中。

2激情

激情是一种迅猛爆发、激动短暂的情绪状态。激情是一种持续时间短、表现剧烈、失去自我控制力的情绪,激情是短暂的暴发式的情绪体验。人们在生活中的狂喜、狂怒、深重的悲痛和异常的恐惧等都是激情的表现。

3应激

应激是指个体对某种意外的环境刺激所做出的适应性反应,是个体觉察到环境的威胁或挑战而产生的适应或应对反应。比如,人们遇到突然发生的火灾、水灾、地震等自然灾害时,刹那间人的身心都会处于高度紧张状态之中。此时的情绪体验,就是应激状态。

(三)情感的分类

情感是指与人的社会性需要相联系的主观体验。人类高级的社会性情感主要有道德感、理智感和美感。

1道德感

道德感是在评价人的思想、意图和行为是否符合道德标准时产生的情感。由于不同历史时代、不同社会制度、不同的民族具有不同的道德标准,所以人的道德感具有社会历史性。

2理智感

理智感是在认识和评价事物过程中所产生的情感。它是人们学习科学知识、认识和掌握事物发展规律的动力。人的理想、世界观对理智感有重要的作用。例如求知欲、好奇心等都属于理智感的范畴。

3美感

美感是根据一定的审美标准评价事物时所产生的情感。人的审美标准既反映事物的客观属性,又受个人的思想观点和价值观念的影响,美感具有一定的社会历史性,不同历史时期、不同文化背景的人们对美的认识不同,例如,唐朝的女性以胖为美。

情绪从心理学来说也有很多分类的结构体系,最常用的是根据情绪的持续时间以及触发条件把情绪分为心境,应激和反应。当然还有根据作用分类的积极情绪和消极情绪,等等,如果你想要详细分类可以给我留个邮箱,我写好了之后给你发过去~

很高兴回答您的问题:放平心态,一切都会好起来。

你千万不要成为他们中的一个——如果你正遭受这些问题中其中一个 ,找出解决的办法,不管是要去做治疗,单独修养,或仅仅是需要和你伴侣聊天保证自己会改变。

一、 总是想赢

恋爱关系的致命杀手之一就是好胜心。我不是指在网球赛中你不能忍受失败的那种竞争姿态,而是指你的恋爱态度,你视这种关系本身为一场比赛,并想获得胜利。把一场恋爱当做一场竞争的人总是寻求优势,占上风,拥有一些能控制对方的想法的,如果你觉得自己有些事不能告诉对方怕他/她借此攻击你,那么你就是处在竞争关系中——但这种关系不会长久。

二、不信任

在两性关系中有两方面信任很重要。第一是要足够相信对方不会欺骗或伤害你——并且相信对方也如此信任自己。另一方面是确信不管你做了什么或是说了什么,对方都不会离开你并会一如既往的爱你。如果其中一人利用对方的信任做了不可原谅的事,那么第二层信任都将不复存在,你们的关系就此结束——即使是长达十几年的感情。

三、不交流

对于两性关系中让他们郁闷心烦的事,很多人都会保持沉默。一来是他们不想说出来伤对方的心,其次是因为他们想要保持强势地位(参考第二点,常见的情况是:“如果你不知道为什么我会发狂,那我当然不会告诉你!)这种方式在短期内可能会让对方相安无事,但长期下去它会逐渐侵蚀双方感情基础,使其日渐薄弱。小矛盾堆成了越来越大的问题——由于你的另一半车沉浸在幸福的假象里而忽视了这些导致问题堆砌的矛盾。更糟的是,完全没有意识到这些会成为让你郁闷的理由,最终,沉默反映了信任的缺失——正如我所说,一段关系就此完结。

四、不倾听

倾听——用心的倾听——是很难得。听到别人似乎在指责自己时想要为自己辩解是正常的情况,所以我们常常是打断别人来为自己辩解开脱,或者只关心怎么为自己辩解,而并没有认真听完别人所说的话。

但事实是你应该仔细听对方的谈话,甚至应该在对方的日常念叨中听出他们的暗含的意思,以揣摩出连他/她自己都不十分清楚的梦想和愿望。如果达不到这种程度,至少对你所爱的人来说,这是一个问题。

五、 花钱不节制

这一点对我来说是个深刻的教训——它直接导致我7年恋爱关系的结束。当你单身时,你可以在任何时刻买下你想要的任何东西而不用考虑将来会怎么样。虽然不明智,但是你承担后果的也只是你自己。当你和某人确定长期的恋爱关系后,这种花钱方式就不现实了。你的配偶——和你的孩子(如果有或打算要小孩的话)——将会承受你这种恣意花销所带来的不良后果。

所以你最好养成好良好的消费习惯,以日用品开销为主,如果有结余,再和对方商量一下怎么用这笔钱最好。

目前开销问题导致两性关系产生矛盾的情况越来越多。因为越来越多的人即使婚后也选择财务分开。这种安排本身是无可厚非的,但与想象中相反,财务独立需要双方更多的交流和参与。如果你认为花的是自己的钱其他人没权利干涉,那么你的两性关系注定会失败。

六、怕分手

享受幸福两性关系的人是不会担心分手这个事的。如果你担心,那就说明你们的关系出现危机了。但通常问题正是源于这种担心本身。因为它不仅表示你讨不到对对方的不信任,也显示你对自己信心不足——你担心自己不够好,没有人真正有理由会想和你在一起。迟早你的配偶会醒悟过来然后离你而去。

所以你花更多精力来维护这段感情表面的光鲜亮丽而不是塑造自己的内心世界,使自己自信。容我直言,这样做不但不会让你自己满意,也讨不到你恋人的欢心。

七、太依赖

两性关系中支持和依赖是一个不好把握的度。如果你依靠你的配偶——那就是说,离了他/她你完全没法活-这样你就过界了。你的伴侣现在承受着压力,他各方面都要把你照顾好而这种压力会使得他不满。如果你总是期望对方来维持这段感情而自己什么都不做——我这里指的是财政和感情支持,那么你就有困难课。

注意:我不是说你需要平等的担负生活开支——我的意思是如果你不能为生活费出力,其他方面也无任何贡献。那么这段感情就不正常了,当然也就不会有好结局。

八、期望得到快乐

一段糟糕的关系的标志就是:其中一方或双方都期望让对方快乐或希望对方令自己快乐。不管对自己或是双方而言,这都是个不切实际的期盼——除了你自己,没有人能让你快乐起来——但把它作为两性关系的期待是不切实际的。

相处不只是快乐,很多时候你你不会感到快乐甚至也不应该觉得快乐。当你觉得失落,痛苦,压抑或悲伤时,有一个人可以依靠甚至比起一直快乐更重要。如果你期望对方让你快乐——或更糟的是,你因为不能让对方快乐而觉得有挫败感——那么你们这段感情是经受不起挫折的。

九、从不争执

偶尔的良性的争执是必要的。某种程度上,争论能够解决一些琐事以避免它们集成大问题。但同样,在争吵中发泄愤怒是人类情绪构成中非常正常的一部分。你的恋爱关系必须足够强韧,能够包容真实的你而不仅是你好的方面。

夫妻间不争吵的原因之一是他们害怕冲突——这反映了相互间信任的缺乏和恐惧。这样是很不好的。另外一个原因是他们认为愤怒是不讲理,也是徒劳的。他们认为争吵就是分手的表现而不是两性关系发展中极其自然的一部分,当争吵让双方都感到不快时,它能使得双方都说出自己都吃惊的话——这可以避免他们相互容忍到爆发无可挽回的争斗。

十、想得简单/想得太难

我听说过的两性关系中有两种恋爱态度非常有问题。一种就是认为两性关系应该简单,如果你真的爱一个人并打算和他/她相伴一生的话,很自然就会水到渠成。另一种态度是相处是件麻烦事——正是因为麻烦,所以要努力获得。

这两种观点都会导致你不会费心经营这段感情。你不花心思因为你认为它应该是水到渠成的,所以不需要努力,或认为它本身就是个麻烦事,如果你努力,也不会因此変简单。在两种态度下,你很快就会精疲力尽——一则是因为眼下你忽视的问题根本没按你期望的那样自行解决,二来是你一直制造的问题使得你力不从心,了太多心思的感情可能会遭受以上态度的影响,但不花一点心思的感情也好不到哪去。

情感分类是与情绪情感有关问题的归类;情感分析是对情感情绪问题的见解与认识。

《计算机科学》 2010年07期

情感分析与认知 李维杰

摘要:分析了情感分析的3个主要步骤,包括文本情感获取与表达、文本情感分类与计算以及文本情感分析的应用。情感分析得到的结论主要是对相关观点的摘要、对相关事件态度的预测或者统计等,但这些结论都没有发挥文本情感在认知中的作用。为了将情感分析应用于认知科学,提出了情感由情感信号和情感实体组成的观点。情感信号主要是指情感的一些形式载体,比如心跳加速、脸红等这些人体内外的某些表现,表达情感的文字、、声音等这类媒体。情感实体主要是指人类对情感形成的一种共识,比如爱、恨、憎恶、高兴、羞愧、嫉妒、内疚、恐惧、焦虑等与人的意识相关联的部分。同时提出了在人工智能中利用情感信息的设想。这对于模拟情感对认知的影响具有一定的意义。

--------粘贴内容,其他未知,抱歉。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/800988.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-09
下一篇2023-07-09

发表评论

登录后才能评论

评论列表(0条)

    保存