相信大家都清楚,那就是在不少人看来,一个人的桃花运往往会直接影响到这个人在婚姻上的运势,因此不少人都希望自己的桃花运旺盛。那么桃花运旺盛的 手相 是怎样的?下面跟着我们一起来看看吧。
感情线上分叉多
感情线上分叉多的人一般桃花运都很不错,不过感情生活比较复杂,所以他们总是招惹许多莫名其妙的异性,感情之路非常坎坎坷。不过好在他们自控能力比较强,一旦爱上一个人便不会轻易变心,拥有这种手相的人在结婚之后桃花运就会逐渐降低,对婚姻生活的影响并不大。
手腕处竖纹多
从手掌八卦的宫位来看,手腕处属于坎位,坎宫从五行来说,属于水。五行水,主流动性,也主欲望,代表感情多。所以,在手腕处有多条竖纹的人,桃花运是很旺盛的。因为坎宫属水,竖纹多也是水多、水旺即为桃花旺,桃花指数90%。
感情线上有着岛纹
虽说岛纹确实是手相特征中比较糟糕的一种纹理,象征着厄运和麻烦。但如果感情线上存在岛纹的话至少说明了其人确实有很多恋爱的机会,虽然每一段感情并不一定能够走到最后。正因为如此其人能够具备非常丰富的恋爱经验,这是好事但也是坏事。
很显然这确实是一种象征着命主桃花运旺盛的手相。对此命主需要在追求爱情的同时不要放下工作和生活,简单来说就是不要让爱情成为自己生活中的全部,如此一来即使爱情失败了也不会对自己的生活造成太大的影响。
感情线比较深且直
感情线比较深的人,通常结婚之后你和另一半之间的感情很深,彼此关系始终都很亲密,但是如果感情线深且直,那就说明夫妻关系很稳定,即使出现争吵,也不会影响感情基础。夫妻感情好,也是桃花运的正面作用。你们的婚姻道路非常顺利,这样的婚姻生活或许会显得有些平凡,但也正是因为这样的平凡,所以才会显得可贵。
监督学习
目前,基于监督学习的情感分析仍然是主流,除了(Li et al,2009)基于非负矩阵三分解(Non-negative Matrix Tri-factorization),(Abbasi et al,2008)基于遗传算法(Genetic Algorithm)的情感分析之外,使用的最多的监督学习算法是朴素贝叶斯,k最近邻(k-Nearest Neighbor,k-NN),最大熵和支持向量机的。而对于算法的改进主要在对文本的预处理阶段。
基于规则/无监督学习
和基于监督学习的情感分析相比,基于规则和无监督学习方面的研究不是很多。除了(Turney,2002)之外,(朱嫣岚 et al,2002)利用HowNet对中文词语语义的进行了情感倾向计算。(娄德成 et al,2006)利用句法结构和依存关系对中文句子语义进行了情感分析,(Hiroshi et al,2004)通过改造一个基于规则的机器翻译器实现日文短语级情感分析,(Zagibalov et al,2008)在(Turney,2002)的SO-PMI算法的基础上通过对于中文文本特征的深入分析以及引入迭代机制从而在很大程度上提高了无监督学习情感分析的准确率。
跨领域情感分析
跨领域情感分析在情感分析中是一个新兴的领域,目前在这方面的研究不是很多,主要原因是目前的研究还没有很好的解决如何寻找两个领域之间的一种映射关系,或者说如何寻找两个领域之间特征权值之间的平衡关系。对于跨领域情感分析的研究开始于(Blitzer et al,2007)将结构对应学习(Structural Correspondence Learning,SCL)引入跨领域情感分析,SCL是一种应用范围很广的跨领域文本分析算法,SCL的目的是将训练集上的特征尽量对应到测试集中。(Tan et al,2009)将SCL引入了中文跨领域情感分析中。(Tan2 et al,2009)提出将朴素贝叶斯和EM算法的一种半监督学习方法应用到了跨领域的情感分析中。(Wu et al,2009)将基于EM的思想将图排序(Graph Ranking)算法应用到跨领域的情感分析中,图排序算法可以认为是一种迭代的k-NN
李密写《陈情表》的情感分析
大致有这样三个原因:第一,李密确实有一个供养祖母刘的问题,像文章中说的“祖母无臣,无以终余年”。第二,李密是蜀汉旧臣,自然有怀旧的思想,况且他还认为汉主刘禅是一个“可以齐桓”的人物,对于晋灭蜀汉是有一点不服气的。第三,古人讲:做官如履薄冰。皇帝高兴时,臣为君之心腹;皇帝不高兴时,臣为君之土芥。魏晋南北朝时期的政权极不稳固,政权就像走马灯似的变化,出于历史的教训,李密不能没有后顾之忧。晋朝刚刚建立,李密对晋武帝又不甚了解,盲目做官,安知祸福。所以李密“辞不就职”,不是不想做官,而是此时此刻不宜做官。李密此时已是惊弓之鸟,实在不敢把宝压在晋朝上面,所以他还说了“且臣少仕伪朝(即,蜀汉政权,在这里为了达到自己辞官不受的意图只能称前朝为伪朝了),历职郎署,本图宦达,不矜名节。今臣亡国贱俘,至微至陋。”
李密不想马上出来做官,而晋武帝方面却催逼得很紧。“诏书切峻,责臣逋慢。郡县逼迫,催臣上道;州司临门,急于星火。”轻慢皇帝,违抗皇命是要杀头的。为了摆脱这个困境,达到不出来做官的目的,李密就在“孝”字上大做文章,把自己的行为纳入晋武帝的价值观念中去。李密是蜀汉旧臣,“少仕伪朝,历职郎署”,古人讲“一仆不事二主”,“忠臣不事二君”。如果李密不出来做官,就有“不事二君”的嫌疑,不事二君就意味着对晋武帝不满,这就极其危险了,所以李密说自己“不矜名节”,“岂敢盘桓,有所希冀”,我不出来做官完全是为了供养祖母刘,是为了“孝”。但是这里又产生了一个问题,事父为孝,事君为忠。李密供养祖母是孝,但不听从君主的诏令,不出来做官,就是不忠。古人云“忠孝不能两全”。《韩诗外传》卷二记载:“楚昭王使石奢为理道,有杀人者追之,则父也。奢曰:‘不私其父非孝也,不行君法非忠也。’于是刎颈而死。”为忠臣不得为孝子,为孝子不得为忠臣。李密很巧妙地解决了这个矛盾,即先尽孝,后尽忠。“是臣尽节于陛下之日长,报刘之日短也”。等我把祖母刘养老送终之后,再向您尽忠,这样晋武帝也就无话可说了。
李密为了达到自己的目的,除了在“孝”字上大作文章外,还以巧妙的抒情方式,来打动晋武帝。从文章中可以想见,李密在构思《陈情表》时,有三种交错出现的感情:首先是因处境狼狈而产生的忧惧之情;其次是对晋武帝“诏书切峻,责臣逋慢”的不满情绪;最后是对祖母刘的孝情。但是当他提笔写文章时,便把这三种感情重新加以整理,经过冷静的回味,压抑了前两种感情,只在文中含蓄地一笔带过,掩入对祖母刘的孝情之中。而对后一种感情则大肆渲染,并且造成一个感人至深的情境,即“臣无祖母,无以至今日;祖母无臣,无以终余年”。从这样一种情境出发,作者先以简洁精练的语言写自己的孤苦,为“祖母无臣,无以终余年”作铺垫,然后反复强调祖母刘的病:如第一段的“夙婴疾病,常在床蓐”;第二段的“刘病日笃”;第三段的“日薄西山,气息奄奄,人命危浅,朝不虑夕”。这样,李密的孝情就不同于一般的母孙之情,而是在特定情境中的特殊孝情。
《陈情表》是写给晋武帝的,是为了达到“辞不就职”的目的。从这个目的出发,李密并没有把孝情一泄到底,而是用理性对感情加以节制,使它在不同的层次中,不同的前提下出现。第一段先写自己与祖母刘的特殊关系和特殊命运,抒发对祖母的孝情,“臣侍汤药,未曾废离。”如果从这种孝情继续写下去,会有许多话要说,如对祖母的感激,对祖母的怜惜等等。但作者却就此止笔,转而写蒙受国恩而不能上报的矛盾心情,写自己的狼狈处境。第二段表白自己感恩戴德,很想走马上任,“奉诏奔驰”。为什么不能去呢因为“刘病日笃”,这就从另一方面反衬了他孝情的深厚,因为孝情深厚,而“诏书切峻,责臣逋慢”,所以才有“实为狼狈”的处境。前面抒发的孝情被节制以后,又在另一个前提下出现了。第三段作者转写自己“不矜名节”,并非“有所希冀”,不应诏做官,是因为“祖母无臣,无以终余年”。在排除了晋武帝的怀疑这个前提之下,再抒发对祖母刘的孝情,就显得更真实,更深切,更动人。
好一个巧言令色的李密!
当然,李密时代,读书人还是有尊严的,农夫诸葛亮为考验主公计,硬是折腾刘皇叔三顾茅庐,为佐证。
我们看看《陈情表》后传吧,李密在祖母去世,服丧期满后出仕。先为尚书郎,后为温县(今河南温县西)令。在任政令严明,政绩显著,以刚正见称。过去中山诸王(中山国在今河北定县,去晋京洛阳必经温县)每过温县,必苛求供给,当地人民以此为患。李密到任后,中山诸王过境苛求如故。李密引汉高祖过沛,对家乡老幼之供宾礼相待,不苛求烦扰的史实,进而谈到当朝也应效法,使诸王不便苛求,为百姓办了件好事。时盗贼猖獗,河内其他县常遭抢掠,却不敢犯温县。
李密很有才能,本望在朝担任高职,充分施展其才能。但山于刚正不阿,当政权贵惮其公直,无人推荐,不久竟去官,为州大中正,后任汉中太守。由于心中有所怨愤,一次晋武帝赐宴东堂,诏李密赋诗。他便在诗的末章写道:“人亦有言,有因有缘。宫中无人,不如归田。明明在上,斯语岂然!”武帝见后大怒,有人秉承帝意趁机上奏,李密只任了—年太守,被罢官归田。太康八年(287)病死家中,终年64岁。
李密对经学、训诂也有一定研究。著有《述理论》十篇,论中和仁义儒学道化之事。以上著术均散失,流传至今唯《陈情表》一文而已。
能说出 “人亦有言,有因有缘。宫中无人,不如归田。明明在上,斯语岂然!”这样的话说明李密还是有正义感的,而且在任期间也没有做过出格的事情。总的来说,还算是个好人,只不过那个动荡时代的文人说真话不易啊,所以才会催生出《陈情表》这样的文章来。其实,晋武帝司马炎有何尝不明白李密不想做官呢,只不过伦理道德这层窗户纸不便捅破罢了。
用一言来说《陈情表》一文寓孝道的真情于不认同新朝晋朝不想受牵连而辞官的假义当中,作为一个独立有自尊的文人来说写这篇文章的感情是复杂的,是矛盾的,他是一个好人却不敢完全说真话,这也反映除了一代文人的悲哀。写这篇虽是一个险招,但最后还是成功了,所以这篇文章才作为“经典案例”流传于世。
情感分类是与情绪情感有关问题的归类;情感分析是对情感情绪问题的见解与认识。
《计算机科学》 2010年07期
情感分析与认知 李维杰
摘要:分析了情感分析的3个主要步骤,包括文本情感获取与表达、文本情感分类与计算以及文本情感分析的应用。情感分析得到的结论主要是对相关观点的摘要、对相关事件态度的预测或者统计等,但这些结论都没有发挥文本情感在认知中的作用。为了将情感分析应用于认知科学,提出了情感由情感信号和情感实体组成的观点。情感信号主要是指情感的一些形式载体,比如心跳加速、脸红等这些人体内外的某些表现,表达情感的文字、、声音等这类媒体。情感实体主要是指人类对情感形成的一种共识,比如爱、恨、憎恶、高兴、羞愧、嫉妒、内疚、恐惧、焦虑等与人的意识相关联的部分。同时提出了在人工智能中利用情感信息的设想。这对于模拟情感对认知的影响具有一定的意义。
--------粘贴内容,其他未知,抱歉。
自然语言处理(NLP)在旅游领域具有广泛的应用,其中之一是情感分析。情感分析是指通过计算机程序来识别文本中的情感倾向,分析人们对旅游目的地、酒店、餐厅、交通工具等的评价。这种技术可以帮助旅游公司、酒店、餐厅等机构了解消费者的需求和喜好,改善服务质量和提高客户满意度。
一个典型的旅游情感分析应用是在线评论分析。在线评论是消费者对旅游目的地、酒店、餐厅等的反馈,通过使用 NLP 技术,旅游公司和酒店等机构可以分析这些评论,了解消费者对服务质量、位置、价格、餐饮等的看法。这些信息可以帮助他们改善服务质量、提高客户满意度。
另一个应用是社交媒体情感分析。社交媒体是消费者展示旅游经历的主要渠道,通过使用 NLP 技术,旅游公司和酒店等机构可以分析消费者在社交媒体上发布的文本、和视频,了解消费者对旅游目的地、酒店、餐厅等的感受。这些信息可以帮助他们改善服务质量、提高客户满意度、扩大品牌知名度。
此外,NLP还可以用于预测未来趋势,通过分析历史数据来预测旅游需求、价格趋势等,进而帮助旅游公司和酒店等机构调量、提高客户满意度。
NLP技术还可以用于语音识别和语音合成,在旅游领域中应用于语音导航、语音查询等场景。例如,旅游公司可以开发一款语音导航应用,让游客在旅游中使用语音命令来获取信息和导航。
总之,NLP在旅游领域有着广泛的应用,它可以帮助旅游公司、酒店、餐厅等机构了解消费者的需求和喜好,改善服务质量和提高客户满意度。通过使用NLP技术,旅游行业可以更好地了解客户,并提供更好的服务和体验。
钢琴曲《致爱丽丝》是德国作曲家贝多芬1810年所作。作者将这首精致的钢琴小品题献给女学生特雷泽马尔法蒂。乐曲以回旋曲式写成。一开始出现的主题纯朴亲切,刻画出温柔美丽、单纯活泼的少女形象。这一主题先后重复三次,中间有两个对比性的插部。第一插部建立在新的调性上,色调明朗,表现了欢乐的情绪;第二插部在左手固定低音衬托下,色彩暗淡,节奏性强,音乐显得严肃而坚定。一连串上行的三连音及随后流畅活泼的半音阶下行音调,又自然地引出了主题的第三次再现。乐曲在欢乐明快的气氛中结束。在这首《致爱丽丝》中,贝多芬基于了一个淳朴而亲切的主题,把特蕾泽温柔、美丽的形象作了概括的描述,在作品的前半部分,好似贝多芬有许多亲切的话语正在向特蕾泽诉说,后半部分听起来好象二人在亲切地交谈。右手旋律必须弹得非常亲切、流畅,富有音乐表情,在节奏上要始终体会三拍子的韵律,所以左手第一个低音要弹得深一些。此曲除主旋律以外,还有二个插段。插段A为F大调,要活跃,有灵气。插段B转入a小调,伴奏采用重复音造成一种神秘的气氛,重复音要弹奏均匀,音乐从弱起,慢慢地渐强到降B,情绪亦随之紧张,然后再松下来,渐弱,三连音的过渡句要一气呵成,弹得轻快连贯,自然地回到主旋律。献给爱丽丝》基于一个纯朴而亲切的主题:(见右谱)这个主题把特蕾泽温柔、美丽的形象作了概括的描绘。它在这支曲子里先后出现了十六次,因此,给人以极为深刻的印象。好似贝多芬有许多亲切的话语正向特蕾泽诉说。后半部分左右手交替演奏分解和弦,犹如二人亲切地交谈。《献给爱丽丝》全曲由五段组成。A段用的是A小调,显得温柔而亲切。然后,转到C大调,它是A小调的关系大调,情调顿时明朗起来。B段转到F大调上,出现一个新的曲调:(见左图)这个曲调,感情更加明朗。经过一连串快速音的过渡,又回到A段。C段多用和弦,气氛有了转换。情绪显得严肃而稳重,好似作者在沉思。接下去,出现了一个由三连音组成的乐句。表现热烈的情感。经过一段下行半音阶的过渡,又把乐曲引回到A段:(见右图)乐曲在非常优美和温柔的气氛中结束。
与其他的人工智能技术相比,情感分析(Sentiment Analysis)显得有些特殊,因为其他的领域都是根据客观的数据来进行分析和预测,但情感分析则带有强烈的个人主观因素。情感分析的目标是从文本中分析出人们对于实体及其属性所表达的情感倾向以及观点,这项技术最早的研究始于2003年Nasukawa和Yi两位学者的关于商品评论的论文。
随着推特等社交媒体以及电商平台的发展而产生大量带有观点的内容,给情感分析提供了所需的数据基础。时至今日,情感识别已经在多个领域被广泛的应用。例如在商品零售领域,用户的评价对于零售商和生产商都是非常重要的反馈信息,通过对海量用户的评价进行情感分析,可以量化用户对产品及其竞品的褒贬程度,从而了解用户对于产品的诉求以及自己产品与竞品的对比优劣。在社会舆情领域,通过分析大众对于社会热点事件的点评可以有效的掌握舆论的走向。在企业舆情方面,利用情感分析可以快速了解社会对企业的评价,为企业的战略规划提供决策依据,提升企业在市场中的竞争力。在金融交易领域,分析交易者对于股票及其他金融衍生品的态度,为行情交易提供辅助依据。
目前,绝大多数的人工智能开放平台都具备情感分析的能力,如图所示是玻森中文语义开放平台的情感分析功能演示,可以看出除了通用领域的情感分析外,还有汽车、厨具、餐饮、新闻和微博几个特定领域的分析。
那么到底什么是情感分析呢?从自然语言处理技术的角度来看,情感分析的任务是从评论的文本中提取出评论的实体,以及评论者对该实体所表达的情感倾向,自然语言所有的核心技术问题,例如:词汇语义,指代消解,此役小气,信息抽取,语义分析等都会在情感分析中用到。因此,情感分析被认为是一个自然语言处理的子任务,我们可以将人们对于某个实体目标的情感统一用一个五元组的格式来表示:(e,a,s,h,t)
以图为例,e是指某餐厅,a为该餐厅的性价比属性,s是对该餐厅的性价比表示了褒义的评价,h为发表评论者本人,t是19年7月27日。所以这条评论的情感分析可以表示为五元组(某餐厅,性价比,正向褒义,评论者,19年7月27日)。
情感分析根据处理文本颗粒度的不同,大致可以分为三个级别的任务,分别是篇章级、句子级和属性级。我们分别来看一下。
1 篇章级情感分析
篇章级情感分析的目标是判断整篇文档表达的是褒义还是贬义的情感,例如一篇书评,或者对某一个热点时事新闻发表的评论,只要待分析的文本超过了一句话的范畴,即可视为是篇章级的情感分析。
对于篇章级的情感分析而言有一个前提假设,那就是全篇章所表达的观点仅针对一个单独的实体e,且只包含一个观点持有者h的观点。这种做法将整个文档视为一个整体,不对篇章中包含的具体实体和实体属性进行研究,使得篇章级的情感分析在实际应用中比较局限,无法对一段文本中的多个实体进行单独分析,对于文本中多个观点持有者的观点也无法辨别。
例如评价的文本是:“我觉得这款手机很棒。”评价者表达的是对手机整体的褒义评价,但如果是:“我觉得这款手机拍照功能很不错,但信号不是很好”这样的句子,在同一个评论中出现了褒义词又出现了贬义词,篇章级的分析是无法分辨出来的,只能将其作为一个整体进行分析。
不过好在有很多的场景是不需要区分观点评价的实体和观点持有者,例如在商品评论的情感分析中,可以默认评论的对象是被评论的商品,评论的观点持有者也是评论者本人。当然,这个也需要看被评论的商品具体是什么东西,如果是亲子旅游这样的旅游服务,那么评论中就很有可能包含一个以上的观点持有者。
在实际工作中,篇章级的情感分析无法满足我们对于评价更细致,如果需要对评论进行更精确,更细致的分析,我们需要拆分篇章中的每一句话,这就是句子级的情感分析研究的问题。
2 句子级情感分析
与篇章级的情感分析类似,句子级的情感分析任务是判断一个句子表达的是褒义还是贬义的情感,虽然颗粒度到了句子层级,但是句子级分析与篇章级存在同样的前提假设是,那就是一个句子只表达了一个观点和一种情感,并且只有一个观点持有人。如果一个句子中包含了两种以上的评价或多个观点持有人的观点,句子级的分析是无法分辨的。好在现实生活中,绝大多数的句子都只表达了一种情感。
既然句子级的情感分析在局限性上与篇章级是一样的,那么进行句子级的情感分析意义何在呢?关于这个问题,需要先解释一下语言学上主观句与客观句的分别。在我们日常用语当中,根据语句中是否带有说话人的主观情感可以将句子分为主观句和客观句,例如:“我喜欢这款新手机。”就是一个主观句,表达了说话人内心的情感或观点,而:“这个APP昨天更新了新功能。”则是一个客观句,陈述的是一个客观事实性信息,并不包含说话人内心的主观情感。通过分辨一个句子是否是主观句,可以帮助我们过滤掉一部分不含情感的句子,让数据处理更有效率。
但是在实操过程中,我们会发现这样的分类方法似乎并不是特别准确,因为一个主观句也可能没有表达任何的情感信息,知识表达了期望或者猜测,例如:“我觉得他现在已经在回家的路上了。”这句话是一个主观句,表达了说话人的猜测,但是并没有表达出任何的情感。而客观句也有可能包含情感信息,表明说话者并不希望这个事实发生,例如:“昨天刚买的新车就被人刮花了。”这句话是一个客观句,但结合常识我们会发现,这句话中其实是包含了说话人的负面情感。
所以,仅仅对句子进行主客观的分类还不足以达到对数据进行过滤的要求,我们需要的是对句子是否含有情感信息进行分类,如果一个句子直接表达或隐含了情感信息,则认为这个句子是含有情感观点的,对于不含情感观点的句子则可以进行过滤。目前对于句子是否含有情感信息的分类技术大多都是采用有监督的学习算法,这种方法需要大量的人工标注数据,基于句子特征来对句子进行分类。
总之,我们可以将句子级的情感分析分成两步,第一步是判断待分析的句子是否含有观点信息,第二步则是针对这些含有观点信息的句子进行情感分析,发现其中情感的倾向性,判断是褒义还是贬义。关于分析情感倾向性的方法与篇章级类似,依然是可以采用监督学习或根据情感词词典的方法来处理,我们会在后续的小节详细讲解。
句子级的情感分析相较于篇章级而言,颗粒度更加细分,但同样只能判断整体的情感,忽略了对于被评价实体的属性。同时它也无法判断比较型的情感观点,例如:“A产品的用户体验比B产品好多了。”对于这样一句话中表达了多个情感的句子,我们不能将其简单的归类为褒义或贬义的情感,而是需要更进一步的细化颗粒度,对评价实体的属性进行抽取,并将属性与相关实体之间进行关联,这就是属性级情感分析。
3 属性级情感分析
上文介绍的篇章级和句子级的情感分析,都无法确切的知道评价者喜欢和不喜欢的具体是什么东西,同时也无法区分对某一个被评价实体的A属性持褒义倾向,对B属性却持贬义倾向的情况。但在实际的语言表达中,一个句子中可能包含了多个不同情感倾向的观点,例如:“我喜欢这家餐厅的装修风格,但菜的味道却很一般。”类似于这样的句子,很难通过篇章级和句子级的情感分析了解到对象的属性层面。
为了在句子级分析的基础上更加细化,我们需要从文本中发现或抽取评价的对象主体信息,并根据文本的上下文判断评价者针对每一个属性所表达的是褒义还是贬义的情感,这种就称之为属性级的情感分析。属性级的情感分析关注的是被评价实体及其属性,包括评价者以及评价时间,目标是挖掘与发现评论在实体及其属性上的观点信息,使之能够生成有关目标实体及其属性完整的五元组观点摘要。具体到技术层面来看,属性级的情感分析可以分为以下6个步骤:
关于文本中的实体抽取和指代消解问题,我们已经在知识图谱的相关章节中做了介绍,这里就不再赘述。针对篇章级、句子级、属性级这三种类型的情感分析任务,人们做了大量的研究并提出了很多分类的方法,这些方法大致可以分为基于词典和基于机器学习两种,下面我们进行详细的讲解。
做情感分析离不开情感词,情感词是承载情感信息最基本的单元,除了基本的词之外,一些包含了情感含义的短语和成语我们也将其统称为情感词。基于情感词典的情感分析方法,主要是基于一个包含了已标注的情感词和短语的词典,在这个词典中包括了情感词的情感倾向以及情感强度,一般将褒义的情感标注为正数,贬义的情感标注为负数。
具体的步骤如图所示,首先将待分析的文本先进行分词,并对分词后的结果做去除停用词和无用词等文本数据的预处理。然后将分词的结果与情感词典中的词进行匹配,并根据词典标注的情感分对文本进行加法计算,最终的计算结果如果为正则是褒义情感,如果为负则是贬义情感,如果为0或情感倾向不明显的得分则为中性情感或无情感。
情感词典是整个分析流程的核心,情感词标注数据的好坏直接决定了情感分类的结果,在这方面可以直接采用已有的开源情感词典,例如BosonNLP基于微博、新闻、论坛等数据来源构建的情感词典,知网(Hownet)情感词典,台湾大学简体中文情感极性词典(NTSUSD),snownlp框架的词典等,同时还可以使用哈工大整理的同义词词林拓展词典作为辅助,通过这个词典可以找到情感词的同义词,拓展情感词典的范围。
当然,我们也可以根据业务的需要来自己训练情感词典,目前主流的情感词词典有三种构建方法:人工方法、基于字典的方法和基于语料库的方法。对于情感词的情感赋值,最简单的方法是将所有的褒义情感词赋值为+1,贬义的情感词赋值为-1,最后进行相加得出情感分析的结果。
但是这种赋值方式显然不符合实际的需求,在实际的语言表达中,存在着非常多的表达方式可以改变情感的强度,最典型的就是程度副词。程度副词分为两种,一种是可以加强情感词原本的情感,这种称之为情感加强词,例如“很好”相较于“好”的情感程度会更强烈,“非常好”又比“很好”更强。另外一种是情感减弱词,例如“没那么好”虽然也是褒义倾向,但情感强度相较于“好”会弱很多。如果出现了增强词,则需要在原来的赋值基础上增加情感得分,如果出现了减弱词则需要减少相应的情感得分。
另一种需要注意的情况是否定词,否定词的出现一般会改变情感词原本的情感倾向,变为相反的情感,例如“不好”就是在“好”前面加上了否定词“不”,使之变成了贬义词。早期的研究会将否定词搭配的情感词直接取相反数,即如果“好”的情感倾向是+1,那么“不好”的情感倾向就是-1。但是这种简单粗暴的规则无法对应上真实的表达情感,例如“太好”是一个比“好”褒义倾向更强的词,如果“好”的值为+1,那么“太好”可以赋值为+3,加上否定词的“不太好”变成-3则显然有点过于贬义了,将其赋值为-1或者-05可能更合适。
基于这种情况,我们可以对否定词也添加上程度的赋值而不是简单的取相反数,对于表达强烈否定的词例如“不那么”赋值为±4,当遇到与褒义词的组合时褒义词则取负数,与贬义词的组合则取正数,例如贬义词“难听”的赋值是-3,加上否定词变成“不那么难听”的情感得分就会是(-3+4=1)。
第三种需要注意的情况是条件词,如果一个条件词出现在句子中,则这个句子很可能不适合用来做情感分析,例如“如果我明天可以去旅行,那么我一定会非常开心。”,在这句话中有明显的褒义情感词,但是因为存在条件词“如果”,使得这个句子的并没有表达观点持有者的真实情感,而是一种假设。
除了条件句之外,还有一种语言表达也是需要在数据预处理阶段进行排除的,那就是疑问句。例如“这个餐厅真的有你说的那么好吗?”,虽然句子中出现了很强烈的褒义情感词“那么好”,但依然不能将它分类为褒义句。疑问句通常会有固定的结尾词,例如“……吗?”或者“……么?”,但是也有的疑问句会省略掉结尾词,直接使用标点符号“?”,例如“你今天是不是不开心?”,这个句子中含有否定词和褒义词组成的“不开心”,但不能将其分类为贬义情感。
最后一种需要注意的情况是转折词,典型词是“但是”,出现在转折词之前的情感倾向通常与转折词之后的情感倾向相反,例如:“我上次在这家酒店的住宿体验非常好,但是这次却让我很失望。”在这个转折句中,转折词之前的“非常好”是一个很强的褒义词,但真实的情感表达却是转折词之后的“很失望”,最终应该将其分类为贬义情感。当然,也存在出现了转折词,但语句本身的情感并没有发生改变的情况,例如“你这次考试比上次有了很大的进步,但是我觉得你可以做得更好”,这里的转折词没有转折含义,而是一种递进含义。在实际操作中,我们所以需要先判断转折句真实的情感表达到底是哪个,才能进行正确的分析计算。
构建情感词典是一件比较耗费人工的事情,除了上述需要注意的问题外,还存在精准度不高,新词和网络用语难以快速收录进词典等问题。同时基于词典的分析方法也存在很多的局限性,例如一个句子可能出现了情感词,但并没有表达情感。或者一个句子不含任何情感词,但却蕴含了说话人的情感。以及部分情感词的含义会随着上下文语境的变化而变化的问题,例如“精明”这个词可以作为褒义词夸奖他人,也可以作为贬义词批评他人。
尽管目前存在诸多问题,但基于字典的情感分析方法也有着不可取代的优势,那就是这种分析方法通用性较强,大多数情况下无需特别的领域数据标注就可以分析文本所表达的情感,对于通用领域的情感分析可以将其作为首选的方案。
我们在机器学习算法的章节介绍过很多分类算法,例如逻辑回归、朴素贝叶斯、KNN等,这些算法都可以用于情感识别。具体的做法与机器学习一样需要分为两个步骤,第一步是根据训练数据构建算法模型,第二步是将测试数据输入到算法模型中输出对应的结果,接下来做具体的讲解。
首先,我们需要准备一些训练用的文本数据,并人工给这些数据做好情感分类的标注,通常的做法下,如果是褒义和贬义的两分类,则褒义标注为1,贬义标注为0,如果是褒义、贬义和中性三分类,则褒义标注为1,中性标注为0,贬义标注为-1
在这一环节中如果用纯人工方法来进行标注,可能会因为个人主观因素对标注的结果造成一定影响,为了避免人的因素带来的影响,也为了提高标注的效率,有一些其他取巧的方法来对数据进行自动标注。比如在电商领域中,商品的评论除了文本数据之外通常还会带有一个5星的等级评分,我们可以根据用户的5星评分作为标注依据,如果是1-2星则标注为贬义,如果是3星标注为中性,4-5星标注为褒义。又比如在社区领域中,很多社区会对帖子有赞和踩的功能,这一数据也可以作为情感标注的参考依据。
第二步是将标注好情感倾向的文本进行分词,并进行数据的预处理,前文已经对分词有了很多的介绍,这里就不再过多的赘述。第三步是从分词的结果中标注出具备情感特征的词,这里特别说一下,如果是对情感进行分类,可以参考情感词典进行标注,也可以采用TF-IDF算法自动抽取出文档的特征词进行标注。如果分析的是某个特定领域的,还需要标注出特定领域的词,例如做商品评价的情感分析,需要标注出商品名称,品类名称,属性名称等。第四步根据分词统计词频构建词袋模型,形成特征词矩阵,如表所示。在这一步可以根据业务需要给每个特征词赋予权重,并通过词频乘以权重得到特征词分数。最后一步就是根据分类算法,将特征词矩阵作为输入数据,得到最终的分类模型。
当训练好分类模型之后,就可以对测试集进行分类了,具体的流程与建模流程类似,先对测试的文本数据进行分词并做数据预处理,然后根据特征词矩阵抽取测试文本的特征词构建词袋矩阵,并将词袋矩阵的词频数据作为输入数据代入之前训练好的模型进行分类,得到分类的结果。
采用基于机器学习的方法进行情感分析有以下几个不足之处,第一是每一个应用领域之间的语言描述差异导致了训练得到的分类模型不能应用与其他的领域,需要单独构建。第二是最终的分类效果取决于训练文本的选择以及正确的情感标注,而人对于情感的理解带有主观性,如果标注出现偏差就会对最终的结果产生影响。
除了基于词典和基于机器学习的方法,也有一些学者将两者结合起来使用,弥补两种方法的缺点,比单独采用一种方法的分类效果要更好,另外,也有学者尝试使用基于LSTM等深度学习的方法对情感进行分析,相信在未来,情感分析会应用在更多的产品中,帮助我们更好的理解用户需求,提升用户使用智能产品的体验。
随着深度神经网络等算法的应用,情感分析的研究方向已经有了非常大的进展,但依然存在着一些难题是目前尚未解决的,在实操过程中需特别注意以下几种类型数据:
情绪轮在用户体验设计上被广泛的应用,很多情感化设计都是基于情绪轮进行的。但是在人工智能领域,将情绪进行多分类比情感分析的三分类任务要难得多,目前大多数分类方法的结果准确性都不到50%。这是因为情绪本身包含了太多的类别,而且不同的类别之间又可能具有相似性,一个情绪词在不同的语境下有可能表达的是不同的情绪类别,算法很难对其进行分类。即使是人工对文本进行情绪类别标注也往往效果不佳,因为情绪是非常主观性的,不同的人对不同的文本可能产生不同的理解,这使得人工标注情绪类比的过程异常困难。如何让机器可以理解真实的情绪目前还是一个未能攻克的难题。
了解用户情感需求
差异化战略,与他人拉开差距
加强情感营销
情感营销:挖掘用户内心真实情感,了解其内在需求,以便对症下药,设计出用户满意的产品和迎合用户心意的营销方案
情感需求分析就是通过各种方法和手段捕捉用户内心情感方面的信息,并对此进行深度分析,得出用户个人情感差异和内在需求的insight,并以此作为“绘制”产品用户画像的核心,最后借助于这些有价值的用户情感洞察,企业可以进行产品的情感包装、情感促销、情感广告、情感口碑、情感设计等策略,实现产品的各项经营目标。
情感需求分析就是通过各种方法和手段捕捉用户内心情感方面的信息,并对此进行深度分析,得出用户个人情感差异和内在需求的insight,并以此作为“绘制”产品用户画像的核心,最后借助于这些有价值的用户情感洞察,企业可以进行产品的情感包装、情感促销、情感广告、情感口碑、情感设计等策略,实现产品的各项经营目标。
案例
《陈思成:北京爱情故事之后,是上海3p故事》
文章带着一股怒气,替被出轨的女生出气,行为具有感染力,容易引发共鸣,引起好感。
《你永远也叫不醒一个想犯贱的人》
例举案例,得出结论,说明每个人都有跳火坑的权利,看似在骂人,却有一种恨铁不成钢的感觉,感觉朋友在劝你,劝不动容易引起好感。身在迷局中的人会在这一刻感觉咪蒙就是知心的姐姐。
咪蒙的文章非常具有煽动性,唤起用户的情绪,喜欢咪蒙的用户会认为咪蒙是真性情,不喜欢的用户会认为利己,煽动打动的情绪。会把用户的主人公定义为直男癌,low逼等,用户会产生情感的认同
怎么做情感分析?
心理投射的分析方法
投射在心理学上指的是个人思想态度愿望情绪,性格等个体特征不自觉的反应与外界事物和他人的一种心理作用。由于投射的存在,可以从一个人对别人的看法以及自身的兴趣爱好来推测这个人真正的意图或心理特征。
投射的心理过程是无意识运行的结果,对于投射者来说,这个心理过程的发生是毫无觉知和悄无声息的。个体在选择、关注或喜好某事物时,常常不自觉地将隐藏在内心的冲突和欲望融入这些事物中,借助于事物带将其宣泄出来,即把个人的内心世界投射于所参与的事物中。而我们通过对他们的选择、关注或喜好的事物(标签)的分析,从而了解其内心真正的需求。
观察人的思想愿望等,分析出心理特征
为什么要掌握这一项技能?
因为只有知道用户的心理特征,才能用最有效的方式去打动,让粉丝喜欢并支持。
案例:正确投射的例子有王老吉。怕上火喝王老吉。成功男士一年要逛两次海澜之家。买房是为了搞定丈母娘。
心理投射在商业场景中的应用
在无声场景有一句话移动互联网技术正深度影响今天主流的思维。
行为模式和生活方式,小米,苹果等既是一种圈层标签也是在表达自我的态度,微信朋友圈发布一条信息会泄露手机屏幕。同样起到作用的有智能屏幕,游戏电视、iPhone都是我们理解世界的方式。
需要用户的兴趣图幅,使用场景的同时,深入挖掘他们内心的情感需求,以此为依据,为其量身定制设计产品和营销方案,由此由内而外的打动用户。
Censydiam用户动机分析模型
两个维度:自我适应和释放压抑
心理投射是一种分析用户内心情感内在需求的方法论。实现用户情感分析需要将外在的标签转化为更加有价值的用户情感洞察,需要心理工具营销界广泛的一种模型。
自我适应维度表明人们在处理个体与社会关系的态度;释放压力维度体现出个体在对抗自卑情节时的态度
在面临需求问题和解决策略时,归属群体和做独立的自我之间进行权衡,二者经常是此消彼长的关系。
垂直维度:描述的是人们作为个体存在面临需求问题使的解决策略。
遇到一个问题两种选择:一种释放,大胆追求。一种是压制克制自己的欲望,将自己的欲望,泯灭在人性当中。
· 释放内心欲望,积极享受
· 回归内心理性,克制欲望
· 表达成功自我,渴望赞美
· 寻找群体归属,从众和谐
人性特征:享乐释放:一个追求自我释放和享乐的人,会无所顾忌,会在生理上和心理上去最大限度的满足自己的需求和欲望。(晚上推个夜宵)
理性控制:一个极力克制自我情感需求和内心欲望的人,会缺乏激情,甚至是循规蹈矩,没有个人的生活主张。
能力地位:当一个人的行为主要由“能力/地位”支配时,他会由内而外的确认自己的成功,追求内在的从容和坚定,追求外化的绫罗绸缎和锦衣玉食。同时,ta也渴望得到他人的赞美,希望在社会中有属于自己的一席之地。
顺从归属:当一个人的行为主要由“顺从/归属”来主导的时候,ta会希望自己成为某个群体的一份子,渴望从群体中获得支持,加强自己的力量。同时,ta也会尽力去遵守群体中的规则,不会独立特行,剑走偏锋。
两辆象限有交集,催生新的4个象限
活力/探索:就如大科学家牛顿所说,“真理的大海,让未发现的一切事物躺卧在我的眼前,任我去探寻”,拥有活力/探索这一特质的人对这个世界充满了好奇,他们渴望从未知的世界中汲取新的情感,不断冲破自己的极限,挑战自我,获得激情、冒险和速度所带来的快感。
融合/沟通:处在这一象限中的人们,总是愿意融入集体,与大家进行开放式的沟通,分享自己的欢愉与快乐,“感情和睦,没有隔阂”是其他人与他们相处时的感受。
舒适/安全:处在这一象限中的人们,总是希望获得内心的平静、放松与安宁,希望自己被呵护、被关怀,很多时候会,他们会通过捕捉如烟往事中的美好时光而得到慰藉。
个性/独特: 处于这一象限的人们,在保持理性的情况下,极力想获得他人的注意,想凸显自己的与众不同,万众瞩目能带给他们极强的的优越感,但要注意的是,这点和“能力/地位”不尽相同,渴望获得“个性/独特”的人们并不会表现出较强的“侵略性”,不会有强势和控制倾向。
建立模型,了解用户类型,把用户画像往里套
用户画像:爱旅游 美食 IT数码 美女 娱乐 幽默搞笑 体育 明星 音乐 90后
怎么用维度描述用户的情感分析?
制表分析图:
最想了解:放行个体独特型以及活力型
针对三种类型的用户进行针对性策略
享乐释放:一个追求自我释放和享乐的人,会无所顾忌,会在生理上和心理上去最大限度的满足自己的需求和欲望。
活力/探索:就如大科学家牛顿所说,“真理的大海,让未发现的一切事物躺卧在我的眼前,任我去探寻”,拥有活力/探索这一特质的人对这个世界充满了好奇,他们渴望从未知的世界中汲取新的情感,不断冲破自己的极限,挑战自我,获得激情、冒险和速度所带来的快感。
个性/独特: 处于这一象限的人们,在保持理性的情况下,极力想获得他人的注意,想凸显自己的与众不同,万众瞩目能带给他们极强的的优越感,但要注意的是,这点和“能力/地位”不尽相同,渴望获得“个性/独特”的人们并不会表现出较强的“侵略性”,不会有强势和控制倾向。
(90后身份标签)群体特点,带入模型,得出结论。
针对群体,运营战略。
针对父母,可以推出托儿服务。
个性独特:差异性战略
关键是战术和战略要匹配。
产品角度上来说范围成本时间缺一质量就会受到影响。
(以上改编自运营社读书会10 了不起薛定谔)
文学|编辑
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)