微博言论往往带有强烈的情感色彩,对微博言论的情感分析是获取用户观点态度的重要方法。许多学者都是将研究的重点集中在句子词性、情感符号以及情感语料库等方面,然而用户自身的情感倾向性并没有受到足够的重视,因此,提出了一种新的微博情感分类方法,其通过建模用户自身的情感标志得分来帮助识别语句的情感特征,具体地讲,将带有情感信息的微博语句词向量序列输入到长短期记忆网络(LSTM),并将LSTM输出的特征表示与用户情感得分进行结合作为全连接层的输入,并通过Softmax层实现了对微博文本的情感极性分类。实验表明,提出的方法UA-LSTM在情感分类任务上的表现超过的所有基准方法,并且比最优的基准方法MF-CNN在F1值上提升了34%,达到091。
关键词: 情感分析, 长短期记忆网络, 用户情感倾向
Abstract:
Micro-blog's speech often has strong sentimental color, and the sentiment analysis of Micro-blog's speech is an important way to get users' opinions and attitudes Many researchers conduct research via focusing on the parts of speech (POS), emotion symbol and emotion corpus This paper proposes a novel method for Micro-blog sentiment analysis, which aims to identify the sentiment features of a text by modeling user sentiment tendency Specifically, we construct a sentiment information embedded word embedding sequence, and input it into a long short term memory (LSTM) model to get a sentiment embedded output representation Then we merge both the user sentiment tendency score and the output representation of LSTM, and use it as the input of a fully connected layer which is followed by a softmax layer to get the final sentiment classification result The experiment shows that the performance of our proposed method UA-LSTM is better than all the baseline methods on the sentimental classification task, and it achieves the F1-score up to 091, with an improvement of 34% over the best baseline method MF-CNN
表达方式不同,用途不同。
1、表达方式不同。符号语言采用符号的方式进行表达语言,情感语言使用动作和语言文字进行表达。
2、用途不同。符号语言多用于专业数据的分析,情感语言用于文章的撰写。
情感教学的情感原则分析
随着情感教学越来越被重视,老师有必要通过学习情感原则,运用积极情感在教学中的作用,更好地达到完成教学目标,优化教学过程。下面是我搜集整理的情感教学的情感原则分析论文,欢迎阅读借鉴。
摘要: 为了使课堂教学更好的适应社会的发展,从根本上解决我国教学中“重知轻情”的状况,在教学中必须重视情感的作用。笔者分析了积极情感在教学中的重要作用后,从不同角度提出三点情感原则:快乐原则、动机原则和适应原则,并分析怎样通过这三点原则以达到提高教学目标,优化教学课堂并促进学生全面发展的教学目的。
关键词: 情感 情感教学 积极情感 情感原则
为了使课堂教学更好的适应社会的发展,从根本上改善我国教学中“重知轻情”的状况,在教学中必须重视情感的作用。笔者分析了积极情感在教学中的重要作用后,从不同的角度提出三点情感原则:快乐原则、动机原则和适应原则,并分析怎样通过这三点原则以达到提高教学目标,优化教学课堂并促进学生全面发展的教学目的。
一、情感教学的含义
“情感教学是一种教学理念,就是通过情感来优化教学。”具体的说,就是在充分考虑教学中认知因素的同时,又充分重视情感的作用,努力发挥其积极的作用以达到提高教学目标,优化教学课堂,最终促进学生全面发展的教学目的。其中包涵了两层意义:第一,在情感教学中要重视积极情感的作用。情感是一把双刃剑,有积极的一面也有消极的一面。积极情感,如自信,自尊,高兴等都有利于教学;而一些消极的情感如自卑,焦虑,沮丧等不仅给教学带来负面影响,还会阻碍学生的全面发展。“例如焦虑,会破坏大脑前额叶的神经环境,严重阻碍记忆功能的运转,大大的减弱了学习的能力。”所以在教学中要运用有利于教学的积极情感,尽量减少消极情感的产生来提高教学质量。第二,始终将学生的全面发展作为情感教学的目标。情感教学的最终目标不仅仅是教学本身,甚至超越了传统意义上的学术领域,而是促进学生的生理与精神上的全面发展。心理学家和作家Daniel Goleman博士曾有力地提出了对于所有教育制度需要扩大其任务范围。他指出尤其是在18世纪的西方教育中,人们一直致力于误用甚至是否认一切情感领域的问题或者可以称为“情感文盲”。他将“一种新的学校可实行的培养学生的方法——将能力与情感同时带进课堂”做为解决办法,并说明了许多在教学中运用情感的成功例子。我国多为应试教育,大多数学生只会做题,不会做人,因此将情感带入课堂更显得尤为重要。
二、情感原则
情感教学是一种教学理念。每一种教学理念在运用于实践时,首先一定需要建立相应的原则。简单的说就是老师在教学中需要借鉴和运用的一些情感规则。在我国的教学理念中,老师大多重视学生认知的发展,即使有一些教学上的情感原则也没有对情感教学的提高有所帮助。鉴此从教学心理学的不同角度,我们提出了三条情感原则:快乐原则,动机原则和适应原则。
1快乐原则
作为情感教学的基础,快乐原则取决于教学中产生的所有情感,重点关注其中积极情感的作用。例如,学生在上学之前刚刚挨了一顿骂,如果老师没有及时发现并正确开导学生,使其迅速调整状态,那该学生在此次课堂教学中的学习能力一定会受到影响。“快乐”在此有两种涵义:开心与兴趣。开心是兴趣的基础。情感教学心理学的研究将情绪(mood)分成了三种:基本情绪(emotion),感觉(feeling)和感知 (sentiment)。第一种满足人们日常生活中的生理需求;第二种包含了人们的社会情感需求如亲情,友情,爱情;第三种成为了人们情感中高级的社会需求如对知识,美的渴望。这三种感觉是递进的。只有当学生满足了前两种“开心”,才会相应的产生最后一种的“兴趣”。心理学家通过分析人的大脑得出当人的大脑接收到来自外界的刺激时,它会进行评价和做出相应的反应。评价的结果有两种,积极的与消极的,同样做出的反应也分为积极与消极。例如,如果一个老师在第一节课时留给学生深刻的良好的印象,学生的大脑就会对此老师做出积极的评价,此时他的积极的情感就会使其对老师所讲的内容感兴趣,从而达到了教学的目的。
2动机原则
有了学习的兴趣之后,更深入的情感的动机就成了学生学习的至关重要的因素。正如希尔加德所说的“精力充沛的行动会引导它的方向”。动机原则更多的被运用于学生第二语的教学中。Gardner和Lambert根据学习目的不同把动机区分为两大类:1)融合型动机(integrative motivation),指学习者对目的语社团有特殊兴趣,期望参与或融入该社团的社会生活;2)工具型动机(instrumental motivation),指学习者为了达到某种目的,如找工作,阅读和翻译技术资料等而学习语言的动机。Gardner认为:持融合型动机的学习者很可能比持工具型动机的学习者更成功,在特定的环境中,持工具型动机的学习者也有可能比持融合型动机的学习者更成功。从认知心理学角度出发,可以把动机分为内在动机和外在动机。内在动机(intrinsic motivation)是指学生的学习动力来源于自身的兴趣、爱好和求知欲等内在因素;外在动机(extrinsic motivation)是指学生受外部因素的推动而学习外语,如为了表扬,想要出国等。因此在情感教学中,老师应该更注重培养学生的工具型动机与内存动机。
3适应原则
适应原则考虑的是教学过程中的环境。我们可以将教学环境看作是一个电脑。外部环境如教室,书本等是其硬件设备,教学中的情感环境则是其软件设备。优质的硬件设备固然重要,但软件设备从本质上决定一台电脑的价值。适应原则正是要求老师无论是在课堂还是在课外的教学过程中,努力与学生建立积极的情感环境。教学是学生与老师围绕书本展开的一种行为活动。其目的是认知,但如果没有良好的情感环境,恐怕很难达到预期的教学目标。一项对309个在校学生的调查中显示,有70%的人同意对老师的态度直接与对其所教的内容的兴趣程度有关。
三个情感原则既有区别也有联系。三个原则从不同的角度指导着教学。快乐原则基于教学中产生的所有情感因素,重点关注积极情感所起的作用;动机原则基于学生在学习过程中的不同的学习目的,重点关注积极情感作用下的动机怎样帮助学生更好的全面发展;适应原则则基于教学中积极的情感教学环境,重点关注良好的师生关系对教学的积极作用。
虽然三个原则的着重点不同,但在一定意义上是相互重合的。例如,情感原则强调学生的积极的情感学习状态,这同样有助于建立一个良好的师生关系;动机原则强调积极的有利于教学和学习的情感动机,这也同样有助于培养学生的积极情感;适应原则强调情感的教学环境,这同样有助于培养学生的积极情感与认知动机。总之,老师在运用情感原则的过程中不仅要认识到其不同之处,更要将三者有机的结合在一起加以运用。
一个好的教学过程包含认知与情感两个方面。随着情感教学越来越被重视,老师有必要通过学习情感原则,运用积极情感在教学中的作用,更好地达到完成教学目标,优化教学过程,最终促进学生全面发展的目的。这是一个较长的实践改变过程,只有在重视认知的基础上,靠对情感教学不断的研究改进、积累经验才能最终使情感教学真正的走进课堂。
参考文献:
[1]卢家楣情感教学心理学原理的实践运用[M]上海:上海教育出版社,2003
[2]Arnold, Jane Cambridge Books for Language Teachers: Affect in Language Learning[M]Cambridge: Cambridge University Press,1999
[3]Hilgard, E, R L Atkinson and R C Atkinson Introduction to Psychology[M] 7th edNew York: Harcourt Brace Jovanovich,1979
[4] Gardner, R, P Smythe, R Clement, and L Gliksman "Second-Language learning: a social-psychological perspective" Canadian Modern Language Review ,1976,(32):199
;感情是个复杂的东西,很难处理。
对于您说叙述的感情问题,我的建议是:
感情的事情,勉强不来,既然小明和小红分手肯定证明了双方直接按存在了某种不可能的因素,所以不要强求,让他们随心而去。
小芳如果喜欢小明,那她可以去追求、发展,因为爱情不是某个人的私有。如果不喜欢,而是为了帮朋友,那我劝她进到朋友的基本义务就可以了,千万别陷入别人的感情纠纷,因为如果他们和好了,你会有功;没和好,过全在她。所以,感情的事,适度干预是可以的,一旦过了就会适得其反。
小芳的正确做法是:应该分别问问小红和小明对他们之间爱情的真实想法,然后适度帮忙。帮不了,要学会知难而退。你并不是上帝,不是万能的,不能什么事情都尽善尽美。
祝好运 望采纳。
与其他的人工智能技术相比,情感分析(Sentiment Analysis)显得有些特殊,因为其他的领域都是根据客观的数据来进行分析和预测,但情感分析则带有强烈的个人主观因素。情感分析的目标是从文本中分析出人们对于实体及其属性所表达的情感倾向以及观点,这项技术最早的研究始于2003年Nasukawa和Yi两位学者的关于商品评论的论文。
随着推特等社交媒体以及电商平台的发展而产生大量带有观点的内容,给情感分析提供了所需的数据基础。时至今日,情感识别已经在多个领域被广泛的应用。例如在商品零售领域,用户的评价对于零售商和生产商都是非常重要的反馈信息,通过对海量用户的评价进行情感分析,可以量化用户对产品及其竞品的褒贬程度,从而了解用户对于产品的诉求以及自己产品与竞品的对比优劣。在社会舆情领域,通过分析大众对于社会热点事件的点评可以有效的掌握舆论的走向。在企业舆情方面,利用情感分析可以快速了解社会对企业的评价,为企业的战略规划提供决策依据,提升企业在市场中的竞争力。在金融交易领域,分析交易者对于股票及其他金融衍生品的态度,为行情交易提供辅助依据。
目前,绝大多数的人工智能开放平台都具备情感分析的能力,如图所示是玻森中文语义开放平台的情感分析功能演示,可以看出除了通用领域的情感分析外,还有汽车、厨具、餐饮、新闻和微博几个特定领域的分析。
那么到底什么是情感分析呢?从自然语言处理技术的角度来看,情感分析的任务是从评论的文本中提取出评论的实体,以及评论者对该实体所表达的情感倾向,自然语言所有的核心技术问题,例如:词汇语义,指代消解,此役小气,信息抽取,语义分析等都会在情感分析中用到。因此,情感分析被认为是一个自然语言处理的子任务,我们可以将人们对于某个实体目标的情感统一用一个五元组的格式来表示:(e,a,s,h,t)
以图为例,e是指某餐厅,a为该餐厅的性价比属性,s是对该餐厅的性价比表示了褒义的评价,h为发表评论者本人,t是19年7月27日。所以这条评论的情感分析可以表示为五元组(某餐厅,性价比,正向褒义,评论者,19年7月27日)。
情感分析根据处理文本颗粒度的不同,大致可以分为三个级别的任务,分别是篇章级、句子级和属性级。我们分别来看一下。
1 篇章级情感分析
篇章级情感分析的目标是判断整篇文档表达的是褒义还是贬义的情感,例如一篇书评,或者对某一个热点时事新闻发表的评论,只要待分析的文本超过了一句话的范畴,即可视为是篇章级的情感分析。
对于篇章级的情感分析而言有一个前提假设,那就是全篇章所表达的观点仅针对一个单独的实体e,且只包含一个观点持有者h的观点。这种做法将整个文档视为一个整体,不对篇章中包含的具体实体和实体属性进行研究,使得篇章级的情感分析在实际应用中比较局限,无法对一段文本中的多个实体进行单独分析,对于文本中多个观点持有者的观点也无法辨别。
例如评价的文本是:“我觉得这款手机很棒。”评价者表达的是对手机整体的褒义评价,但如果是:“我觉得这款手机拍照功能很不错,但信号不是很好”这样的句子,在同一个评论中出现了褒义词又出现了贬义词,篇章级的分析是无法分辨出来的,只能将其作为一个整体进行分析。
不过好在有很多的场景是不需要区分观点评价的实体和观点持有者,例如在商品评论的情感分析中,可以默认评论的对象是被评论的商品,评论的观点持有者也是评论者本人。当然,这个也需要看被评论的商品具体是什么东西,如果是亲子旅游这样的旅游服务,那么评论中就很有可能包含一个以上的观点持有者。
在实际工作中,篇章级的情感分析无法满足我们对于评价更细致,如果需要对评论进行更精确,更细致的分析,我们需要拆分篇章中的每一句话,这就是句子级的情感分析研究的问题。
2 句子级情感分析
与篇章级的情感分析类似,句子级的情感分析任务是判断一个句子表达的是褒义还是贬义的情感,虽然颗粒度到了句子层级,但是句子级分析与篇章级存在同样的前提假设是,那就是一个句子只表达了一个观点和一种情感,并且只有一个观点持有人。如果一个句子中包含了两种以上的评价或多个观点持有人的观点,句子级的分析是无法分辨的。好在现实生活中,绝大多数的句子都只表达了一种情感。
既然句子级的情感分析在局限性上与篇章级是一样的,那么进行句子级的情感分析意义何在呢?关于这个问题,需要先解释一下语言学上主观句与客观句的分别。在我们日常用语当中,根据语句中是否带有说话人的主观情感可以将句子分为主观句和客观句,例如:“我喜欢这款新手机。”就是一个主观句,表达了说话人内心的情感或观点,而:“这个APP昨天更新了新功能。”则是一个客观句,陈述的是一个客观事实性信息,并不包含说话人内心的主观情感。通过分辨一个句子是否是主观句,可以帮助我们过滤掉一部分不含情感的句子,让数据处理更有效率。
但是在实操过程中,我们会发现这样的分类方法似乎并不是特别准确,因为一个主观句也可能没有表达任何的情感信息,知识表达了期望或者猜测,例如:“我觉得他现在已经在回家的路上了。”这句话是一个主观句,表达了说话人的猜测,但是并没有表达出任何的情感。而客观句也有可能包含情感信息,表明说话者并不希望这个事实发生,例如:“昨天刚买的新车就被人刮花了。”这句话是一个客观句,但结合常识我们会发现,这句话中其实是包含了说话人的负面情感。
所以,仅仅对句子进行主客观的分类还不足以达到对数据进行过滤的要求,我们需要的是对句子是否含有情感信息进行分类,如果一个句子直接表达或隐含了情感信息,则认为这个句子是含有情感观点的,对于不含情感观点的句子则可以进行过滤。目前对于句子是否含有情感信息的分类技术大多都是采用有监督的学习算法,这种方法需要大量的人工标注数据,基于句子特征来对句子进行分类。
总之,我们可以将句子级的情感分析分成两步,第一步是判断待分析的句子是否含有观点信息,第二步则是针对这些含有观点信息的句子进行情感分析,发现其中情感的倾向性,判断是褒义还是贬义。关于分析情感倾向性的方法与篇章级类似,依然是可以采用监督学习或根据情感词词典的方法来处理,我们会在后续的小节详细讲解。
句子级的情感分析相较于篇章级而言,颗粒度更加细分,但同样只能判断整体的情感,忽略了对于被评价实体的属性。同时它也无法判断比较型的情感观点,例如:“A产品的用户体验比B产品好多了。”对于这样一句话中表达了多个情感的句子,我们不能将其简单的归类为褒义或贬义的情感,而是需要更进一步的细化颗粒度,对评价实体的属性进行抽取,并将属性与相关实体之间进行关联,这就是属性级情感分析。
3 属性级情感分析
上文介绍的篇章级和句子级的情感分析,都无法确切的知道评价者喜欢和不喜欢的具体是什么东西,同时也无法区分对某一个被评价实体的A属性持褒义倾向,对B属性却持贬义倾向的情况。但在实际的语言表达中,一个句子中可能包含了多个不同情感倾向的观点,例如:“我喜欢这家餐厅的装修风格,但菜的味道却很一般。”类似于这样的句子,很难通过篇章级和句子级的情感分析了解到对象的属性层面。
为了在句子级分析的基础上更加细化,我们需要从文本中发现或抽取评价的对象主体信息,并根据文本的上下文判断评价者针对每一个属性所表达的是褒义还是贬义的情感,这种就称之为属性级的情感分析。属性级的情感分析关注的是被评价实体及其属性,包括评价者以及评价时间,目标是挖掘与发现评论在实体及其属性上的观点信息,使之能够生成有关目标实体及其属性完整的五元组观点摘要。具体到技术层面来看,属性级的情感分析可以分为以下6个步骤:
关于文本中的实体抽取和指代消解问题,我们已经在知识图谱的相关章节中做了介绍,这里就不再赘述。针对篇章级、句子级、属性级这三种类型的情感分析任务,人们做了大量的研究并提出了很多分类的方法,这些方法大致可以分为基于词典和基于机器学习两种,下面我们进行详细的讲解。
做情感分析离不开情感词,情感词是承载情感信息最基本的单元,除了基本的词之外,一些包含了情感含义的短语和成语我们也将其统称为情感词。基于情感词典的情感分析方法,主要是基于一个包含了已标注的情感词和短语的词典,在这个词典中包括了情感词的情感倾向以及情感强度,一般将褒义的情感标注为正数,贬义的情感标注为负数。
具体的步骤如图所示,首先将待分析的文本先进行分词,并对分词后的结果做去除停用词和无用词等文本数据的预处理。然后将分词的结果与情感词典中的词进行匹配,并根据词典标注的情感分对文本进行加法计算,最终的计算结果如果为正则是褒义情感,如果为负则是贬义情感,如果为0或情感倾向不明显的得分则为中性情感或无情感。
情感词典是整个分析流程的核心,情感词标注数据的好坏直接决定了情感分类的结果,在这方面可以直接采用已有的开源情感词典,例如BosonNLP基于微博、新闻、论坛等数据来源构建的情感词典,知网(Hownet)情感词典,台湾大学简体中文情感极性词典(NTSUSD),snownlp框架的词典等,同时还可以使用哈工大整理的同义词词林拓展词典作为辅助,通过这个词典可以找到情感词的同义词,拓展情感词典的范围。
当然,我们也可以根据业务的需要来自己训练情感词典,目前主流的情感词词典有三种构建方法:人工方法、基于字典的方法和基于语料库的方法。对于情感词的情感赋值,最简单的方法是将所有的褒义情感词赋值为+1,贬义的情感词赋值为-1,最后进行相加得出情感分析的结果。
但是这种赋值方式显然不符合实际的需求,在实际的语言表达中,存在着非常多的表达方式可以改变情感的强度,最典型的就是程度副词。程度副词分为两种,一种是可以加强情感词原本的情感,这种称之为情感加强词,例如“很好”相较于“好”的情感程度会更强烈,“非常好”又比“很好”更强。另外一种是情感减弱词,例如“没那么好”虽然也是褒义倾向,但情感强度相较于“好”会弱很多。如果出现了增强词,则需要在原来的赋值基础上增加情感得分,如果出现了减弱词则需要减少相应的情感得分。
另一种需要注意的情况是否定词,否定词的出现一般会改变情感词原本的情感倾向,变为相反的情感,例如“不好”就是在“好”前面加上了否定词“不”,使之变成了贬义词。早期的研究会将否定词搭配的情感词直接取相反数,即如果“好”的情感倾向是+1,那么“不好”的情感倾向就是-1。但是这种简单粗暴的规则无法对应上真实的表达情感,例如“太好”是一个比“好”褒义倾向更强的词,如果“好”的值为+1,那么“太好”可以赋值为+3,加上否定词的“不太好”变成-3则显然有点过于贬义了,将其赋值为-1或者-05可能更合适。
基于这种情况,我们可以对否定词也添加上程度的赋值而不是简单的取相反数,对于表达强烈否定的词例如“不那么”赋值为±4,当遇到与褒义词的组合时褒义词则取负数,与贬义词的组合则取正数,例如贬义词“难听”的赋值是-3,加上否定词变成“不那么难听”的情感得分就会是(-3+4=1)。
第三种需要注意的情况是条件词,如果一个条件词出现在句子中,则这个句子很可能不适合用来做情感分析,例如“如果我明天可以去旅行,那么我一定会非常开心。”,在这句话中有明显的褒义情感词,但是因为存在条件词“如果”,使得这个句子的并没有表达观点持有者的真实情感,而是一种假设。
除了条件句之外,还有一种语言表达也是需要在数据预处理阶段进行排除的,那就是疑问句。例如“这个餐厅真的有你说的那么好吗?”,虽然句子中出现了很强烈的褒义情感词“那么好”,但依然不能将它分类为褒义句。疑问句通常会有固定的结尾词,例如“……吗?”或者“……么?”,但是也有的疑问句会省略掉结尾词,直接使用标点符号“?”,例如“你今天是不是不开心?”,这个句子中含有否定词和褒义词组成的“不开心”,但不能将其分类为贬义情感。
最后一种需要注意的情况是转折词,典型词是“但是”,出现在转折词之前的情感倾向通常与转折词之后的情感倾向相反,例如:“我上次在这家酒店的住宿体验非常好,但是这次却让我很失望。”在这个转折句中,转折词之前的“非常好”是一个很强的褒义词,但真实的情感表达却是转折词之后的“很失望”,最终应该将其分类为贬义情感。当然,也存在出现了转折词,但语句本身的情感并没有发生改变的情况,例如“你这次考试比上次有了很大的进步,但是我觉得你可以做得更好”,这里的转折词没有转折含义,而是一种递进含义。在实际操作中,我们所以需要先判断转折句真实的情感表达到底是哪个,才能进行正确的分析计算。
构建情感词典是一件比较耗费人工的事情,除了上述需要注意的问题外,还存在精准度不高,新词和网络用语难以快速收录进词典等问题。同时基于词典的分析方法也存在很多的局限性,例如一个句子可能出现了情感词,但并没有表达情感。或者一个句子不含任何情感词,但却蕴含了说话人的情感。以及部分情感词的含义会随着上下文语境的变化而变化的问题,例如“精明”这个词可以作为褒义词夸奖他人,也可以作为贬义词批评他人。
尽管目前存在诸多问题,但基于字典的情感分析方法也有着不可取代的优势,那就是这种分析方法通用性较强,大多数情况下无需特别的领域数据标注就可以分析文本所表达的情感,对于通用领域的情感分析可以将其作为首选的方案。
我们在机器学习算法的章节介绍过很多分类算法,例如逻辑回归、朴素贝叶斯、KNN等,这些算法都可以用于情感识别。具体的做法与机器学习一样需要分为两个步骤,第一步是根据训练数据构建算法模型,第二步是将测试数据输入到算法模型中输出对应的结果,接下来做具体的讲解。
首先,我们需要准备一些训练用的文本数据,并人工给这些数据做好情感分类的标注,通常的做法下,如果是褒义和贬义的两分类,则褒义标注为1,贬义标注为0,如果是褒义、贬义和中性三分类,则褒义标注为1,中性标注为0,贬义标注为-1
在这一环节中如果用纯人工方法来进行标注,可能会因为个人主观因素对标注的结果造成一定影响,为了避免人的因素带来的影响,也为了提高标注的效率,有一些其他取巧的方法来对数据进行自动标注。比如在电商领域中,商品的评论除了文本数据之外通常还会带有一个5星的等级评分,我们可以根据用户的5星评分作为标注依据,如果是1-2星则标注为贬义,如果是3星标注为中性,4-5星标注为褒义。又比如在社区领域中,很多社区会对帖子有赞和踩的功能,这一数据也可以作为情感标注的参考依据。
第二步是将标注好情感倾向的文本进行分词,并进行数据的预处理,前文已经对分词有了很多的介绍,这里就不再过多的赘述。第三步是从分词的结果中标注出具备情感特征的词,这里特别说一下,如果是对情感进行分类,可以参考情感词典进行标注,也可以采用TF-IDF算法自动抽取出文档的特征词进行标注。如果分析的是某个特定领域的,还需要标注出特定领域的词,例如做商品评价的情感分析,需要标注出商品名称,品类名称,属性名称等。第四步根据分词统计词频构建词袋模型,形成特征词矩阵,如表所示。在这一步可以根据业务需要给每个特征词赋予权重,并通过词频乘以权重得到特征词分数。最后一步就是根据分类算法,将特征词矩阵作为输入数据,得到最终的分类模型。
当训练好分类模型之后,就可以对测试集进行分类了,具体的流程与建模流程类似,先对测试的文本数据进行分词并做数据预处理,然后根据特征词矩阵抽取测试文本的特征词构建词袋矩阵,并将词袋矩阵的词频数据作为输入数据代入之前训练好的模型进行分类,得到分类的结果。
采用基于机器学习的方法进行情感分析有以下几个不足之处,第一是每一个应用领域之间的语言描述差异导致了训练得到的分类模型不能应用与其他的领域,需要单独构建。第二是最终的分类效果取决于训练文本的选择以及正确的情感标注,而人对于情感的理解带有主观性,如果标注出现偏差就会对最终的结果产生影响。
除了基于词典和基于机器学习的方法,也有一些学者将两者结合起来使用,弥补两种方法的缺点,比单独采用一种方法的分类效果要更好,另外,也有学者尝试使用基于LSTM等深度学习的方法对情感进行分析,相信在未来,情感分析会应用在更多的产品中,帮助我们更好的理解用户需求,提升用户使用智能产品的体验。
随着深度神经网络等算法的应用,情感分析的研究方向已经有了非常大的进展,但依然存在着一些难题是目前尚未解决的,在实操过程中需特别注意以下几种类型数据:
情绪轮在用户体验设计上被广泛的应用,很多情感化设计都是基于情绪轮进行的。但是在人工智能领域,将情绪进行多分类比情感分析的三分类任务要难得多,目前大多数分类方法的结果准确性都不到50%。这是因为情绪本身包含了太多的类别,而且不同的类别之间又可能具有相似性,一个情绪词在不同的语境下有可能表达的是不同的情绪类别,算法很难对其进行分类。即使是人工对文本进行情绪类别标注也往往效果不佳,因为情绪是非常主观性的,不同的人对不同的文本可能产生不同的理解,这使得人工标注情绪类比的过程异常困难。如何让机器可以理解真实的情绪目前还是一个未能攻克的难题。
文中写“我”对奶奶的三次呼喊:“奶奶。”“奶奶!”“奶奶”,句中标点符号的变化细腻地表达“我”从有一点不安,到急于求得原谅,最后到无奈哀求的情感变化过程。
这句话出自史铁生《奶奶的星星》文章,表现奶奶为了孙子甘愿牺牲、乐于奉献的形象,二是借星星表达对奶奶的无尽怀念。奶奶为我哼唱催眠曲,哄我入眠;我决心长大后挣钱买东西孝敬奶奶;我给奶奶踩腰、踩背;奶奶看姨奶奶因风雪没带我;奶奶在夏夜为我讲故事、轰蚊子。
与众不同体现在不是说地上死一个人,天上就熄灭了一颗星星,而是说,地上死一个人,天上就又多了一个星星。体现奶奶朴实善良、无私奉献、关爱后辈的形象。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)