目前深度学习在文本情感分析上都有哪些方法

目前深度学习在文本情感分析上都有哪些方法,第1张

计算机软、硬件资源协调运行的程序系统,由一系列具有不同控制和管理功能的程序组成,它是直接运行在计算机硬件上的、最基本的系统软件,是系统软件的核心。操作系统是计算机发展中的产物,它的主要目的有两个:一是方便用户使用计算机,是用户和计算机的接口。比如用户键入一条简单的命令就能自动完成复杂的功能,这就是操作系统帮助的结果;二是统一管理计算机系统的全部资源,合理组织计算机工作流程,以便充分、合理地发挥计算机的效率。操作系统通常应包括下列五大功能模块:

(1)处理器管理:当多

这是计算机世界的一个尚未开发的前沿:将各种人类情感转化成实实在在的数据。

起源

虽然之前也有一些相关工作,但目前公认的情感分析比较系统的研究工作开始于(Pang et al, 2002)基于监督学习(supervised learning)方法对**评论文本进行情感倾向性分类和(Turney,2002)基于无监督学习(unsupervised learning)对文本情感情感倾向性分类的研究。Pang et al, 2002)基于文本的N元语法(ngram)和词类(POS)等特征分别使用朴素贝叶斯(Naive Bayes),最大熵(Maximum Entropy)和支持向量机(Support Vector Machine,SVM)将文本情感倾向性分为正向和负向两类,将文本的情感进行二元划分的做法也一直沿用至今。同时他们在实验中使用**评论数据集目前已成为广泛使用的情感分析的测试集。(Turney ,2002)基于点互信息(Pointwise Mutual Information,PMI)计算文本中抽取的关键词和种子词(excellent,poor)的相似度来对文本的情感倾向性进行判别(SO-PMI算法)。在此之后的大部分都是基于(Pang et al, 2002)的研究。而相对来说,(Turney et al,2002)提出的无监督学习的方法虽然在实现上更加简单,但是由于单词之间的情感相似度难以准确的计算和种子词的难以确定,继续在无监督学习方向的研究并不是很多的,但是利用SO-PMI算法计算文本情感倾向性的思想却被很多研究者所继承了

本次实验将加载两个数据,一个是已经标注好的用户评论数据,另外一个是用户评价主题句,通过标注过的用户评论数据进行基于集成模型的情感极性模型训练,然后利用模型对主题句进行情感极性推理,最后通过数据聚合可视化得出主题情感极性。

使用 Pandas 加载在线数据表格,并查看数据维度和前 5 行数据。

数据属性如下表所示

加载我们之前通过主题词典提取出来的主题句。

数据属性如下表所示

用户评论分词

jieba 分词器预热,第一次使用需要加载字典和缓存,通过结果看出返回的是分词的列表。

批量对用户评价进行分词,需要一些时间,并打印第一行情感极性训练集的分词结果。

批量对用户评价主题句进行分词,并打印第一句用户主题句分词结果。

依据统计学模型假设,假设用户评论中的词语之间相互独立,用户评价中的每一个词语都是一个特征,我们直接使用 TF-IDF 对用户评价提取特征,并对提取特征后的用户评价输入分类模型进行分类,将类别输出为积极的概率作为用户极性映射即可。

用户评论向量化

TF-IDF 是一种用于信息检索与数据挖掘的常用加权技术,当某个词在文章中的TF-IDF越大,那么一般而言这个词在这篇文章的重要性会越高,比较适合对用户评论中的关键词进行量化。

数据集合划分

按照训练集 8 成和测试集 2 成的比例对数据集进行划分,并检查划分之后的数据集数量。

我们在系列实验的开始使用朴素贝叶斯模型来训练情感分析模型,下面我们新增逻辑回归模型作为对比模型。逻辑回归(Logistic Regression)是一种用于解决二分类问题的机器学习方法,在线性回归的基础上,套用了一个 sigmod 函数,这个函数将线性结果映射到一个概率区间,并且通常以 05 分界线,这就使得数据的分类结果都趋向于在 0 和 1 两端,将用户评论进行向量化之后也可以用此方式预测用户情感。本实验直接对标注过的用户情感数据进行训练,并验证单一模型和集成模型在情感分析性能上的差异。

模型加载

通过传入原始的标签和预测的标签可以直接将分类器性能进行度量,利用常用的分类模型评价指标对训练好的模型进行模型评价,accuracy_score 评价被正确预测的样本占总样本的比例,Precision 是衡量模型精确率的指标,它是指模型识别出的文档数与识别的文档总数的比率,衡量的是模型的查准率。Recall 召回率也称为敏感度,它是指模型识别出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率,表示正样本在被正确划分样本中所占的比例,f1_score 值是精确率与召回率的调和平均数,是一个综合性的指数。

我们分别对不同模型使用相同的数据集进行训练和测试,以此来比较单模型之间的差异,并打印模型运行时间供大家参考,批量处理不同的模型需要一些时间进行计算,清耐心等待。

通过求得的指标进行模型评价,我们发现使用相同的数据进行模型训练,朴素贝叶斯模型和逻辑回归模型性能基本持平,相差很微弱,逻辑回归稍稍占一些优势。

Stacking 堆栈模型训练

集成学习是地结合来自两个或多个基本机器学习算法的优势,学习如何最好地结合来自多个性能良好的机器学习模型的预测结果,并作出比集成中的任何一个模型更好的预测。主要分为 Bagging, Boosting 和 Stacking,Stacking 堆栈模型是集成机器学习模型的一种,具体是将训练好的所有基模型对整个训练集进行预测,然后将每个模型输出的预测结果合并为新的特征,并加以训练。主要能降低模型的过拟合风险,提高模型的准确度。

开始对两个模型进行集成训练,训练的时间要比单一模型时间久一些,清耐心等待。

评测结果收集。

结果分析

将结果存入 Dataframe 进行结果分析,lr 表示逻辑回归,nb 表示朴素贝叶斯,model_stacking 将两个单模型集成后的模型。从结果来看集成模型准确度和 f1 值都是最高的,结合两个模型的优势,整体预测性能更好,鲁棒性更好。

样例测试

通过测试样例发现,分类器对正常的积极和消极判断比较好。但是当我们改变语义信息,情感模型则不能进行识别,模型鲁棒性较差。作为早期的文本分类模型,我们使用 TFIDF 的特征提取方式并不能很好的解决语义问题,自然语言是带有语序和语义的关联,其词语之间的关联关系影响整句话的情感极性,后续我们继续试验深度情感分析模型研究解决此类问题。

加载民宿主题数据。

模型预测

将情感分析模型推理的结果写入 DataFrame 中进行聚合。

单主题聚合分析

挑选一个主题进行主题情感分析。

对民宿“设施”进行描述统计,此次我们使用主题词典的出来的用户关于民宿“设施”主体的讨论条数为 4628 条,平均用户情感极性为 040 表示为整体呈现不满意的情况,有超过一半的关于“设施”的民宿评论中表现用户不满意的情况,重庆民宿需要在“设施”进行改善,以此提高用户满意度。

单主题情感极性可视化

我们开始进行“设置”主题下的用户主题情感进行可视化,首先加载画图模块。

对“设施”主题下的用户情感极性进行可视化,我们利用集成模型对主题句进行情感极性预测,如下所示。

1、大数据情感分析是指利用大数据技术和自然语言处理技术,对海量的文本数据进行分析和挖掘,从中提取出文本中所包含的情感信息,

2、情感分析的主要目的是通过计算机技术和语言学知识,帮助人们更好地理解和分析大量的文本数据,并从中挖掘出有用的信息。

微博言论往往带有强烈的情感色彩,对微博言论的情感分析是获取用户观点态度的重要方法。许多学者都是将研究的重点集中在句子词性、情感符号以及情感语料库等方面,然而用户自身的情感倾向性并没有受到足够的重视,因此,提出了一种新的微博情感分类方法,其通过建模用户自身的情感标志得分来帮助识别语句的情感特征,具体地讲,将带有情感信息的微博语句词向量序列输入到长短期记忆网络(LSTM),并将LSTM输出的特征表示与用户情感得分进行结合作为全连接层的输入,并通过Softmax层实现了对微博文本的情感极性分类。实验表明,提出的方法UA-LSTM在情感分类任务上的表现超过的所有基准方法,并且比最优的基准方法MF-CNN在F1值上提升了34%,达到091。

关键词: 情感分析, 长短期记忆网络, 用户情感倾向

Abstract:

Micro-blog's speech often has strong sentimental color, and the sentiment analysis of Micro-blog's speech is an important way to get users' opinions and attitudes Many researchers conduct research via focusing on the parts of speech (POS), emotion symbol and emotion corpus This paper proposes a novel method for Micro-blog sentiment analysis, which aims to identify the sentiment features of a text by modeling user sentiment tendency Specifically, we construct a sentiment information embedded word embedding sequence, and input it into a long short term memory (LSTM) model to get a sentiment embedded output representation Then we merge both the user sentiment tendency score and the output representation of LSTM, and use it as the input of a fully connected layer which is followed by a softmax layer to get the final sentiment classification result The experiment shows that the performance of our proposed method UA-LSTM is better than all the baseline methods on the sentimental classification task, and it achieves the F1-score up to 091, with an improvement of 34% over the best baseline method MF-CNN

情感分析(Sentiment Analysis)

第一步,就是确定一个词是积极还是消极,是主观还是客观。这一步主要依靠词典。

英文已经有伟大词典资源:SentiWordNet 无论积极消极、主观客观,还有词语的情感强度值都一并拿下。

但在中文领域,判断积极和消极已经有不少词典资源,如Hownet,NTUSD但用过这些词典就知道,效果实在是不咋滴(最近还发现了大连理工发布的情感词汇本体库,不过没用过,不好评价)。中文这方面的开源真心不够英文的做得细致有效。而中文识别主客观,那真的是不能直视。

中文领域难度在于:词典资源质量不高,不细致。另外缺乏主客观词典。

第二步,就是识别一个句子是积极还是消极,是主观还是客观。

有词典的时候,好办。直接去匹配看一个句子有什么词典里面的词,然后加总就可以计算出句子的情感分值。

但由于不同领域有不同的情感词,比如看上面的例子,“蓝屏”这个词一般不会出现在情感词典之中,但这个词明显表达了不满的情绪。因此需要另外根据具体领域构建针对性的情感词典。

如果不那么麻烦,就可以用有监督的机器学习方法。把一堆评论扔到一个算法里面训练,训练得到分类器之后就可以把评论分成积极消极、主观客观了。

分成积极和消极也好办,还是上面那个例子。5颗星的评论一般来说是积极的,1到2颗星的评论一般是消极的,这样就可以不用人工标注,直接进行训练。但主客观就不行了,一般主客观还是需要人来判断。加上中文主客观词典不给力,这就让机器学习判断主客观更为困难。

中文领域的难度:还是词典太差。还有就是用机器学习方法判断主客观非常麻烦,一般需要人工标注。

另外中文也有找到过资源,比如这个用Python编写的类库:SnowNLP 就可以计算一句话的积极和消极情感值。但我没用过,具体效果不清楚。

到了第三步,情感挖掘就升级到意见挖掘(Opinion Mining)了。

这一步需要从评论中找出产品的属性。拿手机来说,屏幕、电池、售后等都是它的属性。到这一步就要看评论是如何评价这些属性的。比如说“屏幕不错”,这就是积极的。“电池一天都不够就用完了,坑爹啊”,这就是消极的,而且强度很大。

这就需要在情感分析的基础上,先挖掘出产品的属性,再分析对应属性的情感。

分析完每一条评论的所有属性的情感后,就可以汇总起来,形成消费者对一款产品各个部分的评价。

接下来还可以对比不同产品的评价,并且可视化出来。如图。

这一步的主要在于准确挖掘产品属性(一般用关联规则),并准确分析对应的情感倾向和情感强度。因此这需要情感分析作为基础。首先要找到评论里面的主观句子,再找主观句子里的产品属性,再计算属性对应的情感分。所以前面基础不牢固,后面要准确分析就有难度。

中文这个领域的研究其实很完善了,技术也很成熟。但需要完善前期情感分析的准确度。

总的来说,就是中文词典资源不好,工作做得不是很细很准。前期的一些基础不牢固,后面要得到准确的分析效果就不容易了。

文新研是一种基于自然语言处理技术的文本分析工具,能够对大规模的数据进行高效且准确的分析和处理。它主要包括文本分类、情感分析、实体识别、关键词提取、摘要生成等多个功能模块,可以广泛应用于舆情监测、市场研究、信息搜集等领域。

具体来说,文新研采用了机器学习、自然语言处理、信息抽取等多种技术手段,能够自动识别文本中的实体、关系和情感倾向,并对文本进行分类、聚类和摘要等处理。其中,情感分析能够准确判断文本中的情感极性,而实体识别可以自动识别出文本中的人名、地名、机构名等实体信息。

总之,文新研是一种强大的文本分析工具,可以帮助用户快速高效地处理海量文本数据,从中提取有价值的信息和洞见,为决策提供有力的支持。

情感教学的情感原则分析

 随着情感教学越来越被重视,老师有必要通过学习情感原则,运用积极情感在教学中的作用,更好地达到完成教学目标,优化教学过程。下面是我搜集整理的情感教学的情感原则分析论文,欢迎阅读借鉴。

  摘要: 为了使课堂教学更好的适应社会的发展,从根本上解决我国教学中“重知轻情”的状况,在教学中必须重视情感的作用。笔者分析了积极情感在教学中的重要作用后,从不同角度提出三点情感原则:快乐原则、动机原则和适应原则,并分析怎样通过这三点原则以达到提高教学目标,优化教学课堂并促进学生全面发展的教学目的。

  关键词: 情感 情感教学 积极情感 情感原则

 为了使课堂教学更好的适应社会的发展,从根本上改善我国教学中“重知轻情”的状况,在教学中必须重视情感的作用。笔者分析了积极情感在教学中的重要作用后,从不同的角度提出三点情感原则:快乐原则、动机原则和适应原则,并分析怎样通过这三点原则以达到提高教学目标,优化教学课堂并促进学生全面发展的教学目的。

 一、情感教学的含义

 “情感教学是一种教学理念,就是通过情感来优化教学。”具体的说,就是在充分考虑教学中认知因素的同时,又充分重视情感的作用,努力发挥其积极的作用以达到提高教学目标,优化教学课堂,最终促进学生全面发展的教学目的。其中包涵了两层意义:第一,在情感教学中要重视积极情感的作用。情感是一把双刃剑,有积极的一面也有消极的一面。积极情感,如自信,自尊,高兴等都有利于教学;而一些消极的情感如自卑,焦虑,沮丧等不仅给教学带来负面影响,还会阻碍学生的全面发展。“例如焦虑,会破坏大脑前额叶的神经环境,严重阻碍记忆功能的运转,大大的减弱了学习的能力。”所以在教学中要运用有利于教学的积极情感,尽量减少消极情感的产生来提高教学质量。第二,始终将学生的全面发展作为情感教学的目标。情感教学的最终目标不仅仅是教学本身,甚至超越了传统意义上的学术领域,而是促进学生的生理与精神上的全面发展。心理学家和作家Daniel Goleman博士曾有力地提出了对于所有教育制度需要扩大其任务范围。他指出尤其是在18世纪的西方教育中,人们一直致力于误用甚至是否认一切情感领域的问题或者可以称为“情感文盲”。他将“一种新的学校可实行的培养学生的方法——将能力与情感同时带进课堂”做为解决办法,并说明了许多在教学中运用情感的成功例子。我国多为应试教育,大多数学生只会做题,不会做人,因此将情感带入课堂更显得尤为重要。

 二、情感原则

 情感教学是一种教学理念。每一种教学理念在运用于实践时,首先一定需要建立相应的原则。简单的说就是老师在教学中需要借鉴和运用的一些情感规则。在我国的教学理念中,老师大多重视学生认知的发展,即使有一些教学上的情感原则也没有对情感教学的提高有所帮助。鉴此从教学心理学的不同角度,我们提出了三条情感原则:快乐原则,动机原则和适应原则。

 1快乐原则

 作为情感教学的基础,快乐原则取决于教学中产生的所有情感,重点关注其中积极情感的作用。例如,学生在上学之前刚刚挨了一顿骂,如果老师没有及时发现并正确开导学生,使其迅速调整状态,那该学生在此次课堂教学中的学习能力一定会受到影响。“快乐”在此有两种涵义:开心与兴趣。开心是兴趣的基础。情感教学心理学的研究将情绪(mood)分成了三种:基本情绪(emotion),感觉(feeling)和感知 (sentiment)。第一种满足人们日常生活中的生理需求;第二种包含了人们的社会情感需求如亲情,友情,爱情;第三种成为了人们情感中高级的社会需求如对知识,美的渴望。这三种感觉是递进的。只有当学生满足了前两种“开心”,才会相应的产生最后一种的“兴趣”。心理学家通过分析人的大脑得出当人的大脑接收到来自外界的刺激时,它会进行评价和做出相应的反应。评价的结果有两种,积极的与消极的,同样做出的反应也分为积极与消极。例如,如果一个老师在第一节课时留给学生深刻的良好的印象,学生的大脑就会对此老师做出积极的评价,此时他的积极的情感就会使其对老师所讲的内容感兴趣,从而达到了教学的目的。

 2动机原则

 有了学习的兴趣之后,更深入的情感的动机就成了学生学习的至关重要的因素。正如希尔加德所说的“精力充沛的行动会引导它的方向”。动机原则更多的被运用于学生第二语的教学中。Gardner和Lambert根据学习目的不同把动机区分为两大类:1)融合型动机(integrative motivation),指学习者对目的语社团有特殊兴趣,期望参与或融入该社团的社会生活;2)工具型动机(instrumental motivation),指学习者为了达到某种目的,如找工作,阅读和翻译技术资料等而学习语言的动机。Gardner认为:持融合型动机的学习者很可能比持工具型动机的学习者更成功,在特定的环境中,持工具型动机的学习者也有可能比持融合型动机的学习者更成功。从认知心理学角度出发,可以把动机分为内在动机和外在动机。内在动机(intrinsic motivation)是指学生的学习动力来源于自身的兴趣、爱好和求知欲等内在因素;外在动机(extrinsic motivation)是指学生受外部因素的推动而学习外语,如为了表扬,想要出国等。因此在情感教学中,老师应该更注重培养学生的工具型动机与内存动机。

 3适应原则

 适应原则考虑的是教学过程中的环境。我们可以将教学环境看作是一个电脑。外部环境如教室,书本等是其硬件设备,教学中的情感环境则是其软件设备。优质的硬件设备固然重要,但软件设备从本质上决定一台电脑的价值。适应原则正是要求老师无论是在课堂还是在课外的教学过程中,努力与学生建立积极的情感环境。教学是学生与老师围绕书本展开的一种行为活动。其目的是认知,但如果没有良好的情感环境,恐怕很难达到预期的教学目标。一项对309个在校学生的调查中显示,有70%的人同意对老师的态度直接与对其所教的内容的兴趣程度有关。

 三个情感原则既有区别也有联系。三个原则从不同的角度指导着教学。快乐原则基于教学中产生的所有情感因素,重点关注积极情感所起的作用;动机原则基于学生在学习过程中的不同的学习目的,重点关注积极情感作用下的动机怎样帮助学生更好的全面发展;适应原则则基于教学中积极的情感教学环境,重点关注良好的师生关系对教学的积极作用。

 虽然三个原则的着重点不同,但在一定意义上是相互重合的。例如,情感原则强调学生的积极的情感学习状态,这同样有助于建立一个良好的师生关系;动机原则强调积极的有利于教学和学习的情感动机,这也同样有助于培养学生的积极情感;适应原则强调情感的教学环境,这同样有助于培养学生的积极情感与认知动机。总之,老师在运用情感原则的过程中不仅要认识到其不同之处,更要将三者有机的结合在一起加以运用。

 一个好的教学过程包含认知与情感两个方面。随着情感教学越来越被重视,老师有必要通过学习情感原则,运用积极情感在教学中的作用,更好地达到完成教学目标,优化教学过程,最终促进学生全面发展的目的。这是一个较长的实践改变过程,只有在重视认知的基础上,靠对情感教学不断的研究改进、积累经验才能最终使情感教学真正的走进课堂。

 参考文献:

 [1]卢家楣情感教学心理学原理的实践运用[M]上海:上海教育出版社,2003

 [2]Arnold, Jane Cambridge Books for Language Teachers: Affect in Language Learning[M]Cambridge: Cambridge University Press,1999

 [3]Hilgard, E, R L Atkinson and R C Atkinson Introduction to Psychology[M] 7th edNew York: Harcourt Brace Jovanovich,1979

 [4] Gardner, R, P Smythe, R Clement, and L Gliksman "Second-Language learning: a social-psychological perspective" Canadian Modern Language Review ,1976,(32):199

;

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/7874934.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-09-07
下一篇2023-09-07

发表评论

登录后才能评论

评论列表(0条)

    保存