自然语言处理(NLP)在旅游领域具有广泛的应用,其中之一是情感分析。情感分析是指通过计算机程序来识别文本中的情感倾向,分析人们对旅游目的地、酒店、餐厅、交通工具等的评价。这种技术可以帮助旅游公司、酒店、餐厅等机构了解消费者的需求和喜好,改善服务质量和提高客户满意度。
一个典型的旅游情感分析应用是在线评论分析。在线评论是消费者对旅游目的地、酒店、餐厅等的反馈,通过使用 NLP 技术,旅游公司和酒店等机构可以分析这些评论,了解消费者对服务质量、位置、价格、餐饮等的看法。这些信息可以帮助他们改善服务质量、提高客户满意度。
另一个应用是社交媒体情感分析。社交媒体是消费者展示旅游经历的主要渠道,通过使用 NLP 技术,旅游公司和酒店等机构可以分析消费者在社交媒体上发布的文本、和视频,了解消费者对旅游目的地、酒店、餐厅等的感受。这些信息可以帮助他们改善服务质量、提高客户满意度、扩大品牌知名度。
此外,NLP还可以用于预测未来趋势,通过分析历史数据来预测旅游需求、价格趋势等,进而帮助旅游公司和酒店等机构调量、提高客户满意度。
NLP技术还可以用于语音识别和语音合成,在旅游领域中应用于语音导航、语音查询等场景。例如,旅游公司可以开发一款语音导航应用,让游客在旅游中使用语音命令来获取信息和导航。
总之,NLP在旅游领域有着广泛的应用,它可以帮助旅游公司、酒店、餐厅等机构了解消费者的需求和喜好,改善服务质量和提高客户满意度。通过使用NLP技术,旅游行业可以更好地了解客户,并提供更好的服务和体验。
本次实验将加载两个数据,一个是已经标注好的用户评论数据,另外一个是用户评价主题句,通过标注过的用户评论数据进行基于集成模型的情感极性模型训练,然后利用模型对主题句进行情感极性推理,最后通过数据聚合可视化得出主题情感极性。
使用 Pandas 加载在线数据表格,并查看数据维度和前 5 行数据。
数据属性如下表所示
加载我们之前通过主题词典提取出来的主题句。
数据属性如下表所示
用户评论分词
jieba 分词器预热,第一次使用需要加载字典和缓存,通过结果看出返回的是分词的列表。
批量对用户评价进行分词,需要一些时间,并打印第一行情感极性训练集的分词结果。
批量对用户评价主题句进行分词,并打印第一句用户主题句分词结果。
依据统计学模型假设,假设用户评论中的词语之间相互独立,用户评价中的每一个词语都是一个特征,我们直接使用 TF-IDF 对用户评价提取特征,并对提取特征后的用户评价输入分类模型进行分类,将类别输出为积极的概率作为用户极性映射即可。
用户评论向量化
TF-IDF 是一种用于信息检索与数据挖掘的常用加权技术,当某个词在文章中的TF-IDF越大,那么一般而言这个词在这篇文章的重要性会越高,比较适合对用户评论中的关键词进行量化。
数据集合划分
按照训练集 8 成和测试集 2 成的比例对数据集进行划分,并检查划分之后的数据集数量。
我们在系列实验的开始使用朴素贝叶斯模型来训练情感分析模型,下面我们新增逻辑回归模型作为对比模型。逻辑回归(Logistic Regression)是一种用于解决二分类问题的机器学习方法,在线性回归的基础上,套用了一个 sigmod 函数,这个函数将线性结果映射到一个概率区间,并且通常以 05 分界线,这就使得数据的分类结果都趋向于在 0 和 1 两端,将用户评论进行向量化之后也可以用此方式预测用户情感。本实验直接对标注过的用户情感数据进行训练,并验证单一模型和集成模型在情感分析性能上的差异。
模型加载
通过传入原始的标签和预测的标签可以直接将分类器性能进行度量,利用常用的分类模型评价指标对训练好的模型进行模型评价,accuracy_score 评价被正确预测的样本占总样本的比例,Precision 是衡量模型精确率的指标,它是指模型识别出的文档数与识别的文档总数的比率,衡量的是模型的查准率。Recall 召回率也称为敏感度,它是指模型识别出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率,表示正样本在被正确划分样本中所占的比例,f1_score 值是精确率与召回率的调和平均数,是一个综合性的指数。
我们分别对不同模型使用相同的数据集进行训练和测试,以此来比较单模型之间的差异,并打印模型运行时间供大家参考,批量处理不同的模型需要一些时间进行计算,清耐心等待。
通过求得的指标进行模型评价,我们发现使用相同的数据进行模型训练,朴素贝叶斯模型和逻辑回归模型性能基本持平,相差很微弱,逻辑回归稍稍占一些优势。
Stacking 堆栈模型训练
集成学习是地结合来自两个或多个基本机器学习算法的优势,学习如何最好地结合来自多个性能良好的机器学习模型的预测结果,并作出比集成中的任何一个模型更好的预测。主要分为 Bagging, Boosting 和 Stacking,Stacking 堆栈模型是集成机器学习模型的一种,具体是将训练好的所有基模型对整个训练集进行预测,然后将每个模型输出的预测结果合并为新的特征,并加以训练。主要能降低模型的过拟合风险,提高模型的准确度。
开始对两个模型进行集成训练,训练的时间要比单一模型时间久一些,清耐心等待。
评测结果收集。
结果分析
将结果存入 Dataframe 进行结果分析,lr 表示逻辑回归,nb 表示朴素贝叶斯,model_stacking 将两个单模型集成后的模型。从结果来看集成模型准确度和 f1 值都是最高的,结合两个模型的优势,整体预测性能更好,鲁棒性更好。
样例测试
通过测试样例发现,分类器对正常的积极和消极判断比较好。但是当我们改变语义信息,情感模型则不能进行识别,模型鲁棒性较差。作为早期的文本分类模型,我们使用 TFIDF 的特征提取方式并不能很好的解决语义问题,自然语言是带有语序和语义的关联,其词语之间的关联关系影响整句话的情感极性,后续我们继续试验深度情感分析模型研究解决此类问题。
加载民宿主题数据。
模型预测
将情感分析模型推理的结果写入 DataFrame 中进行聚合。
单主题聚合分析
挑选一个主题进行主题情感分析。
对民宿“设施”进行描述统计,此次我们使用主题词典的出来的用户关于民宿“设施”主体的讨论条数为 4628 条,平均用户情感极性为 040 表示为整体呈现不满意的情况,有超过一半的关于“设施”的民宿评论中表现用户不满意的情况,重庆民宿需要在“设施”进行改善,以此提高用户满意度。
单主题情感极性可视化
我们开始进行“设置”主题下的用户主题情感进行可视化,首先加载画图模块。
对“设施”主题下的用户情感极性进行可视化,我们利用集成模型对主题句进行情感极性预测,如下所示。
情感解析技术实质上也就是人工智能中的自然语言处理技术中的一种。
也许前两年我还很难回答你这个问题,不过随着机器学习技术、硬件迭代等因素这两年人工智能得到了极大的发展,自然语言处理也就有了越来越多地实用价值。
在正式回答你的问题之前,我们先要明白,作为人工智能技术基础的机器学习,其最重要的就是需要有充分大的样本数据进行训练,即需要先给机器一些已知“情感”的语言数据,才可以获取最终的解析引擎。这一点尤为重要,因为这决定了能产生使用价值的领域一定存在着易获取、易分析的语言数据才行。当然同时又要对顾客/消费者的情感反馈有着积极地需求。
以这两个为条件,那么结果显而易见了:
1、对话机器人。诸如微软小冰、苹果siri等。非常容易理解,因为“对话”本身就是语言数据之间的沟通,而情感数据作为从语言数据中提炼出来的附加价值信息,对智能对话机器人的“人性化”来说当然是有百利而无一弊。而且,对于这些大企业来说,巨量的语言数据也相当容易获取。
3、情绪客服质检。这是一个很容易被忽略的行业,但是确实人工智能情感解析最直接最有效的应用之一。试想一下,客服质检需要做的是什么工作:判断客服人员工作是否到位……传统的客服质检只能通过堆叠人力的方式,主观、抽样判断。而现有的所谓“客服质检”系统也只不过是关键词提取、匹配,根本不是质检。但是情绪解析的出现彻底改变了这一状况,其实也不难理解,因为判断客服工作最直接的指标不就是顾客的“满意程度”嘛,而通过情绪解析获取的顾客通话或文本输入中的“情感状态及变化趋势”不就满足了这一条件。唯一的一个问题就是这需要很强的情绪解析实践能力,对准确率和技术基础有着很高的要求,故目前为止也只有很少几家诸如语忆科技等提供商才有这样的技术。但事实上,客服质检一定会是最需要情绪解析的细分行业之一。
2、各种评论分析。这点也不难理解,在当今电商消费已经变成主流的网络时代,电商上会产生海量的评论数据。在以前,由于评论量不多,且是非结构化数据,文本处理能力又有限,导致品牌方们很难从中获取有用的信息,从而有巨量的评论数据被浪费。但是如今已经不一样了,像以上所提到的一些优秀的引擎提供商,不仅可以从评论中提取关键词、还能通过情绪解析明白用户的满意程度。一些上文提到的供应商有的还能做到对特定关键词的观点提取。这些都能帮助甲方从评论中挖掘非常有价值的消费者洞察。不难想象,一旦技术成熟,像评论一样的非结构化数据作为用户想法的直接传递,其价值将会远超那些“浏览量”“互动率”等结构化数据……
……
除此之外,还有如书籍分析归类、教育辅导优化、歌词台词总结等等很多应用场景,只不过有些商业价值不明显的领域仍然需要大胆的创新者去研究和开拓。不过无论如何,在这个人工智能兴起的时代,情绪解析仍处于朝阳时代,还具备着极大的潜力等待被挖掘~
本次实验将继续加载两个数据,一个是已经标注好的用户评论数据,另外一个是用户评价主题句,通过标注过的用户评论数据研究不同粒度的用户评价处理对深度情感分析模型的性能的影响,并比较字符级模型在用户评价情感极性推理上的差异。
使用 Pandas 加载已经标注好的在线用户评论情感数据表格,并查看数据维度和前 5 行数据。
加载民宿评论数据,并打印第一行。
数据属性如下表所示
用户评论分词
jieba 分词器预热,第一次使用需要加载字典和缓存,通过结果看出返回的是分词的列表。
批量对用户评价进行分词,并打印第一行数据,处理过程需要一些时间。
将用户评论处理成字符级别,为字符级模型提供训练集,并打印第一行数据,此预处理速度远远快于分词速度。
TextCNN 使用的卷积神经网络是一个典型的空间上的深度神经网络,基于卷积神经网络的情感分析具有优秀的特征抽取能力,能显著降低情感分类中人工抽取特征的难度。这类方法又根据文本嵌入粒度的不同可以分为字符级嵌入和词嵌入两种,一种是以分词后的词为情感分析粒度,另一种为字符级粒度的情感分析粒度,最后一层将包含全文潜在信息的最终编码送入 Sigmoid 做情感强度计算,即可对用户评论进行情感极性推理,是目前在文本分类经常使用的模型。
词级别模型训练
按照训练集 8 成和测试集 2 成的比例对数据集进行划分。
词级 TextCNN 模型训练,设置 128 条数据为一个批次,2 轮模型训练,训练集中的 20% 作为验证集,并加入早停设置。
通过传入原始的标签和预测的标签可以直接将分类器性能进行度量,并对指标收集,包含:模型的训练时间、accuracy_score 表示被正确预测的样本占总样本的比例、f1_score 值表示精确率与召回率的调和平均数和模型标签。
对训练的模型进行加载,并打印网络结构。
设置固定划分数据集,划分比例为 02 即训练集是测试集的 4 倍量。
字符级别模型训练
字符级 TextCNN 模型训练,设置 128 条数据为一个批次,2 轮模型训练,训练集中的 20% 作为验证集,并加入早停设置。
对字符级 TextCNN 的预测结果进行收集。
GRU 属于 RNN(recurrent neural networks,循环神经网络),是 LSTM 最流行的一个变体,比 LSTM 模型要简单,GRU 的门控单元减少了一个,GRU 与 LSTM 一样都是旨在解决标准 RNN 中出现的梯度消失问题,GRU 比 LSTM 在减少了计算量的条件下,做到了精度与 LSTM 持平,是目前在文本分类经常使用的模型。
我们使用函数定义的方式进行 GRU 模型的初始化。
对训练的模型进行加载,并打印网络结构。
词级别模型训练
词级 GRU 模型训练,设置 128 条数据为一个批次,2 轮模型训练,训练集中的 20% 作为验证集,并加入早停设置。
对训练的模型进行加载,并打印网络结构。
字符级别模型训练
将处理好的用户评论数据进行字符级处理即可输入字符级 GRU 模型训练,设置 128 条数据为一个批次,2 轮模型训练,训练集中的 20% 作为验证集,并加入早停设置。
对字符级 GRU 的测试集预测性能进行记录。
模型性能分析
通过控制参数变量的方式进行,并使用同样的数据集合观察性能指数测试结果。字符级能使用较小的字符级词典对语料的覆盖度更高,字符级预处理在测试集上的表现基本接近词级模型,并从耗时来看字符级都是最少的。TextCNN 架构总体高于 GRU 的准确度和综合值,并且训练时间相对较短。字符级语言建模的思想来自于信号处理,使用语言最小的文字单元去模拟复杂的语义关系,因为我们相信模型可以捕捉到这些语法和单词语义信息,在后续我们继续使用这种方式。
对用户评论数据预处理
对用户评论进行字符向量化。
情感极性推理
使用训练好的字符级 TextCNN 对用户评论进行情感预测,需要一些时间,请耐心等待。
使用训练好的字符级 GRU 对用户评论进行情感预测,需要一些时间,请耐心等待。
情感极性推理结果可视化
将两种字符级神经网络情感极性推理模型的结果取出来。
对全量的用户评论分别使用两个模型进行情感极性预测,并进行可视化,我们发现两种模型在全量的用户评论上的表现基本一致,字符级 TextCNN 在用户两极情感极性上表现更好。
微博言论往往带有强烈的情感色彩,对微博言论的情感分析是获取用户观点态度的重要方法。许多学者都是将研究的重点集中在句子词性、情感符号以及情感语料库等方面,然而用户自身的情感倾向性并没有受到足够的重视,因此,提出了一种新的微博情感分类方法,其通过建模用户自身的情感标志得分来帮助识别语句的情感特征,具体地讲,将带有情感信息的微博语句词向量序列输入到长短期记忆网络(LSTM),并将LSTM输出的特征表示与用户情感得分进行结合作为全连接层的输入,并通过Softmax层实现了对微博文本的情感极性分类。实验表明,提出的方法UA-LSTM在情感分类任务上的表现超过的所有基准方法,并且比最优的基准方法MF-CNN在F1值上提升了34%,达到091。
关键词: 情感分析, 长短期记忆网络, 用户情感倾向
Abstract:
Micro-blog's speech often has strong sentimental color, and the sentiment analysis of Micro-blog's speech is an important way to get users' opinions and attitudes Many researchers conduct research via focusing on the parts of speech (POS), emotion symbol and emotion corpus This paper proposes a novel method for Micro-blog sentiment analysis, which aims to identify the sentiment features of a text by modeling user sentiment tendency Specifically, we construct a sentiment information embedded word embedding sequence, and input it into a long short term memory (LSTM) model to get a sentiment embedded output representation Then we merge both the user sentiment tendency score and the output representation of LSTM, and use it as the input of a fully connected layer which is followed by a softmax layer to get the final sentiment classification result The experiment shows that the performance of our proposed method UA-LSTM is better than all the baseline methods on the sentimental classification task, and it achieves the F1-score up to 091, with an improvement of 34% over the best baseline method MF-CNN
首先,明确大学生网络舆论引导需要把握的几个问题
1大学生网络舆论引导中的语言把握。网络语言不同于现实生活中的语言,有自己特有的一套语言方式;大学生比较能够接受的语言方式也有其特点。因此,在针对大学生的网络舆论引导中,应该使用符合大学生接受习惯的,同时具有网络语言特点的语言进行引导。网络语言往往简洁明了、直观具体,复杂的含义用简单符号组合就可以表达清楚,同时网络语言有适度放弃词汇本义、在使用中尽可能地对传统语言做出偏离的倾向,语言的表现力很强。这种特点是与网民中18~24岁的年轻人占绝大多数的情况是相适应的。大学生在语言接受习惯上,反感说教式、灌输式的交流,认同与他们平等交流的语言方式。因此在网络舆论引导上,使用的语言方式应该首先是契合网络语言特征的,否则会显得与普通网民的话语格格不入,在形式上就遭到大学生的反感;其次,网络舆论引导中,很忌讳直接将理论灌输、说教用在网络中,应该调整角度,以大学生网友的身份,用亲切交流、友好相处的语言方式潜移默化的网络舆论引导;有时平等而激烈的争辩、尖刻但在理的讽刺反而会赢得大家的好感,这也是网络传播带来的人文精神普及之后的结果。只有契合网络特点、符合大学生接受习惯的语言方式,才有可能获得成功,这是在开展大学生网络舆论引导中必须要把握好的。
2大学生网络舆论心理特点的把握。大学生网络舆论表达是自我认知、自我实现的需要,他们认同并接纳尊重大学生思想、情感、态度等的行为和意见。把握大学生网络舆论行为的心理特点,对于提高网络舆论引导的针对性和有效性是非常重要的。
3大学生网上与网下行为反差的把握。调查发现,有一定比例的大学生在网络上的性格、行为、思想表达,与他们的现实生活往往存在一定程度的不吻合,呈现出某种反差。比如,平时腼腆内向的大学生,有可能在网上表现得率直冲动,敢想敢说;网上表现出来的思想情感不一定会落实在现实生活和实际行动当中,等等。这样的反差的确对提高网络舆论引导的针对性和有效性带来一定的困难,但是也说明了大学生网络舆论的情绪、思想容纳弹性比现实生活中要高一些,这为针对大学生的网络舆论引导工作中时机和度的把握提供了一定的启发。
大学生网络舆论引导的主要方式
舆论引导需要针对不同类型的舆论形态有针对性。研究表明,舆论形态主要有讯息形态的舆论、观念形态的舆论、艺术形态的舆论以及作为舆论畸变的形态——流言等主要类型。网络舆论的主要类型与传统形态的舆论类型基本上没有太大差别。不同类型舆论的引导方式是不同的。针对讯息形态的舆论,由于其强度相对较弱,发展方向也不十分明确,此时的适时引导有效性较强。观念形态的舆论则不同,如果被接受,有可能进一步内化为舆论的深层结构——信念;为公众及时提供符合一般社会规范的参照系,或改变公众已有的参照系,是媒介影响观念形态舆论的主要方式。艺术形态的舆论带有较多的情感色彩,观念的表达是间接的,这种舆论形态对社会可能造成的威胁是“舆论共振”,即在一个短时期内,社会中相当多的公众将注意力集中在一两件作品上,只有一种几乎一致的评价能够流通,不同意见很难有立足之地。对于这种形态的主要引导方式是舆论分流,既发表流行的评价意见,又有意多发表一些其他评价意见,使得过于集中的舆论得以分流,形成正常的舆论不一律的自然状态,在此基础上逐渐使得主旋律评价意见居于主导地位。流言是没有确切来源的在公众中流传的消息,主要是由于信息供给不能满足需求造成的,流言如果任其发展下去后果严重。及时、充分满足信息需求,同时给予适当的引导,可以有效消除流言。
大学生网络舆论的引导方式主要有说服和议程设置等,这也是基于大学生网络舆论特点和舆论引导的一般原理得出的结论。说服是通过传递视听信息有意识地对接受者的行为施加影响,按信息发出者的要求使对象自愿地改变态度或行为。说服总是从对象的特点、需求出发的,具有较强的理性思辨色彩。大学生较高的文化素养、总体理性的网络舆论行为特点为说服方式的有效开展提供了良好基础。
议程设置是媒介传播研究中的一个重要概念。如果将媒介报道和其他内容总体上作为一种传播形势和氛围,那么在一个较长时期内,它们会无形中给公众议程带来某种观念或新的议题,它的影响是潜移默化的、强大的。大学生网络舆论引导中的议程设置,主要目的是形成多个网络舆论的兴奋点,在设置过程中慢慢引导网络舆论改变原有状态,朝着预期的方向发展。由于网络舆论参与性、互动性很强,议程设置有较大的自由度和可能性,但与此同时,由于网络舆论自由度较大,如果议程设置不当,造成在一定的网络空间的议程设置招致反感,网络使用者会转移空间网络舆论行为,使得议程设置的效果适得其反。因此,针对大学生网络舆论的引导,在使用议程设置方式时,一定要有时机和度的准确把握,用适当的方式,才能收到预期的效果。
另外,努力通过网内外的引导促进大学生实现网络虚拟性与现实生活真实性的统一,帮助大学生以负责任的态度参与网络舆论
针对大学生的网络舆论引导工作,除了在网上开展针对性的引导之外,通过规范上网方式、完善网络管理制度也是引导网络舆论健康良性发展的重要举措。对于大学生网络世界的管理、规范和约束,除了道德约束之外,制定完善的网站管理制度等,都是有效的约束制度。这些制度的完善,可以在一定程度上确保大学生网络虚拟性存在与现实生活真实性的统一,促使他们对自己的网络舆论行为负责,认真对待实际上已经成为现实生活一部分的网络世界。
促进大学生主体实现网络虚拟性与现实生活真实性的统一,还应该适当对大学生中存在的网上和网下的行为反差现象进行引导。保持网络虚拟性与现实生活真实性的统一,是锻造健康人格的需要,也是对自己对社会负责任的需要。
网络舆论引导是一个全新的课题。生活在网络环境影响之中的当代大学生,在拥有比前辈更多的资源条件和资讯选择空间的同时,也面临更加复杂的成长环境。面对大学生网络舆论的不断兴盛,在看到存在各种各样的问题的同时,也必须充分认识网络舆论环境对于大学生成长的有利影响,只有这样才能顺应发展趋势,以正确的态度对待大学生网络舆论行为,并以大学生可以接受的方式开展有效的网络舆论引导。
情感分析可以细分成几个点:
1 主客观
2 观点句提取(评价对象--情感词)
3 情感极性判断
看看你要做的到底是哪个方面?
其中2是难度比较大的,特别是评价对象的提取。
都可以转化为分类问题,2可以参考一下淘宝的。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)