基于机器学习的情感分析是什么意思

基于机器学习的情感分析是什么意思,第1张

以下以语义特征为例:

机器学习基于语义特征的情感分析

基于语义特征的情感分析先人已有研究,可以通过情感词典匹配来做,但是应用机器学习在这方面会使精确度更高些。 

以本人参与的一个项目为主,总结下相关技术点。 

背景是:分析用户评论感情色彩是积极还是消极,即是褒还是贬。

具体步骤为: 

1有监督的人工给文本标注类标签。如有5000条评论数据,我们给其中的1000条标为积极的,再选1000条标为消极的,积极和消极就是所谓的类标签。 

2选择特征。从积极的评论数据中按词来选择积极的所有特征。同理,从消极的评论数据中按词来选择消极的所有特征。如“这款游戏非常好玩”->”这款”->“游戏”->”非常”->”好玩”,分为四个特征词,也可以采用双词搭配,“这个游戏”和“非常好玩”作为特征。 

3特征降维,减少特征的数量。如上“这个游戏非常好玩”中的“这个游戏”没有必要作为特征,因为“好玩”或“非常好玩”已经决定了评论是积极的。 

4将语料文本变成使用特征表示。 

5统计所有特征出现的次数,并按倒序排序。 

6从以上结果中选出排序最靠前的一些特征作为最终的评判特征。 

7使用训练数据根据特征训练分类算法,得到分类器。 

8用测试数据检测分类器的准确度。 

我们将数据分为两部分:开发集、测试集。用开发集的数据训练分类算法得到分类器;再用分类器对测试集里的数据进行分类,给出分类预测得到的标签;对比分类标签和人工标注得到的标签的差异,计算出准确度。

[第一阶段] 以心理诉求为主,整合各种传播工具,让消费者充分认识产品,建立品牌形象

[第二阶段] 以理性诉求为主,让消费者充分认识产品的利益点,明确核心价值

[第三阶段] 当潜在消费对象对产品有一定的认同和理解后,加大利益点、制造热点展开强势投放,对游离观望的买家做进一步的刺激,促进达成购买行为

传播的阶段组合

我提出五个传播阶段,分述如下:

第一阶段:筹备期 造势及策略拟定

任务:各项媒体研讨、制作、验收并完成公开前一切准备工作

工作重点:形象设计与营造 确定广告及媒体计划

第二阶段:公开试销期 打开知名度

任务:利用媒体、为产品形象打开知名度,让消费者产生期盼心理,酝酿大的气势

工作重点(如):重要地点路牌悬挂 刊登引导性报纸文稿

举行小型SP与PR活动

第三阶段:引销期 制造轰动聚人气

任务:以强势密集传播方式,塑造独特的形象,达成销售高潮及高成交率

工作重点:(如) 刊登公开报纸广告 举办SP与PR 活动

现场炒作与DS(直销)并行

发布新闻稿 大量发放宣传品

第四阶段:强销期 创造销售佳绩

任务:提高销售率,完善产品形象美誉度

工作重点:(如) 持续刊登报纸广告 大量发放宣传品

加强SP 与PR活动攻势

调整产品走势及销售情况并调整广告诉求主题

第五阶段:促销期 顺利达成销售目标

任务:塑造成功形象,补救销售死角,加强知名度,增加客户认同感,以达成圆满销售成果

工作重点:(如) 创再一波传播热潮 举办大型PR 活动 加强人员销售

以下是做传播规划前期的目录:

整合传播的目标(成为怎样的品牌)

为什么是这个目标(给传播目标做分解分析,找到合理可支撑的依据)

整合传播目标分解(递进式——近期中期远期 意思是每个阶段传播的意义和收获会是什么,用矩阵图来做)

整合传播的原则(整合性、互动式、全方位、差异化)

整合传播的策略(广告策略、招商策略、公关策略、终端策略)

整合传播的调性(围绕时代、情感、品质而设计的符合品牌本身和消费者需求的广告调性)

整合传播的阶段(在什么时间,选择什么样的媒体,投放什么样的广告,意义说明)

监督学习

目前,基于监督学习的情感分析仍然是主流,除了(Li et al,2009)基于非负矩阵三分解(Non-negative Matrix Tri-factorization),(Abbasi et al,2008)基于遗传算法(Genetic Algorithm)的情感分析之外,使用的最多的监督学习算法是朴素贝叶斯,k最近邻(k-Nearest Neighbor,k-NN),最大熵和支持向量机的。而对于算法的改进主要在对文本的预处理阶段。

基于规则/无监督学习

和基于监督学习的情感分析相比,基于规则和无监督学习方面的研究不是很多。除了(Turney,2002)之外,(朱嫣岚 et al,2002)利用HowNet对中文词语语义的进行了情感倾向计算。(娄德成 et al,2006)利用句法结构和依存关系对中文句子语义进行了情感分析,(Hiroshi et al,2004)通过改造一个基于规则的机器翻译器实现日文短语级情感分析,(Zagibalov et al,2008)在(Turney,2002)的SO-PMI算法的基础上通过对于中文文本特征的深入分析以及引入迭代机制从而在很大程度上提高了无监督学习情感分析的准确率。

跨领域情感分析

跨领域情感分析在情感分析中是一个新兴的领域,目前在这方面的研究不是很多,主要原因是目前的研究还没有很好的解决如何寻找两个领域之间的一种映射关系,或者说如何寻找两个领域之间特征权值之间的平衡关系。对于跨领域情感分析的研究开始于(Blitzer et al,2007)将结构对应学习(Structural Correspondence Learning,SCL)引入跨领域情感分析,SCL是一种应用范围很广的跨领域文本分析算法,SCL的目的是将训练集上的特征尽量对应到测试集中。(Tan et al,2009)将SCL引入了中文跨领域情感分析中。(Tan2 et al,2009)提出将朴素贝叶斯和EM算法的一种半监督学习方法应用到了跨领域的情感分析中。(Wu et al,2009)将基于EM的思想将图排序(Graph Ranking)算法应用到跨领域的情感分析中,图排序算法可以认为是一种迭代的k-NN

矩阵B=(A,b)表示的是分块矩阵B,并且是由矩阵A是一个列向量b组合而成的。

分块矩阵是一个矩阵, 它是把矩阵分别按照横竖分割成一些小的子矩阵 。 然后把每个小矩阵看成一个元素。

分块矩阵是处理阶数较高的矩阵时常采用的技巧,也是数学在多领域的研究工具。对矩阵进行适当分块,可使高阶矩阵的运算可以转化为低阶矩阵的运算,同时也使原矩阵的结构显得简单而清晰,从而能够大大简化运算步骤,或给矩阵的理论推导带来方便。

扩展资料:

分块矩阵的性质;

1、同结构的分块上(下)三角形矩阵的和(差)、积(若乘法运算能进行)仍是同结构的分块矩阵。

2、数乘分块上(下)三角形矩阵也是分块上(下)三角形矩阵。

3、分块上(下)三角形矩阵可逆的充分必要条件是的主对角线子块都可逆;若可逆,则的逆阵也是分块上(下)三角形矩阵。

-分块矩阵

MCN(多频道网络)是一种国外的网红经济运作,在制作、交互推广、合作管理、变现等领域提供帮助的组织。相当于自媒体联盟。

MCN的主要盈利是凭借自身资源签约自媒体拿广告分成的。一般是三七分来分成的。

好处:首先是技术上的扶持(例如:个人因某一个作品火爆,吸引力很多粉丝。但最后没有太多的思绪和精力有限的问题无法正常更新,从而导致掉粉。而MCN的作用就是帮助你进行内容更新,因为他们拥有编剧和策划团队来帮助自己的内容风格),其次就是对达人会有一个知识上的辅导。最后就是变现的

IP是互联网协议地址。意思就是计算机网络相互连接进行通信而设计的协议。

IP协议要求所有参加Internet的网络节点要有一个统一规定格式的地址,简称IP地址。在Internet网上,每个网络和每一台计算机都被分配有一个IP地址,这个IP地址在整个Internet网络中是唯一的。任何厂家生产的计算机系统,只要遵守 IP协议就可以与因特网互连互通。

自媒体矩阵就是在同一时间多个自媒体平台组合在一起,为同一个企业或者个人打造品牌进行产品销售的营销手段。平台最好是类别不一样的,多样化的有利于产生更大的流量,从而获得更大的收益。

通俗就是不管到哪一个平台用户都能看到我们的内容,通过视频、文章等一点一点的去渗透来加深自己的产品。

陈翔六点半

陈翔六点半是一名搞笑领域创作者。拥有5383万粉丝 其中阅读量最高阅读是69万阅读。

发文章时间大都是在下午5-7点之间,内容主要针对于搞笑视频方面,发布文章的数量平均每天发视频数量在2-6篇。

papi酱

papi酱是一名知名搞笑领域创作者。拥有3447万粉丝 其中阅读量最高阅读是220万阅读。

发文章时间大部分在下午期间,其中大都是在下午6点发布。内容主要针对于生活搞笑段子方面,发布文章的数量平均每个月发视频数量在3-5篇。

一禅小和尚

一禅小和尚是一名知名动漫领域创作者。拥有48054万粉丝  其中阅读量最高阅读是57万阅读。

发文章时间每隔2-4天发布文章或视频,发布文章大都在下午 最晚到8点发布。内容主要针对于情感方面的。发文章大都是每隔2-3天发布一篇。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/7828801.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-09-07
下一篇2023-09-07

发表评论

登录后才能评论

评论列表(0条)

    保存