情感分析(又称为观点挖掘或感情AI)是指使用自然语言处理、文本分析、计算语言学和生物特征识别来系统地识别、提取、量化和研究情感状态和主观信息。情感分析广泛应用于分析客户的心声,如评论和调查回复,在线和社交媒体,以及从市场营销到客户服务再到临床医学的保健材料。
情感分析的一个基本任务是在文档、句子或特征/方面级别对给定文本的极性进行分类,判断在文档、句子或实体特征/方面中表达的意见是积极的、消极的还是中性的。高级的“超越极性”情感分类着眼于诸如“愤怒”、“悲伤”和“快乐”等情绪状态。
进行情感分析的先驱包括“一般询问者”(General Inquirer),它提供了量化文本模式的线索,另外,还提供了基于对人的言语行为进行分析来检查一个人的心理状态的心理学研究。
本文可以学习到以下内容:
数据及源码地址: https://giteecom/myrensheng/data_analysis
小凡,用户对耳机商品的评论信息,你有没有什么好的办法分析一下?经理来向小凡请教问题。
嗯,小凡想了一会儿
我想到了两种分析方法:
经理听完,甚是欣慰,便让小凡着手分析用户的评论数据。
数据解释:
小凡使用百度飞浆(paddlepaddle)模型库中的情感分析模型,将评论数据(content)转化为情感类别积极1,消极0
一、window10+anaconda3的安装命令:
二、安装预训练模型应用工具 PaddleHub
可以看到,大约 60% 的用户给出好评
用户的评论内容多集中在配置、音质等主题上
这里使用百度飞浆的LAC分词模型
分析结束后,小凡总结出以下结论:
小凡将结论汇报给经理,和经理一起想出一个可行的方案解决目前存在的问题。
通常来说,舆情分析系统的主要功能作用分为两大部分,一是舆情数据收据,二是舆情数据分析,以识微商情为例:
一、收集舆情数据
收集所有主流新闻、社交、视频等网站和App、博客、论坛等的公开提及。以企业为例,根据需求,通过关键词来设定监测主题,一般是监测品牌声誉、营销活动、竞争对手、行业动态、某个事件这几个方面。
二、舆情数据分析
1重点统计
重点统计提供了监测主题下一些重要数据的一个概览,比如相关信息总量、负面信息量、热门传播内容等,这样可以对于当前的情况有一个基本的了解。
2时间趋势
时间趋势,有些工具也可能叫发展趋势、舆情态势,指某个监测主题在某一段时间内的网络信息发展趋势。网络信息瞬息万变,趋势也是跟随着实时变化的。通过设定的关键词得到趋势数据后,可以直观的了解监测主题的整体舆情发展情况是上升还是下降,总结舆情传播的路径和特征,评估舆情发展阶段、预测未来趋势。
3情感分析
情感分析,也称为意见挖掘或情感AI,指分析在线文章以确定它们所承载的情感基调的过程。该过程背后的科学基于自然语言处理和机器学习的算法,将文章分类为正面、中性、负面。情感分析有助于找出发帖者对某个话题的态度。情绪分析会展现舆情整体情绪倾向,对网络上新闻媒体、网民的总态度进行正面、负面、中性(或非敏感、敏感)划分。如果监测的品牌、产品或服务的负面评价突然激增,则表明舆情危机可能正在酝酿中。
4话题分析
话题分析,指监测主题下被被多数表达的话题内容,可能是某个事件的关键事实、也可能是主流的观点。通过话题分析,可以把握事件声量倾向性、关键词、主要观点,以及其在媒体渠道的传播情况,话题分析模块中,一般从媒体报道和网民言论两方面进行分析,概括总结不同身份视角下的不同舆论声音,全面了解舆情聚焦方向。若媒体报道和网民言论趋同,也可合并划分。
5媒体类型
媒体类型,指信息传播媒介类型。通过媒体类型分析,可以了解到监测主题下的关注者、参与者、传播者主要分布在哪些渠道及每个渠道的传播趋势。通过对媒体类型的筛选,还可以了解到各个渠道上的情感倾向、话题倾向等多个维度数据。以此为依据,可以选择适合的渠道开展公关或者营销活动。
6属地分析
属地即IP归属地属地。6月27日,国家互联网信息办公室发布《互联网用户账号信息管理规定》,自2022年8月1日起施行。《规定》提出,在互联网用户账号信息页面展示合理范围内的互联网用户账号的互联网协议(IP)地址归属地信息,便于公众为公共利益实施监督。属地分析将呈现信息的地域分布,进一步了解不同地域间网民对监测主体的关注热度、分析关注人群的地域特征。
7热门网站
热门网站,即根据监测主题下产生信息较多的网站。通过对信息的分布渠道进行分析,了解舆情分布的平台情况,传播什么样的内容。企业可以结合媒体类型,为之后的活动传播渠道规划提供参考。
8热门文章
热门文章,即监测主题下获得较多传播的内容。一般从文章标题、信息来源、内容概要进行聚合分析,加入传播时间及转发量等方面考量,展现舆情传播中的热门内容。通过热门文章,方便快速了解监测期内舆情的重点事件或媒体的发文侧重点。
9热词分析
热词分析,即监测主题下被频繁使用的词组分析。通过热词分析,可以了解被舆论重点关注的事件关键信息、主流态度/观点等。
10信息类型
信息类型,即人群发布内容的类型,一般分为原贴、转发和评论。通过分析发文类型的占比情况、随时间各类型信息变化趋势,可以了解到人群对于事件的参与度,在舆情传播中的不同作用。一般评论较多的代表此事有更大的争议性,原贴、转帖占比更大的的代表人们更希望此事得到传播。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)