如何对新闻评论分词,情感分析

如何对新闻评论分词,情感分析,第1张

新闻情感分析它是新闻内容评论及转发的情感分析的集合,因为每一起舆情事件的信息类型都是由原贴、转发以及评论构成。

那么当网络上有与己相关的舆情事件发生,或想要关注的舆情事件发生时,我们应该如何掌握其情感倾向或各情绪的占比情况,以评估事态影响,采取针对性的应对措施呢?

新闻情感分析解决方法

在这里以新闻情感分析工具-识微商情为例,看其如何助力新闻情感分析工作开展:

1舆情数据收集:可根据用户需求,自动对全网的舆情数据进行采集,释放人力,关注信息一目了然。

2语义分析:这就包括原贴、转发以及评论,用户也可以自定义筛选某一信息类型。通过监测关于某一个特定主题的正负面中立意见,可自动识别文本中各种情感是如何表达的,然后通过内置的告警通知,向舆情接收者发出通知(用户可自定义舆情预警接收方式,如微信、短信、邮件、客户端、人工客服等)。

3全面综合分析:除新闻情感分析之外,还能实时追踪已订阅主题的发展变化趋势,分析舆情事件在各生命周期阶段的热点话题,挖掘舆情事件在演化过程中的传播网站、传播媒体、关键传播节点以及传播溯源、同步生成可视化的分析图表和报告等,便于对网络舆情事件的发展变化趋势做出有效的预测,为舆情应对、引导以及工作总结提供助力。

作为用户研究常用的方法范式,质性研究为我们的提供了挖掘用户需求、发现产品痛点、评估用户体验的可能。不管是可用性测试、任务分析,还是开放式问卷,都带有质性研究的属性。

基于这些问题,本篇以网易某产品app中一个页面的可用性测试为例,介绍用研中Atlasti这款质性研究工具的使用技巧和业务用途,让大家了解如何通过工具的使用来更有效地发现产品中的痛点和潜在的用户需求。

我们日常中接触到的信息资料,大多以质性资料(亦即定性资料)的形式存储,诸如文本、多媒体材料等举不胜数。可以说,质性资料中包含着丰富的信息,也蕴含着极高的价值。以用户研究来说,质性资料的获得的形式、获取渠道丰富而可观:

得到这些资料并完成预处理后,我们就会开始质性分析的分析过程,狭义上的质性研究也是从这里开始的。

一般来说,对质性资料的处理要经过开放式编码、轴心式编码、选择式编码这样一个循序渐进的过程,从最初简单的编码到编码簇与编码关联的建立,再到核心编码的确认。通过逐步深入、逐步凝练的过程,我们就可以从最初的原始资料中获得质性结论,最后则是结论的报表或可视化展现。

然而长久以来,质性研究的热度似乎始终低于量化研究,即使是在学术领域,质性研究也只得到了一小部分学者的青睐。究其原因,我们认为或许是因为这些:

质性研究的资料分析过程对任何人来说都是一件令人头疼的事——资料庞杂、程序繁琐、耗费时力,所以工具的选用对于质性研究来说就变得非常有必要,这既让我们的工作更便捷,也让我们的研究结果更可靠。

目前较为成熟、常用的质性研究工具也有不少,本篇以Atlasti 75版本为例,首先会介绍Atlasti 75的基本情况,然后通过一个用研可用性测试案例说明如何通过Atlasti对资料进行挖掘。

以2016年初我们进行的一项针对网易某产品App的可用性测试为例,出于案例说明简易性的需要,我们选择了此次可用性测试的一部分即针对该app投资理财页面的局部可用性测试进行介绍。

此次可用性测试中,我们重点考察了2部分,第一部分是用户对App页面信息结构认知的心理模型,第二部分是用户对页面内不同区块间信息架构差异的感知。

在用户筛选方面,我们依据产品的业务特征、产品使用场景特征等,选择了理财、支付、支付+理财以及游戏支付用户共4类。

此前的用户研究工作中我们已发现,用户在移动端选择互联网理财产品的心理模型是先了解所有理财产品类别,再确定目标理财产品类别,最后在已确定的类别中选择具体的理财产品。所以,针对该页面的可用性测试中,我们依据该行为模型设计了一些列任务要求用户完成,希望从中发现我们产品中存在的一些可用性问题。

作为质性研究常用工具之一,Atlasti最初是在大约1990年,由德国学术研究者出于研究需要而开发的一款质性资料分析工具。目前该工具已升级到75版本,最新的第8代也即将到来。自从问世以来,Atlasti已经逐渐在语言学、心理学、计算机等多个领域的学术研究中被广泛使用。

外观上,Atlasti 75版本与一般图形界面工具并无太大差异,也包括菜单栏、工具栏、工作区域等控件。值得关注的是Atlasti 75中的几个重要快捷功能区域,了解这些区域对其使用和后面的案例介绍非常有必要,所以这里先做一下简要的介绍:

当我们完成资料的搜集后,一般需要对资料做一个简单地整理,这个过程是通过“文档管理器”完成的——通过要点击Atlasti第一个快捷管理器的“P-Doc”按钮进入。

在文档管理器中可以看到,Atlasti支持的质性材料类型非常丰富, 文本 (txt、doc、pdf等)、 富媒体材料 (音频、视频、)、 谷歌地图文件 等。当然,用研中经常使用的 开放式问卷 (excel文件)也可以直接导入到Atlasti中。如下图所示,本篇所用案例仅涉及doc、txt、这3种材料,共计7个文件。

对文档的管理除了重命名、编写备忘录等最基本的操作之外,最重要的是对文档进行分组——在Atlasti中叫做“ 文档家族管理 ”。如下图界面区域的左侧,是本篇所用案例中依据用户类型、性别两个指标建立的6个“文档家族”(Documents familiy)。

文档分组(建立文档家族)让我们了解到这次研究项目的整体情况,例如如此次用户研究项目共涉及4种类型的用户。同时,后续还可以以此为基础,比较质性分析结果在不同组间的差异,让我们的结论更深入、具体,例如理财用户和支付用户对界面架构感知的差异——这一点是本篇后面分析环节的一个重点。

按照质性分析流程,获得文档并进行初步管理后,就可以开始分析过程了,而质性分析通常又是从资料的编码开始的。由于在用研中获得的质性资料形式是各种各样的,下面介绍的文档编码分析也会依据资料类型的不同展开详述。

开放式问卷也是用研中经常见到的一种资料收集方式,其独特性在于开放式问卷中不仅包含开放式问题,也包含各种定量数据如性别、收入水平、教育水平等。

但在处理开放式问卷方面,Atlasti还有一个突出优势,就是它不仅能够解读开放式问题的答案,而且能够依据定量指标建立分组(类似于在文档管理器中“新建文档家族”),让我们更深入地解读开放式问题的答案在不同分组之间的差异。

通过上述操作完成所有资料的编码后,我们可以在Atlasti的“编码管理器”中查看所有编码,如下图所示,本篇案例中我们一共获得了13个一级编码。

如上图所示,我们发现在本次测试的app中,理财产品的现有分类方式导致用户无法直观了解到所有理财产品的类别这一问题最为突出(走下角红色字体),而对应的用户期望(潜在的解决办法)中“直接提供一个理财产品排列的子导航条”也最为突出。另外,点击该编码会弹出一个新的对话框,对话框中列出了该编码对应的原始文本资料,让我们可以快速回查原始记录。

编码云只能让我们了解到问题点的状况,为了进一步了解每个问题的详情,例如该问题产品的结果等等,我们还需要为每个编码建立语义网络。建立网络视图的基本步骤如下:

通过语义网络分析我们发现,“理财产品分类不容易看全”这一问题导致了“用户认为理财产品的选择很麻烦”和“直接跳过靠后的理财产品”这两个问题。同时,我们还看到伴随这一问题出现了2个用户的期望,包括“用户希望直接给出一个理财分析的子导航条”和“按照一个直观、易习得的方式排列理财产品”。

如图所示,我们在可用性测试中发现的一个问题,可能对应着不止一个解决办法,那么该如何决定那种解决办法更为用户所期许呢?这一问题既是用户研究需要回答的问题,也是产品优化所必需的答案。这里我们就需要使用Atlasti的分析功能来回答这个问题了。

通过共现列表我们发现,对于“理财产品分类不容易看全”这一问题,用户更偏向的是“直接提供一个理财产品排列的子导航条”这一解决方式。

通过编码共现分析,我们回答了每个问题对应的用户期望或解决办法中应该选择哪个的问题。但是我们还注意到,由于此次可用性测试涉及4种不同类型的用户,其中“理财”和“理财+支付”用户都具有理财经验,而“支付”和“游戏支付”用户则不具有理财经验;换句话说,此次可用性测试涉及理财老用户和理财新用户,他们在可用性测试任务中遇到的问题是否有所差异?

接下来,我们将通过编码-文档共现分析来对这一问题的答案进行挖掘,而完成这一分析的前提便是之前提到的“文档家族”。

通过上述一系列的分析过程,我们了解到了测试产品中尚存在的一些问题、问题的优先级、问题表现在不同用户群体间的差异,以及一些潜在的解决办法。

本篇以网易某产品app的特定页面的可用性测试为例,介绍了如何通过Atlasti 75这款工具的使用,在大量的质性资料中发掘有价值的结论。不可忽略的是,工具的使用是根据项目需求决定的,特定的项目目的决定了我们要使用怎样的工具。本篇中的Atlasti也只是质性资料分析工具中的一种,它有自己的优势,也存在不足。下表列举了以Rost CM6为代表的文本分析工具和以Atlasti为代表的执行分析工具之间的差异,或许可以作为工具选择的一些参考。

在用研工作中,以Rost CM6为代表的工具适用于个案量大、单个案内容体量小的文本资料,这类工具可以有效地完成文本资料的分词、语义网络、情感分析等工作。以Atlasti为代表的工具,则适用于体量有限、材料形式多样但有着高挖掘深度和精度的各类质性资料。

一、更加准确的情感分析

虽然已经有很多情感分析的工具和产品,但是在分析准确度上仍然存在着误差。我期望文心一言不仅能够高度自适应,精准分析自然语言,还能够识别语境,抓住写作的情感、倾向以及沟通目的。采用更先进的算法和技术,让情感识别更为准确可信,提升应用的实用价值。

二、更丰富的应用场景

我期望文心一言能够应用于更广泛的场景,包括但不限于社交媒体、舆情监测、新闻报道、广告营销、客户服务等领域。例如,可以结合社交媒体的实时数据,实现更全面的舆情监测和反馈。还可以为广告商提供更精准的广告投放策略,提高广告投放的效果和ROI。期望文心一言可以通过与其他工具和产品的结合,为更多行业解决情感分析及管理问题。

三、更完善的应用支持

我期望百度文心一言在享受人工智能技术带来的便利和效率的同时,也能够不停完善产品本身和其应用生态,进一步提高用户体验和应用效果。具体来说,文心一言需要提供更加丰富、灵活的情感分析API,同时为开发者提供更完善的文档和技术支持。

此外,还需要不断完善产品的用户界面和易用性,方便非技术人员使用。根据用户反馈,及时更新算法、修复漏洞,优化集成流程,达到更好的用户体验。

目前常见的分析方法有:

1高频词分析(有专门的软件,如ROST);

2情感分析(多用于对旅游目的地形象分析);

3满意度分析(最近看的一篇文章用KANO模型结合文本做的分析)

4共词分析(例如分析多篇文章的关键词,使用共词矩阵,社会网络分析等)

4时空分析(游客路径和时空共现等等,这里面也有很多分析用到的是照片的分析)

注意:文本处理起来很繁琐,特别是有些意义相近的词,全都要进行清洗。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/3969946.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-08-19
下一篇2023-08-19

发表评论

登录后才能评论

评论列表(0条)

    保存