是。词频分析,就是对某一或某些给定的词语在某文件中出现的次数进行统计分析。只是简单地进行词频统计及情感分析,是无法识别的。情感分析无论采用模型训练还是情感词典,都无法保证100%的准确率,在70~80%的准确率,但通过”人工调整”可大大提高情感分析的准确率。
以下以语义特征为例:
机器学习基于语义特征的情感分析
基于语义特征的情感分析先人已有研究,可以通过情感词典匹配来做,但是应用机器学习在这方面会使精确度更高些。
以本人参与的一个项目为主,总结下相关技术点。
背景是:分析用户评论感情色彩是积极还是消极,即是褒还是贬。
具体步骤为:
1有监督的人工给文本标注类标签。如有5000条评论数据,我们给其中的1000条标为积极的,再选1000条标为消极的,积极和消极就是所谓的类标签。
2选择特征。从积极的评论数据中按词来选择积极的所有特征。同理,从消极的评论数据中按词来选择消极的所有特征。如“这款游戏非常好玩”->”这款”->“游戏”->”非常”->”好玩”,分为四个特征词,也可以采用双词搭配,“这个游戏”和“非常好玩”作为特征。
3特征降维,减少特征的数量。如上“这个游戏非常好玩”中的“这个游戏”没有必要作为特征,因为“好玩”或“非常好玩”已经决定了评论是积极的。
4将语料文本变成使用特征表示。
5统计所有特征出现的次数,并按倒序排序。
6从以上结果中选出排序最靠前的一些特征作为最终的评判特征。
7使用训练数据根据特征训练分类算法,得到分类器。
8用测试数据检测分类器的准确度。
我们将数据分为两部分:开发集、测试集。用开发集的数据训练分类算法得到分类器;再用分类器对测试集里的数据进行分类,给出分类预测得到的标签;对比分类标签和人工标注得到的标签的差异,计算出准确度。
<article>
课程地址: https://classcourseraorg/nlp/lecture/31
情感分析 (Sentiment analysis)又可以叫做
意见抽取 (Opinion extraction)
意见挖掘 (Opinion mining)
情感挖掘 (Sentiment mining)
主观分析 (Subjectivity analysis)等等。
引用的论文:
Bo Pang, Lillian Lee, and Shivakumar Vaithyanathan 2002 Thumbs up Sentiment Classification using Machine Learning Techniques EMNLP-2002, 79—86
Bo Pang and Lillian Lee 2004 A Sentimental Education: Sentiment Analysis Using Subjectivity Summarization Based on Minimum Cuts ACL, 271-278
另外需注意,Binarized (Boolean feature) Multinomial Naïve Bayes不同于Multivariate Bernoulli Naïve Bayes,MBNB在文本情感分析上的效果并不好。另外课中也提到可以用交叉验证的方式进行训练验证。
下面罗列了一些比较流行的词典:
当我们拿到一个词我们如何判断他在每个类别中出现的概率呢?以IMDB影评为例
但是!我们不能用单纯的原始计数(raw counts)方法来进行打分,如下图
可以看出,这些否定词同样可以作为单词极性的一个判断依据。
具体步骤为:
联合概率 / 独立的两个概率乘积
之后我们可以看一下统计结果,分别来自于用户好评和差评的统计:
可以看到极性划分的还不错
</article>
</main>
转自csdn
人们登录“人形软件”,AI通过自主学习,1:1复刻用户的外表、兴趣和生活方式,成为用户在网络世界的虚拟代理人。这位“AI替身”能够与另一名用户的“人形软件”在虚拟世界中聊天、喝咖啡、逛街……在确定二者的匹配度后,高匹配度的两人将在真实世界正式见面。
这下可好,各位单身男女们省了不少事儿,一键登录,AI就可以帮用户自动选择约会对象,并完成基本的聊天,从而使在线相亲匹配简单化,人民公园相亲角的那些大爷大妈总算可以休息了,
而且,这可不是小说作者一厢情愿的幻想,近日,伦敦帝国理工学院研究人员对约会的未来状况作出了预测——到2025年,基因匹配和人工智能的结合,可以预测单身男女之间的吸引力和相容性,从而进行匹配。
爱情,这一人类永恒的主题,随着科技的发展,似乎发生了一些微妙的变化。
科学相亲时代,劝你不要太期待
近几年,网络婚恋交友行业发展迅速。根据艾瑞监测报告显示,2018q2中国网络婚恋交友服务PC端覆盖人数依次为938万人、1018万人和886万人,而在移动端,用户日均有效使用时长持续增长,Q2各月分别为6720万分钟、6847万分钟和7058万分钟,环比增长依次为-02%、19%和31%,网络婚恋移动端用户粘性持续提高。
但是,在这过去的几年里,在线婚恋行业也出现了不少问题,比如网恋骗局、用户交友疲劳、信息滥用等,面对这些难题,AI配对应运而生。通过大数据,深度学习,AI能够不断挖掘人们的相亲需求,进而使得相亲流程更加高效化和清晰化,在配对后期,AI还能对这段关系进行更长期的关注,提供测试、咨询等功能,这都是人工难以顾及到的。
目前,市面上的有AI元素的“红娘“也不少见,包括我们熟知的探探、网易花田,以及世纪佳缘、百合婚恋等网站,智能相对论(ID:aixdlun)在梳理了这些产品的底层AI逻辑后,发现所谓的智能配对,还是存在着一些缺陷,这主要体现在两个方面。
一方面,“AI红娘”基于社交信息为爱情定性。如今,各种各样的社交网络平台涌现了巨量而丰富的情感信息,AI能够挖掘网络上的文本信息,通过深度学习对网络文本进行细粒度的情感分析,进而达到即时获取人在网络世界的情感特征,美国的AI约会平台ViolaAI便是如此。
但AI如何能审查得了感情上的“真心实意”抑或“虚情假意”呢?在具体的操作中,交往过的男/女友,社交上的“摇一摇”匹配附近好友,说不定就成为了给当事人的爱情定性的重要指标。同时,人们的恋爱动机也会被AI看穿,而在恋爱自由的时代,你可能还会因为“不以结婚为目的的谈恋爱”受到算法的“歧视”。更敏感的是,食色性也。人性在男女关系上不一定经得起检验,检验工具却已就绪,我们做好它进入我们日常生活的准备了吗?
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)