<article>
课程地址: https://classcourseraorg/nlp/lecture/31
情感分析 (Sentiment analysis)又可以叫做
意见抽取 (Opinion extraction)
意见挖掘 (Opinion mining)
情感挖掘 (Sentiment mining)
主观分析 (Subjectivity analysis)等等。
引用的论文:
Bo Pang, Lillian Lee, and Shivakumar Vaithyanathan 2002 Thumbs up Sentiment Classification using Machine Learning Techniques EMNLP-2002, 79—86
Bo Pang and Lillian Lee 2004 A Sentimental Education: Sentiment Analysis Using Subjectivity Summarization Based on Minimum Cuts ACL, 271-278
另外需注意,Binarized (Boolean feature) Multinomial Naïve Bayes不同于Multivariate Bernoulli Naïve Bayes,MBNB在文本情感分析上的效果并不好。另外课中也提到可以用交叉验证的方式进行训练验证。
下面罗列了一些比较流行的词典:
当我们拿到一个词我们如何判断他在每个类别中出现的概率呢?以IMDB影评为例
但是!我们不能用单纯的原始计数(raw counts)方法来进行打分,如下图
可以看出,这些否定词同样可以作为单词极性的一个判断依据。
具体步骤为:
联合概率 / 独立的两个概率乘积
之后我们可以看一下统计结果,分别来自于用户好评和差评的统计:
可以看到极性划分的还不错
</article>
</main>
转自csdn
文本情感分析根据文本大小可以划分为单词,句子级和篇章级,根据不同的分析目的,可以分为主客观分析(作者对客观事物的分析)和主观分析(作者自己的体验);根据处理方法的可以分为基于词典的情感分析和基于机器学习(SVM方法,神经网络和朴素贝叶斯方法)的情感分析;根据是否有人工参与,可以分为非监督和监督分类方法,区别在于是否需要人工情感标记。算法,主要的改进是通过依赖分析,围绕情感词,进行情感倾向性分析。
情感分析也被称为意见挖掘。情感分类涉及多个领域,如自然语音处理,人工智能,自动文本分类,文本挖掘,心理学等。它主要用来判别自然语言文字表达的观点,喜好以及感受和态度等相关的信息。
人的情感复杂多样,可以从不同的观察角度进行分类。由于情感的核心内容是价值,人的情感主要应该根据它所反映的价值关系的运动与变化的不同特点进行分类。
1、根据价值的正负变化方向的不同,情感可分为正向情感与负向情感。正向情感是人对正向价值的增加或负向价值的减少所产生的情感,如愉快、信任、感激、庆幸等;负向情感是人对正向价值的减少或负向价值的增加所产生的情感,如痛苦、鄙视、仇恨、嫉妒等。
2、根据价值的强度和持续时间的不同,情感可分为心境、热情与激情。心境是指强度较低但持续时间较长的情感,它是一种微弱、平静而持久的情感,如绵绵柔情、闷闷不乐、耿耿于怀等;热情是指强度较高但持续时间较短的情感,它是一种强有力、稳定而深厚的情感,如兴高采烈、欢欣鼓舞、孜孜不倦等;激情是指强度很高但持续时间很短的情感,它是一种猛烈、迅速爆发、短暂的情感,如狂喜、愤怒、恐惧、绝望等。
3、根据价值的主导变量的不同,情感可分为欲望、情绪与感情。当主导变量是人的品质特性时,人对事物所产生的情感就是欲望;当主导变量是环境的品质特性时,人对事物所产生的情感就是情绪;当主导变量是事物的品质特性时,人对事物所产生的情感就是感情。
4、根据价值主体的类型的不同,情感可分为个人情感、集体情感和社会情感。个人情感是指个人对事物所产生的情感;集体情感是指集体成员对事物所产生的合成情感,阶级情感是一种典型的集体情感;社会情感是指社会成员对事物所产生的合成情感
5、根据事物基本价值类型的不同,情感可分为真假感、善恶感和美丑感三种。真假感是人对思维性事物(如知识、思维方式等)所产生的情感;善恶感是人对行为性事物(如行为、行为规范等)所产生的情感;美丑感是人对生理性事物(如生活资料、生产资料等)所产生的情感。
豆瓣网文本评论的情感分析论文多。因为豆瓣网是一个内容丰富的文化社区,用户在这里可以发表对**、书籍、音乐等内容的评论和评分,这些评论数据对情感分析研究来说是非常有价值的。在学术界和工业界,已经有很多研究者和公司使用豆瓣网的评论数据进行情感分析研究和应用开发。这些研究涵盖了各种情感分析算法和技术,如基于词典的情感分析、基于机器学习的情感分析、基于深度学习的情感分析等。同时,也有很多论文对豆瓣网评论数据进行了情感分析,这些论文主要关注情感分析算法的优化和应用场景的拓展。
自然语言处理(NLP)在旅游领域具有广泛的应用,其中之一是情感分析。情感分析是指通过计算机程序来识别文本中的情感倾向,分析人们对旅游目的地、酒店、餐厅、交通工具等的评价。这种技术可以帮助旅游公司、酒店、餐厅等机构了解消费者的需求和喜好,改善服务质量和提高客户满意度。
一个典型的旅游情感分析应用是在线评论分析。在线评论是消费者对旅游目的地、酒店、餐厅等的反馈,通过使用 NLP 技术,旅游公司和酒店等机构可以分析这些评论,了解消费者对服务质量、位置、价格、餐饮等的看法。这些信息可以帮助他们改善服务质量、提高客户满意度。
另一个应用是社交媒体情感分析。社交媒体是消费者展示旅游经历的主要渠道,通过使用 NLP 技术,旅游公司和酒店等机构可以分析消费者在社交媒体上发布的文本、和视频,了解消费者对旅游目的地、酒店、餐厅等的感受。这些信息可以帮助他们改善服务质量、提高客户满意度、扩大品牌知名度。
此外,NLP还可以用于预测未来趋势,通过分析历史数据来预测旅游需求、价格趋势等,进而帮助旅游公司和酒店等机构调量、提高客户满意度。
NLP技术还可以用于语音识别和语音合成,在旅游领域中应用于语音导航、语音查询等场景。例如,旅游公司可以开发一款语音导航应用,让游客在旅游中使用语音命令来获取信息和导航。
总之,NLP在旅游领域有着广泛的应用,它可以帮助旅游公司、酒店、餐厅等机构了解消费者的需求和喜好,改善服务质量和提高客户满意度。通过使用NLP技术,旅游行业可以更好地了解客户,并提供更好的服务和体验。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)