来源 | 雪晴数据网
利用机器学习可以很方便的做情感分析。本篇文章将介绍在R语言中如何利用机器学习方法来做情感分析。在R语言中,由Timothy PJurka开发的情感分析以及更一般的文本挖掘包已经得到了很好的发展。你可以查看下sentiment包以及梦幻般的RTextTools包。实际上,Timothy还写了一个针对低内存下多元Logistic回归(也称最大熵)的R包maxtent。
然而,RTextTools包中不包含朴素贝叶斯方法。e1071包可以很好的执行朴素贝叶斯方法。e1071是TU Wien(维也纳科技大学)统计系的一门课程。这个包的主要开发者是David Meyer。
我们仍然有必要了解文本分析方面的知识。用R语言来处理文本分析已经是公认的事实(详见R语言中的自然语言处理)。tm包算是其中成功的一部分:它是R语言在文本挖掘应用中的一个框架。它在文本清洗(词干提取,删除停用词等)以及将文本转换为词条-文档矩阵(dtm)方面做得很好。这里是对它的一个介绍。文本分析最重要的部分就是得到每个文档的特征向量,其中词语特征最重要的。当然,你也可以将单个词语特征扩展为双词组,三连词,n-连词等。在本篇文章,我们以单个词语特征为例做演示。
注意,在R中用ngram包来处理n-连词。在过去,Rweka包提供了函数来处理它,感兴趣的可以查看这个案例。现在,你可以设置RTextTools包中create_matrix函数的参数ngramLength来实现它。
第一步是读取数据:
创建词条-文档矩阵:
现在,我们可以用这个数据集来训练朴素贝叶斯模型。注意,e1071要求响应变量是数值型或因子型的。我们用下面的方法将字符串型数据转换成因子型:
测试结果准确度:
显然,这个结果跟python得到的结果是相同的(这篇文章是用python得到的结果)。
其它机器学习方法怎样呢?
下面我们使用RTextTools包来处理它。
首先,指定相应的数据:
其次,用多种机器学习算法训练模型:
现在,我们可以使用训练过的模型做测试集分类:
准确性如何呢?
得到模型的结果摘要(特别是结果的有效性):
结果的交叉验证:
结果可在我的Rpub页面找到。可以看到,maxent的准确性跟朴素贝叶斯是一样的,其它方法的结果准确性更差。这是可以理解的,因为我们给的是一个非常小的数据集。扩大训练集后,利用更复杂的方法我们对推文做的情感分析可以得到一个更好的结果。示例演示如下:
推文情感分析
数据来自victornep。victorneo展示的是用python对推文做情感分析。这里,我们用R来处理它:
读取数据:
首先,尝试下朴素贝叶斯
然后,尝试其他方法:
这里,我们也希望得到正式的测试结果。包括:
1analytics@algorithm_summary:包括精确度,召回率,准确率,F-scores的摘要
2analytics@label_summary:类标签摘要
3analytics@document_summary:所有数据和得分的原摘要
4analytics@ensemble_summary:所有 精确度/覆盖度 比值的摘要
现在让我们看看结果:
与朴素贝叶斯方法相比,其它算法的结果更好,召回精度高于095。结果可在Rpub查看
原文链接:http://wwwxueqingcc/cms/article/107
您好。您说的是情感文本分析吗?如果是的话,我觉得情感计算的分类有两大类,一类是主观性:主观、客观、中性;一类是情感倾向:褒义、贬义、中性。 文本分析的话,主要是对词、句子中观点的挖掘。 你所说的机器学习法
“产品具有好的功能是重要的;产品让人易学会用也是重要的;但更重要的是,这个产品要能使人感到愉悦。” 美国认知心理学家Donald Norman在2002年提出产品设计的”情感化“理念,随着“体验经济时代”来临,“情感化”业已成为当前互联网产品主要的设计趋势之一。从心理学角度分析,情感是人格的核心,产品真正的价值在于满足人们情感需求,带给人们内心愉悦的审美体验。我们应从“功能控“思维怪圈中出逃,将注意力转移到用户的情感化需求,将情感化设计融入到产品中,达到美感和可用性的统一,使”有魅力的物品更好用“。 那我们在设计时该如何进行情感化设计本文从情感化设计认知模型出发,解析引发愉悦情感化设计的元素。
布鲁姆教育目标分类法是一种教育的分类方法。教育目标可分为三大领域:认知领域、情感领域和动作技能领域。

在认知领域可分为
1知道(知识)(knowledge)
是指认识并记忆。这一层次所涉及的是具体知识或抽象知识的辨认,用一种非常接近于学生当初遇到的某种 观念和现象时的形式,回想起这种观念或现象。
2领会(comprehension)
是指对事物的领会,但不要求深刻的领会,而是初步的,可能是肤浅的。
3应用(application)
是指对所学习的概念、法则、原理的运用。它要求在没有说明问题解决模式的情况下,学会正确地把抽象概念运用于适当的情况。
4分析(analysis)
是指把材料分解成它的组成要素部分,从而使各概念间的相互关系更加明确,材料的组织结构更为清晰,详细地阐明基础理论和基本原理。

5综合(synthesis)
以分析为基础,全面加工已分解的各要素,并再次把它们按要求重新地组合成整体,综合地创造性地解决问题。
6评价(evaluation)
理性的深刻的对事物本质的价值作出有说服力的判断,它综合内在与外在的资料、信息,作出符合客观事实的推断。
情感分析(又称为观点挖掘或感情AI)是指使用自然语言处理、文本分析、计算语言学和生物特征识别来系统地识别、提取、量化和研究情感状态和主观信息。情感分析广泛应用于分析客户的心声,如评论和调查回复,在线和社交媒体,以及从市场营销到客户服务再到临床医学的保健材料。
情感分析的一个基本任务是在文档、句子或特征/方面级别对给定文本的极性进行分类,判断在文档、句子或实体特征/方面中表达的意见是积极的、消极的还是中性的。高级的“超越极性”情感分类着眼于诸如“愤怒”、“悲伤”和“快乐”等情绪状态。
进行情感分析的先驱包括“一般询问者”(General Inquirer),它提供了量化文本模式的线索,另外,还提供了基于对人的言语行为进行分析来检查一个人的心理状态的心理学研究。
分析和研究人的情感是一个复杂的过程,需要结合多个因素和方法。以下是一些常见的方法和技巧:
观察非语言表达:情感通常通过非语言表达来展示,包括面部表情、姿势、手势、眼神等。观察这些非语言信号可以提供关于一个人情感状态的线索。
倾听和观察语言表达:人们在语言中常常流露出情感,包括词语的选择、语调、语速等。倾听和观察一个人的语言表达可以帮助你了解他们的情感体验。
提问和探索:与他人进行深入的对话,提出开放性的问题,探索他们的情感体验和内心感受。通过主动与他人交流,你可以更好地了解他们的情感世界。
了解背景和经历:一个人的情感体验通常受到他们的背景和经历的影响。了解一个人的背景故事、家庭环境、教育背景等,可以提供更多的背景信息来理解他们的情感。
使用情感分析工具:一些科学研究和心理学领域的专业人士使用情感分析工具来研究和测量情感。这些工具可能包括问卷调查、心理测量仪器、脑部扫描等,通过客观的数据来分析和研究情感。
学习心理学和情感科学知识:深入学习心理学和情感科学领域的知识可以提供更多的理论框架和研究成果,帮助你理解情感的本质和影响因素。
需要注意的是,分析和研究他人的情感是一项复杂的任务,需要综合考虑多个因素,并且要尊重他人的隐私和个人边界。在进行情感分析时,保持尊重、开放和理解的态度非常重要。
爱情是个永久的话题,是男女双方的相互吸引,相互爱慕并彼此渴望对方成为自己终身伴侣的最高情感。它引起了国内外学者的共同关注,并取得了很多研究成果[1-7],陈寒,陈小异[8],研究了大学生爱情教育的理论探索问题,该研究认为,对大学生进行爱情教育是必要的,爱情教育应该走在性教育的前面;爱情教育目的在于形成健康的爱情观;爱情教育的形式应该是非教条的,重在观念的养成。文献[9]讨论了苏霍姆林斯基的爱情教育观及性教育的启示,研究了怎样对待爱情怎样陶冶爱情这个心灵的高尚情感。从教育学的角度对此进行了深刻的分析研究,对我国的性教育有着重要的借鉴意义。文献[10]讨论了大学生恋爱心理与恋爱道德问题,认为对大学生恋爱道德要求主要是坚持恋爱的纯洁性,坚持感情的彼此尊重、自主自愿,在恋爱方式上要持之以度。文献[11]讨论了生命不可或缺的一环,给出了爱情的对策。认为学生恋爱是正常现象,客观存在,爱情教育的目的在于形成健康的爱情观,它是人性化的教育,重在培养。王兵,蔡阁,衡艳林[12],大学生婚恋现象进行了调查分析,李蕨菡,郑娟[13],研究了开放地区大学生的爱情道德现状及对策,上述讨论对大学生形成正确的婚恋观有一定的指导意义。
本文从数学的角度出发借助于数学中的映射概念建立了男女追求异性的求偶映射[14],并给出了合理的解释,和比较精确的运算法则,通过映射的表达给出了爱情付出指数值以及厌恶指数值的定义,讨论了爱情的叠加性,传递性与稳定性,对当代大学生建立正确的婚恋观具有积极的指导意义。
1、基本定义与理论构建
男女有别,主要差别就表现在男女染色体不同,女性染色体为,男性染色体为,女性染色体起主要作用的就是,男性染色体起主要作用的就是,因此可以建立女性到男性的爱情映射:
:→,记爱情付出指数值为 (affection),定义该女性对追求的男性的爱情付出指数值 = (),其中0≤≤1,定义 =
()表示厌恶付出指数值,很显然爱情付出指数与厌恶指数满足: + = 1,如果某一女性在追求另一男性的过程中付出了70%的爱,则她的爱情付出指数值 () =
07,厌恶指数值则为 = 03,恋爱中的男女不光有爱,也会有恨,因此上述定义是比较合乎爱情规律的。
如果上述映射是可逆的则表示双方相爱,即建立了可逆映射:→。 如果上述映射不可逆则表示女性对男性的单相思,上述定义建立了女性求偶的映射。
同理,可以建立男性求偶的映射, :→,定义该男性对追求的女性的爱情付出指数值 = (),0≤≤1该男性对追求的女性的厌恶指数值为 =
()。如果上述映射是可逆的则表示双方相爱,即建立了可逆映射,:→。如果上述映射不可逆则表示男性对女性的一厢情愿。
同样可以建立映射 :→或者 :→,这种映射称为自映射,代表女性或男性具有自恋情结。此时定义自己对自己的相爱指数值 = (),这里的
()值代表着自恋的程度,人都有两面性,即使是自己有的时候也有讨厌自己的一面,因此厌恶指数值定义为 = (),作为上述情况的特例自映射是可逆映射。
而 :→,则表示一个女性喜欢另外一个女性,此时爱情付出指数值定义为 = (),厌恶指数 =
(),如果上述映射是可逆的则表示双方相爱,即建立了可逆映射, :→。 如果上述映射不可逆则表示女性对另一女性的单相思,而
:→则表示一个男性喜欢另外一个男性,此时爱情付出指数值定义为 = (),厌恶指数 = ()。如果上述映射是可逆的则表示双方相爱,即建立了可逆映射, :→。
如果上述映射不可逆则表示男性对另一男性的一厢情愿。
2、叠加性,传递性与稳定性
如果一人对多人建立了爱情映射,:→, :→,… ,:→,其中对的爱情付出指数为 = (),则总的爱情付出指数值有加法运算: = = () =
1,对的厌恶指数为 = = ()。
如果多人对一人建立了爱情映射,:→, :→, …, :→
其中对的爱情付出指数为 = (),则总的爱情接收指数值有加法运算: = = () = 1,而对的厌恶指数为 = = ()。
如果建立了下述映射,:→,
:→,正所谓华筝喜欢郭靖,郭靖喜欢黄蓉,对也有一少部分被动讨好的方面,但厌恶是主要方面,前段时间热播的电视剧《宫心计》,《美人心计》等,从中也不难发现后宫中女性在争宠当中的这种微妙的关系,两者间的关系是既合作又斗争,因此定义对的厌恶指数值定义为:
= ()(),而合作指数定义为: = ()(),需要说明的是这种厌恶只在中间相隔奇数个个体的人之间进行运算才有实际意义。
不难发现一一映射,即可逆映射,这种映射的元素具有唯一性和排它性,所以具有良好的稳定性,而多对一的映射以及一对多的映射则不具有稳定性,甚至经常酿成悲剧。例如:郑州某高校一女生在网上与多人确立恋爱关系,遭到报复,同宿舍的女生多人被砍死。
3、对当代大学生的启示
爱情是个永久的话题,是男女双方的相互吸引,相互爱慕并彼此渴望对方成为自己终身伴侣的最高情感。当代大学生对待恋爱漫无目的,感觉别人有对象,自己也应该有,追求的对象一定要帅,或者漂亮,至少也应该家里有钱,这样建立起来的恋爱关系很难有深刻的感情,是一种被生活扭曲的恋爱观。了解自我,对自己有一个稳定的、恰当的评价,这不仅是心理健康的一个标志,而且也是给自己一个适当的爱情定位。实际上恋爱就意味着付出自己的真爱,让她(他)知道你在乎她(他),爱不一定就意味着花前月下,如胶似漆,爱也可以化作学习的动力,生活的鼓励与关怀。大学生对感情的追求,对异性的爱慕本身并没有错,存在即是合理,就像河道该疏通就要疏通,要因势利导,导向良性的恋爱观,清楚自己适合找一个什么样的人,能够找到一个什么样的人。这不但有利于爱情取得成功,而且这样的爱情很少具有盲目性,有利于自身素质的提高,从而使学生对爱情的追求动力也成为自我成长的动力。
再次,学生的首要任务还是学习,如果把大学四年都花在恋爱上确实这个赌注的砝码有点大,感情的事,就像洪水,多了就会泛滥,同时脚踩几条船的情况也屡见不鲜,迟早害了自己害了别人,因为感情喝药的,跳楼的,也时有发生,大学生在恋爱的过程中,由于性的吸引和双方情感的逐步加深,会无所顾忌,甚至有的对自己的性冲动不加抑制,发生了婚前性行为。建议大学生还是本着对自己对他人负责的态度,对待感情要谨慎,不是真爱就就不要轻易对对方说“我爱你”,有时喜欢一个人不一定要拥有,喜欢她(他)为她(他)祝福,也是一种不错的选择。正如有人所言,爱情需要激情,婚姻需要理性,如果能给学生在激情地追求爱情时一些理性,无疑更容易使爱情之舟安全地驶入婚姻的港湾。感情的事要讲求自然,水到渠成,瓜熟蒂落,切不可操之过急,没有对象的日子里也要单身并快乐着。了解爱情的上述特点能够帮助我们树立正确的健康的恋爱观,从而能够早日找到自己的真爱,属于自己的幸福。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)