(一)情绪的基本分类
1快乐
快乐是一种感受良好时的情绪反应,一般来说是一个人盼望和追求的目的达到后产生的情绪体验。由于需要得到满足,愿望得以实现,心理的急迫感和紧张感解除,快乐随之而生。
2愤怒
愤怒是指在实现目标时受到阻碍,而使愿望无法实现时产生的情绪体验。愤怒时紧张感增加,并且有时不能自我控制,甚至可能出现攻击行为。
3悲哀
悲哀也称也称悲伤,是指心爱的事物失去时,或理想和愿望破灭时产生的情绪体验。悲哀的程度取决于失去的事物对自己的重要性和价值。悲哀时带来的紧张的释放,会导致哭泣。当然,悲哀并不总是消极的,它有时能够转化为前进的动力。
4恐惧
恐惧是企图摆脱和逃避某种危险情景而又无力应付时产生的情绪体验。所以,恐惧的产生不仅仅是由于危险情景的存在,还与个人排除危险的能力和应付危险的手段有关。一个初次出海的人遇到惊骇浪或者鲨鱼袭击会感到恐惧无比,而一个经验丰富的水手对此可能已经司空见惯,泰然自若。
复合情绪是由基本情绪的不同组合派生出来的,在以上这四种基本情绪的基础之上,可以派生出众多的复杂情绪,如厌恶、羞耻、悔恨、嫉妒、喜欢、同情等。
(二)情绪状态的分类
情绪状态是指在一定的生活事件影响下,一段时间内各种情绪体验的一般特征表现。根据情绪状态的强度和持续时间可分为心境、激情和应激。
1心境
心境是指微弱而持久,带有渲染性的情绪状态。一种心境的持续时间依赖于引起心境的客观刺激的性质,如“感时花溅泪,恨别鸟惊心”;一个人取得了重大的成就,在一段时间内处于积极、愉快的心境中。
2激情
激情是一种迅猛爆发、激动短暂的情绪状态。激情是一种持续时间短、表现剧烈、失去自我控制力的情绪,激情是短暂的暴发式的情绪体验。人们在生活中的狂喜、狂怒、深重的悲痛和异常的恐惧等都是激情的表现。
3应激
应激是指个体对某种意外的环境刺激所做出的适应性反应,是个体觉察到环境的威胁或挑战而产生的适应或应对反应。比如,人们遇到突然发生的火灾、水灾、地震等自然灾害时,刹那间人的身心都会处于高度紧张状态之中。此时的情绪体验,就是应激状态。
(三)情感的分类
情感是指与人的社会性需要相联系的主观体验。人类高级的社会性情感主要有道德感、理智感和美感。
1道德感
道德感是在评价人的思想、意图和行为是否符合道德标准时产生的情感。由于不同历史时代、不同社会制度、不同的民族具有不同的道德标准,所以人的道德感具有社会历史性。
2理智感
理智感是在认识和评价事物过程中所产生的情感。它是人们学习科学知识、认识和掌握事物发展规律的动力。人的理想、世界观对理智感有重要的作用。例如求知欲、好奇心等都属于理智感的范畴。
3美感
美感是根据一定的审美标准评价事物时所产生的情感。人的审美标准既反映事物的客观属性,又受个人的思想观点和价值观念的影响,美感具有一定的社会历史性,不同历史时期、不同文化背景的人们对美的认识不同,例如,唐朝的女性以胖为美。
生活中的情感有很多,并不只局限于人们一般认为的亲情友情亦或者是爱情,当然这些情感也的确存在。还会有迷茫的情感,无助的情感,孤独的情感,快乐的情感,难过的情感,懵懂的情感,感动的情感,感恩免得情感,愤怒的情感。。每个情感都会分支到各个方面,情感很复杂也很微妙,也会给人带来不同的心理效应,也存在着很多说不清,道不明的情感。。这是每个人都会慢慢感受到的,不需要刻意的关注,想办法控制它们,顺其自然就好。
从最基本的开始吧: 基于词典的正负词词频, 我们实验室一个小组曾经在新浪微博上使用这个方法, 惊讶的发现这个如此不优美的方法的效果竟然那么的“可以看”。 在此之上一个改进的办法是对大量数据做一次二元的离散化(假定是正负情感), 以此选定阈值, 离散化的方法有很多, 不再赘述。
接下来的方法主要分为两类:
基于特征(feature-based):
这类方法比较好理解, 无非是人来选定特征空间, 然后对每一个数据项生成一个特征向量, 使用分类器对向量进行分类, 理论上所有的分类器都可以实现这个需求, 只是效果更不同。
方法之一是就是KNN, 但是和所有基于特征的方法一样, 特征的选取是一个永恒的话题,像KNN这种还需要维护巨大矩阵的方法尤其难以满足实用需求, 但是对于KNN的空间优化也有相应的办法, 就是对每个数据项指记录K项最近距离, 也就是K个<数据项ID, 距离>, 当有更近的数据项进来时, 替换最远的数据项, 此外, 我也同意@范文阁下的观点, 觉得KNN的效果不会好于SVM。
SVM: 经典分类器, 我决不敢自称完全理解SVM, 但使用方法大同, 也是将数据项生成特征向量(稍后会介绍另一种方法), 但是特征的选取是一个永恒的话题, 因为一切特征对于描述一个数据项来说都是必要的(但是不一定重要), 但是我们尽量选取合适的特征组来保证分类的准确率, 这一切, 这所做的一切都是对无法枚举出所有特征的现状的妥协。 SVM的开源包有很多, 楼主可以试试libsvm和svmlight。
基于核函数(KernelMethod-based):
前面提到人为的选取特征的局限性, 并且隐含的线性不可分问题。 核函数是一个计算两个对象之间“相关度”(kernel)的函数。 有关核函数的定义和优化方法不一会儿能够谈清, 仅列出文献:
wiki:http://enwikipediaorg/wiki/Kernel_methods
Text Classification using String Kernels:http://dlacmorg/citationcfmid=944799&dl=ACM&coll=DL&CFID=96216241&CFTOKEN=33225628
Kernel Method for General Pattern Analysis:http://wwwkernel-methodsnet/tutorials/KMtalkpdf
(以下方法没有经过验证)
基于核函数的SVM, 应用方式(以情感分类为例)可以简单地做文本分类(当然可以预先做词性过滤), 对于每一个需要做情感分类的文本之间算出kernel值, 用这个矩阵在svm中得到model, 然后对于测试数据, 或者预测数据在对训练数据中的每一项算kernel值, 拿这个矩阵用model去做测试(预测)。 这个过程的一个“快餐”的理解方式是: 将每一个数据与测试数据集中的每一项的相似度的向量当成之前feature-based的方法中的特征向量, 整个过程不过还是一个基于特征的训练-预测过程(当然, 这说法是不对的)。 libsvm中自带subsequence kernel 的实现使用参数-t来进行使用, 此外也支持自定义核函数。
之前谈过的KNN, 我觉得也可以引入kernel, 但是至于可行性和必要性嘛, 大家也就当讨论一下吧。 简单来说就是将KNN中的欧式距离替换成kernel值。
==============================
CRF应该没办法做情感分类吧, 毕竟不是分类器, 拿它做过实体识别, 感觉序列标注器不适合这个问题。
严重同意@范文阁下的说法, 在实用领域, 预处理和数据获取(语料)才是王道, 机器学习就和人学习一样, 教育方法再好, 教的东西不好一样是浮云。 拿我大二数据挖掘老师的话讲, 统计模型都是现成的, 拼得就是数据。
情感通常分为正面的体验,负面的体验和混杂的体验。正面的体验是指让人觉得愉悦和积极的体验,如快乐、满足和喜悦等;负面的体验是指让人感到不悦和否定的体验,如悲伤、愤怒和焦虑等;而混杂的体验则是正面和负面两种情感的混合,如同时感到快乐和紧张。这种情感分类方式有助于我们更好地了解自己和他人的感受,从而更好地应对生活中不同的情况和挑战。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)