情感的种类依据社会性内容其实就三个,分别为美感、理智感、道德感。
其中的道德感应该是大家生活中最耳熟能详的了吧,它指的是人们在对自己或他人的言行举止符合社会道德程度做判断时所产生的的一种情感,比方说愧疚感;理智感是指人们在与智力有关的活动中所产生的情感,比方说好奇心;而美感则指的是人们在欣赏文艺作品、社会现象、自然现象或景观时所产生的情感,比方说对丑陋之物的厌恶与蔑视,对美好景物或事物的感叹和赞美之情。
从最基本的开始吧: 基于词典的正负词词频, 我们实验室一个小组曾经在新浪微博上使用这个方法, 惊讶的发现这个如此不优美的方法的效果竟然那么的“可以看”。 在此之上一个改进的办法是对大量数据做一次二元的离散化(假定是正负情感), 以此选定阈值, 离散化的方法有很多, 不再赘述。接下来的方法主要分为两类:基于特征(feature-based): 这类方法比较好理解, 无非是人来选定特征空间, 然后对每一个数据项生成一个特征向量, 使用分类器对向量进行分类, 理论上所有的分类器都可以实现这个需求, 只是效果更不同。 方法之一是就是KNN, 但是和所有基于特征的方法一样, 特征的选取是一个永恒的话题,像KNN这种还需要维护巨大矩阵的方法尤其难以满足实用需求, 但是对于KNN的空间优化也有相应的办法, 就是对每个数据项指记录K项最近距离, 也就是K个<数据项ID, 距离>, 当有更近的数据项进来时, 替换最远的数据项, 此外, 我也同意@范文阁下的观点, 觉得KNN的效果不会好于SVM。 SVM: 经典分类器, 我决不敢自称完全理解SVM, 但使用方法大同, 也是将数据项生成特征向量(稍后会介绍另一种方法), 但是特征的选取是一个永恒的话题, 因为一切特征对于描述一个数据项来说都是必要的(但是不一定重要), 但是我们尽量选取合适的特征组来保证分类的准确率, 这一切, 这所做的一切都是对无法枚举出所有特征的现状的妥协。 SVM的开源包有很多, 楼主可以试试libsvm和svmlight。基于核函数(KernelMethod-based): 前面提到人为的选取特征的局限性, 并且隐含的线性不可分问题。 核函数是一个计算两个对象之间“相关度”(kernel)的函数。 有关核函数的定义和优化方法不一会儿能够谈清, 仅列出文献: wiki:http://enwikipediaorg/wiki/Kernel_methods Text Classification using String Kernels:http://dlacmorg/citationcfmid=944799&dl=ACM&coll=DL&CFID=96216241&CFTOKEN=33225628 Kernel Method for General Pattern Analysis:http://wwwkernel-methodsnet/tutorials/KMtalkpdf(以下方法没有经过验证) 基于核函数的SVM, 应用方式(以情感分类为例)可以简单地做文本分类(当然可以预先做词性过滤), 对于每一个需要做情感分类的文本之间算出kernel值, 用这个矩阵在svm中得到model, 然后对于测试数据, 或者预测数据在对训练数据中的每一项算kernel值, 拿这个矩阵用model去做测试(预测)。 这个过程的一个“快餐”的理解方式是: 将每一个数据与测试数据集中的每一项的相似度的向量当成之前feature-based的方法中的特征向量, 整个过程不过还是一个基于特征的训练-预测过程(当然, 这说法是不对的)。 libsvm中自带subsequence kernel 的实现使用参数-t来进行使用, 此外也支持自定义核函数。 之前谈过的KNN, 我觉得也可以引入kernel, 但是至于可行性和必要性嘛, 大家也就当讨论一下吧。 简单来说就是将KNN中的欧式距离替换成kernel值。==============================CRF应该没办法做情感分类吧, 毕竟不是分类器, 拿它做过实体识别, 感觉序列标注器不适合这个问题。严重同意@范文阁下的说法, 在实用领域, 预处理和数据获取(语料)才是王道, 机器学习就和人学习一样, 教育方法再好, 教的东西不好一样是浮云。 拿我大二数据挖掘老师的话讲, 统计模型都是现成的, 拼得就是数据。
内心感受可以分为五种,包括道德感、美感、理智感、伦理感和宗教感等,或者也可以依据自我认同,将其分为自我肯定型、自我否定型和自我超越型三种,或依据理智程度的不同,分为感性、知性和理性三种类型,或依据情感表现方式,可以分成激动性、耐受性和感染性三种,或依据情感表现程度,分为热情性、冷淡性、和高涨性三种,或依据情感表现强度,分为强烈性、温和性和微弱性三种类型,或依据感情的表现方法,将其分为显露性和隐藏性两种,或依据感情表现的时间,可以将其分成短暂性感情和长久性感情两种。内心的体验是一个人对事物的看法,以及对事物的感受。人们对于同一件事情会有不同的看法,因为人们的立场、角度、环境和知识经验不同,所以看法也就不同。参考文献《心理学大辞典》,上海教育出版社,20年 《心理学》,北京师范大学出版社。
情感分类是与情绪情感有关问题的归类;情感分析是对情感情绪问题的见解与认识。
《计算机科学》 2010年07期
情感分析与认知 李维杰
摘要:分析了情感分析的3个主要步骤,包括文本情感获取与表达、文本情感分类与计算以及文本情感分析的应用。情感分析得到的结论主要是对相关观点的摘要、对相关事件态度的预测或者统计等,但这些结论都没有发挥文本情感在认知中的作用。为了将情感分析应用于认知科学,提出了情感由情感信号和情感实体组成的观点。情感信号主要是指情感的一些形式载体,比如心跳加速、脸红等这些人体内外的某些表现,表达情感的文字、、声音等这类媒体。情感实体主要是指人类对情感形成的一种共识,比如爱、恨、憎恶、高兴、羞愧、嫉妒、内疚、恐惧、焦虑等与人的意识相关联的部分。同时提出了在人工智能中利用情感信息的设想。这对于模拟情感对认知的影响具有一定的意义。
--------粘贴内容,其他未知,抱歉。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)