目前,计算机理论界所开展的针对各种生理指标方面的“情感计算”方法,主要存在如下危机根本无法解决:
1、要建立情感的识别系统和表达系统,就必须对情感的基本类型进行划分,以确立情感的基本模态。然而,情感的基本类型究竟应该根据什么原则和标准来划分,有何理论根据?
2、对于同一类型情感,无论是情感感受强度,还是情感表达强度和情感生理唤醒程度,都可以采用不同的生理指标进行计算和测量,究竟应该选用哪一个生理指标为主要尺度呢?
3、对于同一类型情感采用同一个生理指标进行测量和计算时,由于受到许多环境因素、人体其它生理因素和精神因素的影响,其测量值的差异性和波动性如何消除。
4、不同的情感类型所产生的不同生理指标之间往往没有通约性,那么,不同类型的情感之间如何进行相互比较和统一度量?
5、人的情感内容和感情方式是极为丰富的,各种情感之间相互渗透、相互作用、相互转化,往往有着相当复杂而且变化频繁的关系,那么对于情感的计算就需要真正天文数字般的情感数据资源库,还需要海量的计算模型与计算工作量,而人脑为何并不需要?
6、有些复杂而微妙的情感,如怀疑、犹豫、迷茫、怜悯、尴尬、自我表现等,其生理指标的变化往往极其微弱而且短暂,对于它们的计算和测量如何进行?
7、有些情感(如“对敌人的仇恨”与“对亲人的生气”)往往具有相同或相近的生理指标,但两者所表达的价值内涵往往相差很大,如何进行区别?
8、情感的感受强度和表达强度与各种生理指标的变化量度通常不是成线性函数关系,大部分都是呈非线性的、不连续的、模糊的、概率性的、波动的函数关系,因此采用生理指标的变化量来计算情感的感受强度和表达强度,如何消除其误差性和不确定性。
9、假如能够计算出人的情感感受强度、表达强度和生理唤醒程度,这些计算值又代表了什么样的客观价值意义?如何使电脑或机器人具有和谐、友好、灵活的人机界面?
总之,对于情感的感受强度、表达强度和生理唤醒指标的计算实际上只是对于情感的表面形式的计算,而不是对于情感的客观内容的计算,因此不可能实现真正意义的“情感计算”。 目前,“情感计算”理论中主要存在如下唯心主义和形而上学的哲学错误,必须进行深刻的反思:
1、唯心主义错误。目前的“情感计算”理论以唯心主义的观点来看待情感的哲学本质,把情感与它所对应的客观存在割裂开来,局限于在主观范畴内来分析情感现象与情感规律。唯心主义者常常把主观与客观割裂开来,它否认,任何主观意识都产生于客观存在,都是人脑对某一种客观存在的反映,那怕有时是一种不真实的、不正确的、不全面的、甚至是颠倒的反映;它不知道,要认识一种主观意识的哲学本质必须从它所反映的客观存在中找答案,要分析一种主观意识的变化规律性应该从它所反映的客观存在的规律性上着手;它不知道,情感作为人脑的一种主观心理活动,必然对应着某一种客观存在,必然是人脑对某一种客观存在的主观反映;它在分析情感现象与情感规律时,总是试图在“需要”、“欲望”、“体验”、“态度”等主观心理范畴内找答案,而不能从其所反应的客观存在中找答案。
2、形而上学的表面性错误。目前的“情感计算”理论以形而上学的表面性观点来看待情感的客观内容,混淆了情感的客观内容与其表现形式的本质区别,它认为情感计算的核心就是对情感所激发的生理指标的计算。形而上学的表面性观点总是倾向于从事物的表现形式(或外部现象)来认识事物。它否认,事物的表现形式与其客观内容有着本质的区别,事物的表现形式通常只能片面地、不准确地、不稳定地反映事物的客观内容;它总是把情感的表现形式当作情感的客观内容本身。
3、形而上学的孤立性错误。目前的“情感计算”理论以形而上学的孤立性观点来看待情感的运行程序,把情感与认知及意志割裂开来,认为情感是独立运行的,与人的认知过程和意志过程无关。形而上学的孤立性观点总是倾向于根据事物本身的运动与变化情况来认识该事物,而不是根据事物与其它事物的相互联系与相互影响上来认识该事物。他们只看到了情感对于人的活动的影响与制约作用,往往看不到情感与认知、意志的相互联系与相互影响。
人为了生存和发展就必须首先感知和了解各种事物的事实关系,其次要掌握这些事物对于人的价值关系,第三要掌握人的每个反作用于这些事物的生产行为或生活行为的价值关系,并且判断、选择、组织和实施一个最佳的行动方案。第一步由认知活动来完成,第二步由情感活动来完成,第三步由意志活动来完成,因此从认知到情感,再从情感到意志,是一条基本的、不可分割的人类自控行为的流水线。
由此看来,仅仅进行狭义的、孤立的情感计算,仍然不能解决人的心智活动的全部计算问题,还需要实施对意志的计算,并实施对知情意的交互计算。由于意志是一种特殊情感,因此意志计算以及知情意的交互计算都是广义的情感计算。
4、形而上学的片面性错误。目前的“情感计算”理论以形而上学的片面性观点看待情感的客观目的,认为 “情感计算”的研究主要是基于两个现实目的:一是建立和谐的人机交互环境,使计算机或机器人具有良好的人机界面,以降低使用者的劳动强度,提高使用者的工作效率,解放人的双手;二是制作可穿戴式的计算机,以替代、补偿与增强人的辅助感知功能和行为功能,特别是帮助提高残疾人的感知功能和行为功能。
在国外提出情感分析的概念是指意见挖掘。在国外提出情感分析的概念是指通过自然语言处理、文本挖掘、计算机语言学等技术手段,对文本中的情感信息进行分析和判断,以了解文本作者的情感倾向和态度。情感分析技术最初是应用于英语等欧美语言的研究中,后来随着中文信息处理技术的发展,也被广泛应用于中文文本分析领域。
这是计算机世界的一个尚未开发的前沿:将各种人类情感转化成实实在在的数据。
起源
虽然之前也有一些相关工作,但目前公认的情感分析比较系统的研究工作开始于(Pang et al, 2002)基于监督学习(supervised learning)方法对**评论文本进行情感倾向性分类和(Turney,2002)基于无监督学习(unsupervised learning)对文本情感情感倾向性分类的研究。Pang et al, 2002)基于文本的N元语法(ngram)和词类(POS)等特征分别使用朴素贝叶斯(Naive Bayes),最大熵(Maximum Entropy)和支持向量机(Support Vector Machine,SVM)将文本情感倾向性分为正向和负向两类,将文本的情感进行二元划分的做法也一直沿用至今。同时他们在实验中使用**评论数据集目前已成为广泛使用的情感分析的测试集。(Turney ,2002)基于点互信息(Pointwise Mutual Information,PMI)计算文本中抽取的关键词和种子词(excellent,poor)的相似度来对文本的情感倾向性进行判别(SO-PMI算法)。在此之后的大部分都是基于(Pang et al, 2002)的研究。而相对来说,(Turney et al,2002)提出的无监督学习的方法虽然在实现上更加简单,但是由于单词之间的情感相似度难以准确的计算和种子词的难以确定,继续在无监督学习方向的研究并不是很多的,但是利用SO-PMI算法计算文本情感倾向性的思想却被很多研究者所继承了
可以使用snownlp包,也可以用nltk
和
scikit-learn
结合,或者自己写算法实现。
简单话就是情感词典的匹配,想提高效果的需要考虑特征之间的搭配,语法顺序等,可以查询搜索相关的入门例子和算法详细了解。
1、初步筛选:对于短视频情感分析样本库,首先需要进行初步的筛选,选取与研究主题相关的样本,滤除噪声数据和不相关的数据。
2、设计标注体系:根据研究目的,设计情感分析的标注体系,通常包括情感类别(如积极、消极、中性等)、情感极性(如正向、负向等)和情感强度(如强烈、一般、微弱等)等多个方面。
3、标注样本:按照标注体系,对样本进行标注。标注可以通过手工标注和自动标注两种方式进行。手工标注需要人工逐条查看样本,并对其进行情感分类和极性判断等标注操作。自动标注可以使用情感分析算法,对样本进行自动分类和标注。
4、标注质量检查:对标注好的样本进行质量检查,确保标注的准确性和一致性。可以使用多位标注员进行标注,然后比对标注结果,发现并解决标注中的错误和不一致性。
5、数据集整合:将标注好的样本整合成数据集,进行数据清洗和数据预处理等操作,以便后续的情感分析研究和应用。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)