多模态话语分析属于文本分析吗

多模态话语分析属于文本分析吗,第1张

多模态话语分析属于文本分析。多模态话语分析属于语言、图像、声音文本分析。

1、多模态话语分析指运用听觉、视觉、触觉等多种感觉,通过语言、图像、声音、动作等多种手段和符号资源进行交际的现象。多模态话语分析是分析单一感官的多符号语篇或多感官的多符号语。

2、文本分析是指对文本的表示及其特征项的选取,文本分析是文本挖掘、信息检索的一个基本问题,把从文本中抽取出的特征词进行量化来表示文本信息。结构体采用不同的表现形态,语言、文字、影像等,可推断文本提供者的意图和目的。

语音和文本之间的模态差异虽大,但利用训练过的Tokenizer将所有未标注的语音和文本转换到相同的离散表示空间。这样,两种模态亦能在预训练中通过共享接口自然地交互。

如今,人工智能技术已经能够通过语音识别与语音合成实现两者的相互转换。随着自监督表征学习分别在自然语言处理(NLP)与语音领域取得了显著进展,研究者们开始关注语音和文本的联合预训练方法。

近期,微软亚洲研究院与微软云计算平台 Azure 语音组的研究员们提出了文本数据增强的语音预训练模型SpeechLM。神经科学研究显示,人类在接收语音和文字信息时会使用不同的大脑皮层分别预处理语音和文本,然后再将预处理的结果投射至同一个被称为Broca and Wernicke的区域提取语义等信息。受此启发,研究员们开始使用音素单元(phoneme unit)或隐藏单元(hidden unit)作为共享的语义接口[LZ1] 来桥接语音和文本模态。该接口具有很强的可解释性和可学习性。通过这个共享的语义接口,SpeechLM可以利用额外的文本数据来提升语音预训练模型的性能。在典型的语音-文本跨模态任务(如语音识别、语音翻译)和语音表征学习基准数据集SUPERB [1]上,SpeechLM表现优异。图1展示了在LibriSpeech数据集中使用不同数量的文本数据后,SpeechLM显示出的语音识别性能。仅仅使用少量文本数据(10K个文本句子)的SpeechLM显著地超越了之前的SOTA模型。目前,该模型已经在GitHub开源,并将集成到 Hugging Face框架中供研发者参考。

回首语音和语言联合训练

与NLP不同,语音信号是连续的,因此很难直接找到类似于BERT预训练的预测标签。想要解决这个问题,就需要一个Tokenizer将连续的语音特征映射至离散的标签。受文本预训练方法BERT的启发,语音表示学习模型HuBERT [2]利用MFCC特征或者Transformer中间层表示的k-means模型作为Tokenizer,将语音转换为离散的标签,通过迭代的方法进行模型预训练。

以往的联合预训练方法大多简单地让语音和文本共享神经网络的模型参数。这种训练方法不能保证语音和文本在同一语义空间内,存在迁移干扰和容量稀释的问题。为了缓解这两个问题,SLAM [3]和mSLAM [4]利用额外有监督的语音识别任务来增强语音与文本的一致性。然而,这些方法仍然无法使用相同的建模单元对未标注的语音和文本数据进行建模。虽然MAESTRO能够在RNN-T框架下通过模态匹配算法从语音和文本模态中学习共享表示,但该算法只能在成对的语音-文本数据上进行优化。

SpeechLM的目标就是利用文本数据来改善语音表征的学习。不同于之前的研究,SpeechLM能够利用训练过的Tokenizer将所有未标注的语音和文本转换到相同的离散表示空间。这样,两种模态亦能在预训练中通过共享接口自然地交互。

构建语音和文本的共享桥梁

语音和文本之间的模态差异极大。首先,语音信号比文本数据具有更多更丰富的信息,如韵律、音色、情感等。其次,语音是由一连串音素组成的连续信号,通常表示为连续平滑的波形,而文本是由词语、字词或字符表示的离散数据。第三,语音表示比文本表示更长,例如,一秒16KHZ的语音包含16000个采样点和几个单词。因此,如何弥合语音和文本之间的模态差异是构建两者桥梁的关键。

为了解决这一问题,研究员们探索使用了一个定义好的离散标签来桥接语音和文本,将语音和文本映射到共享离散空间中进行联合预训练。利用音素单元或者隐藏单元作为语音和文本之间的桥梁具有以下优点:

(1)将语音和文本分别对齐成共享的中间表示比直接对齐两者更容易

(2)可以充分利用额外的未标注数据来提升对齐学习

(3)可以利用更细粒度的对齐信息(例如帧级别对齐)来促进联合建模。

研究员们定义了两套不同的离散Tokenizer来实现这个目的,分别将语音文本映射到基于音素单元的表示空间和基于隐藏单元的表示空间。音素单元Tokenizer使用混合ASR模型,将未标记的语音序列转录成帧级别的音素单元,并通过词典转换未标记的文本。而隐藏单元Tokenizer使用基于HuBERT的k-means模型将语音聚类为隐藏单元,并利用非自回归模型将未标记的文本转换为隐藏单元。所有的Tokenizer模型都是用无监督数据或少量ASR数据训练获得的,并在预训练前离线使用,不直接参与预训练过程。

社会语言学论文题目:

中国社会语言学的新发展

视觉语言学视阈下的聋人手语研究

粤语提示词“呢嗱”的语用特点

关于词类多功能性的思考

跨语种交际中话语的解码--无共同使用语言前提下以俄汉语为例

论现代流行语中体现的语言美学特质

系统功能语言学发展的维度与向度

马丁内的功能语言学体系

网络语言中的方言因素

中西民族语言对话篇

语言与文化的关系及其在交际中的作用

从《正名》篇管窥荀子的社会语言学思想

符号与跨文化交际

网络时代的新“语言”--网络语言现象分析

网络流行语研究

委婉语研究:回顾与前瞻

美国俚语与美国文化

话语分析的新发展--多模态话语分析

从礼貌角度对跨文化交际中禁忌语的动态研究

语言性别差异研究综述

语码转换的语用学研究

公益广告用语的社会语言学探析

委婉语--社会文化域的语言映射

从社会语言学视角论网络语言

试论语篇分析的理论与方法

语篇研究的批评视角:从批评语言学到批评话语分析

话语风格上的性别差异研究

跨文化交际与对外汉语教学

社会语言学的语言观和方法论

语言变异的部分原因及变异种类

权势关系与话轮转换:从社会语言学角度分析《雾都孤儿》中的会话

外语交际中的文化迁移及其对外语教改的启示

冲突性话语的语用学研究概述

“同志”一词的社会语言学研究

系统功能语言学的社会语言学渊源

英汉谚语中的性别歧视

面子:中西文化差异探讨

语码转换和社会语言学因素

北京话话语标记“这个”、“那个”的社会语言学分析

模糊限制语与言语交际

香港粤语与英语的语码转换

语域理论视角下的微博语言研究

中国网络语言研究现状分析

“门”后的思考:“××门”的社会语言学解读

社会语言学理论与对外汉语教学实践

“美女”面称的争议及其社会语言学调查

网络词语的性质及特点

中西文化中的礼貌探究

言语幽默的语言学研究综述

近三十年话语分析研究述评

恭维语的性别差异研究

性别歧视在谚语中的表现

多模态批评话语分析属于文字学。

多模态批评话语分析是文本学、社会学、心理学、语言学等多个学科的交叉学科领域,其中包括文字学。该研究领域旨在通过结合图像、声音、手势等多种不同的传达方式,对人们在互动中表达的意图和情感进行深入的分析和解读。因此多模态批评话语分析属于文字学。

多模态批评话语分析的研究范围涵盖现代社会中的各种交流场景,如商业会谈、司法审判、医患沟通、政治演讲等等。

 语录指一个人的说话记录,一般用于正式文体,通常为了说明一段时间内某人的所说句子和语言特征等。现指能引起共鸣的、发人深省,有一定传播力的名人之言、网民言论、社会事件所产生的新词条。下面为大家带来了感悟人生情感语录,欢迎大家参考!

感悟人生情感语录1

 1、我有没有跟你说过爱是我不变的信仰,我有没有告诉过你爱就是永远把一个人放在心上。

 2、我知道无论我走到哪里,你都会陪在我身边。陪我哭,陪我笑,陪我等待,陪我开花。

 3、如果真的有人让你难以忘记,去找他,一颗心吊着,比一颗心死了还要难受。

 4、当我看天的时候我就不喜欢再说话每当我说话的时候我却不敢再看天。

 5、那个在不经意中,也许就改变了我一生的女孩。我相信总有一天,我们会在世界的屋顶再次相遇。

 6、有些事,有些人,当你想着去忘却的时候,只是在你的心上,重新印刷了一遍!

 8、爱是一场战争,我不怕受伤只怕你不快乐。

 9、一个人最大的缺点,不是自私、多情、野蛮、任性,而是偏执地爱一个不爱自己的人。

 10、我一直喜欢下午的阳光。它让我相信这个世界任何事情都会有转机,相信命运的宽厚和美好。我们终归要长大,带着一种无怨的心情悄悄地长大。归根到底,成长是一种幸福。

 11、爱情就是这样,有些人慢慢遗落在岁月的风尘里,哭过,笑过,吵过,闹过,再恋恋不舍也都只是曾经。

 12、我们都要面向太阳,骄傲的活着。

 13、我们都是单翅膀的天使,只有拥抱着才能飞翔。

 14、爱情像糖衣,我囫囵吞下,享受瞬间的甜蜜。

 15、我们生活在同一个温暖的水域,也许偶尔会被水草缠绕,但因为彼此温暖的呼吸,相信都不会是死结。如果我说我爱你,我一直爱你,不知道你会不会相信?

 16、记住该记住的,忘记该忘记的,改变能改变的,接受不能改变的。

 17、亲爱的微笑眼泪一朵花一粒沙一串暗红色的冰糖葫芦坚持不哭的维尼小熊写在玻璃上的誓言我疼过的心尖皆是我们爱过的证据。

 18、其实,人字的结构就是相互的支撑,只要你愿意,谁都可以给谁幸福!

 19、最疼的疼是原谅最黑的黑是背叛。

 20、染上了尘埃,等待一场风暴的洗礼。

 21、结局和过程都有了,再去纠缠,连自己都觉得贪婪。

 25、心理学家说:男生没有主动找女生,那是说明他是真的不想理她了。女生没有主动找男生,是因为在等他找她。

 26、请你用慈悲心和温和的态度,把你的不满与委屈说出来,别人就容易接受。

 27、真爱上一个人,女人心底会生出更多更多的惶恐,会日日想尽一切办法抓住他。真爱上一个人,男人心满意足如释重负,然后去做其他自己该做的事情。女人抱怨对方给得太少,只是因为你给他的太多。所以,别总觉得他把你看得太轻。也许只是你总把他看得太重。

 28、挤不进的世界,不要硬挤;跨不过的门坎,不要硬跨;做不来的事情,不要硬做,拿不来的东西,不要硬拿。岁月的轮廓折叠起来,就会沉甸甸地坠在心底,似是不为人知的秘密,都暗自消解了过往。我们都在不断重复的时光里,度过青春的绚烂与苍白。

 29、年少无知的时候,是勇气泛滥的年代,因为我们无知,所以我们无谓。

 30、朋友,我就有骂他的责任,他也有骂我的责任。在事业上、感情上、人生上就有着互相的义务,每次见面都应该有收获,彼此对对方的存在感到一种愉快,而不是整天厮混在一起。——陈道明

 31、君子相交,随方就圆,无处不自在。

 32、活着一天,就是有福气,就该珍惜。当我哭泣我没有鞋子穿的时候,我发现有人却没有脚。

 33、我偶尔也有颓废,但从来不装样子。

 34、等过完这个夏天,我们教室又坐满了人,只是不在是我们了。

 35、你永远要宽恕众生,不论他有多坏,甚至他伤害过你,你一定要放下,才能得到真正的快乐。

 36、你不要一直不满人家,你应该一直检讨自己才对。不满人家,是苦了你自己。

 37、人生就像天平,总是需要某种平衡:一边是给予,一边是接受;一边是付出,一边是得到;一边是耕耘,一边是收获;一边是物质,一边是精神;一边是自己,一边是他人。上帝也很为难,他不可能把所有的好事都让给你,也不可能把所有的不幸都塞给你。看淡得失,你才能找到生命的最佳平衡状态。

 38、所谓心事,不过是不如己意,那就是我执,执著于自己描画的理想,一有落差,即生烦恼。人生就像是一盘棋,对手则是我们身处的环境。有的人能预想十几步,乃至几十步之外,早早便做好安排;有的人只能看到几步之外,甚至走一步,算一步。

 39、许多人总觉得生命中有一种无力感,觉得自己被环境、被现实限制住。事实上,环境与现实就如同大象脚上那条外在、有形的绳索,绑住我们的并不是那些外在、有形的现实与环境,而是烙印于内心深处、在成长过程中形成的许多无形的制约。

 40、你什么时候放下,什么时候就没有烦恼。

 41、看见人家墙要倒,如果不能扶,那么不推也是一种善良;看见人家喝粥,你在吃肉,如果不想让,那么不吧嗒嘴也是一种善良,看见人家伤心落泪,如果不想安慰,那么不幸灾乐祸也是一种善良;作为教师,如果不能桃李满天下,那么不误人子弟也是一种善良。

 42、简单的付出,用心情转变话语,用事迹带动思绪的蔓延,很多的知识走进了内心。慢慢的造就了自己,改变了今天,铸就了明天,就这样,简单的'就这样,累积自己,改变话语,改变事迹,必须付出属于自己的心情磨练和思考。

 43、人,要相信自己的天赋,不必太在乎别人怎么认为,也不必太在乎别人是如何的否定自己的对与错;其实,一个人的幸福,是自己一向所追求的事情,只要自己感受到自己是幸福的,那就值得。一念花开,一念花落。这山长水远的人世,终究是要自己走下去。

 44、原谅我的贪心,总是想留住身边每个对我好的人,最后才发现,有些人,无论怎样也留不住。

 45、人的一生要疯狂一次,无论是为一个人,一段情,一段旅途,或一个梦想。

 46、幸福,不是长生不老,不是大鱼大肉,不是权倾朝野。幸福是每一个微小的生活愿望达成。当你想吃的时候有得吃,想被爱的时候有人来爱你。

 47、我不后悔自己做过的每一件事,包括蒙上双眼相信一个人。他日,若被万箭穿心,我认。但你要记得,伤害过后,再无原谅。

 48、那年夏天,我无比憧憬大学;今年夏天,我却无比憧憬那年。

 49、我经常损你,是因为我相信我们的关系。

 50、我不觉得人的心智成熟是越来越宽容涵盖,什么都可以接受。相反,我觉得那应该是一个逐渐剔除的过程,知道自己最重要的是什么,知道不重要的是什么。而后,做一个简单的人。

感悟人生情感语录2

 1、有时候,不是对方不在乎你,而是你把对方看得太重。

 2、追求物质财富可能还嫌不够,亲爱的,有了你的真爱,是我一生的满足。

 3、这辈子最疯狂的事,就是爱上了你,最大的希望,就是有你陪我疯一辈子。

 4、日里想着你,夜里念着你,梦里绕着你,眼里望着你,手里握着你,心里爱着你!

 5、第一次哭是因为你不在,第一次笑是因为遇到你,第一次笑着流泪是因为不能拥有你!

 6、窗外下着雪,泡一杯咖啡,握到它凉了,才知道又想起了你。我的期待你如何才能明白!

 7、将热情涂玫瑰花瓣,将的主题刻在巧克力上,在这醉人的夜晚,携起双手,同月色,共尝甜蜜。

 8、不是因为寂寞才想你,而是因为想你才寂寞。孤独的感觉之所以如此之重,只是因为想得太深。

 9、想你成歌,飞扬;想你成河,流淌;想你成云;飘荡;想你成吻,舒畅。想你不是一个定格,想你永恒。

 10、在这微寒的初冬季,没有花,没有草,我没关系;我有爱,我有情,我有你;还有你说你爱我的那一句。

 11、喜欢一个人,是不会有痛苦的。爱一个人,也许有绵长的痛苦,但他给我的快乐,也是世上最大的快乐。

 12、如果你有飘逸的长发,我愿做一只小小的虱子,让你痒;如果你有编贝般的牙齿,我愿做一只蛀虫,让你疼。

 13、有一种声音是听不见的,有一种语言是不能亵渎的,有一种感觉是无法描述的,有一种力量是不可抗拒的。

 14、夜深人静,一颗星星的心在等待!朝阳,期待那风中的诗篇,期待那情的话语,那暖暖的吻!那暖暖的情义!

 15、我们已经不是那样的冲动与赌气。我记得曾经和你说过孤独但不寂寞。是的,我现在确实不寂寞,因为有了你。

 16、遇到你之前,世界是荒原;遇到你之后,世界是园。过去的岁月,象一缕烟,未的无限生涯。因你而幸福无边。

 17、我用爱情的小箭射入你的心中,你就成为我的俘虏,我决定判你无期徒刑,永远关押在我心里,不准保释。

 18、你越来越深地走进我的记忆之中。有一种想见不敢见的悲痛,让我对你的思念越来越浓,我却只能把你放在我心中。

 19、若是有缘,时间空间都不是距离。若是无缘,终日相聚也无法会意。凡事不必太在意,更不需去强求,就让一切随缘吧!

 20、想送你玫瑰可惜价太贵,想送你安慰可惜没学会,想送你戒指可惜还在保险柜,只好发个信息把你,追希望我们永不吹。

 21、天空的幸福是穿一身蓝;森林的幸福是披一身绿;阳光的幸福如钻石般耀眼;而我的幸福是因为认识了你!

 22、愿我的祝福像高高低低的风铃,给你带去叮叮铛铛的快乐!如果你在梦中也会笑出声来,那一定是我带给你的,永远爱你。

 23、因为想你,世界也变的冷清了;因为喜欢你才会爱你,因为爱你才会想你,因为想你才会守着你,因为守着你,才会深深的爱你。

 24、可以是无私的,即使没有共同的题,即使没人有默契,但我知道你的一切都我幸福,看一眼,听一句都是享受,教我如何不你呢?

 25、走着走着,就散了,回忆都淡了;看着看着,就累了,星光也暗了;听着听着,就醒了,开始埋怨了;回头发现你,不见了,突然我乱了。

 26、你你你这个小妖精,令我中了你的爱情毒却迟迟不肯给我解药!小坏蛋!哦!我快要不行了!救救我吧!办法很简单:给我你的爱!

 27、总因喜欢苹果而放弃了手中拥有的桔子,可后来发觉原来苹果也不过如此,还不如桔子好吃,于是把责怪都加在苹果身上,后悔自己的选择。

 28、人的一生有许多难以取舍,困惑不已的琐事所纠缠着,这时所需的就是断然的舍弃与明智的抉择,唯一会限制我们的,是我们自己的决心。

 29、知道为何我们今生有吗?其实我们一千多年前就认识,是个秋天,你在里随我跑了好远,在我身上留下你牙齿的烙印成为千古佳,那时我叫吕洞宾。

 30、爱恨各有数,缘到则合,缘尽则分。对不起,我真的不是故意要伤害你,今天的局面谁都不希望发生,既然大家都不开心,我们还是做个普通朋友吧。

传统的人机交互,主要通过键盘、鼠标、屏幕等方式进行,只追求便利和准确,无法理解和适应人的情绪或心境。而如果缺乏这种情感理解和表达能力,就很难指望计算机具有类似人一样的智能,也很难期望人机交互做到真正的和谐与自然。由于人类之间的沟通与交流是自然而富有感情的,因此,在人机交互的过程中,人们也很自然地期望计算机具有情感能力。情感计算(Affective Computting)就是要赋予计算机类似于人一样的观察、理解和生成各种情感特征的能力,最终使计算机像人一样能进行自然、亲切和生动的交互。 有关人类情感的深入研究,早在19世纪末就进行了。然而,除了科幻小说当中,过去极少有人将“感情”和无生命的机器联系在一起。只有到了现代,随着数字信息技术的发展,人们才开始设想让机器(计算机)也具备“感情”。从感知信号中提取情感特征,分析人的情感与各种感知信号的关联,是国际上近几年刚刚兴起的研究方向(图1)。

人的情绪与心境状态的变化总是伴随着某些生理特征或行为特征的起伏,它受到所处环境、文化背景、人的个性等一系列因素的影响。要让机器处理情感,我们首先必须探讨人与人之间的交互过程。那么人是如何表达情感,又如何精确地觉察到它们的呢?人们通过一系列的面部表情、肢体动作和语音来表达情感,又通过视觉、听觉、触觉来感知情感的变化。视觉察觉则主要通过面部表情、姿态来进行;语音、音乐则是主要的听觉途径;触觉则包括对爱抚、冲击、汗液分泌、心跳等现象的处理。

情感计算研究的重点就在于通过各种传感器获取由人的情感所引起的生理及行为特征信号,建立“情感模型”,从而创建感知、识别和理解人类情感的能力,并能针对用户的情感做出智能、灵敏、友好反应的个人计算系统,缩短人机之间的距离,营造真正和谐的人机环境(图2)。 在生活中,人们很难保持一种僵硬的脸部表情,通过脸部表情来体现情感是人们常用的较自然的表现方式,其情感表现区域主要包括嘴、脸颊、眼睛、眉毛和前额等。人在表达情感时,只稍许改变一下面部的局部特征(譬如皱一下眉毛),便能反映一种心态。在1972年,著名的学者Ekman提出了脸部情感的表达方法(脸部运动编码系统FACS)。通过不同编码和运动单元的组合,即可以在脸部形成复杂的表情变化,譬如幸福、愤怒、悲伤等。该成果已经被大多数研究人员所接受,并被应用在人脸表情的自动识别与合成(图3)。

随着计算机技术的飞速发展,为了满足通信的需要,人们进一步将人脸识别和合成的工作融入到通信编码中。最典型的便是MPEG4 V2视觉标准,其中定义了3个重要的参数集:人脸定义参数、人脸内插变换和人脸动画参数。表情参数中具体数值的大小代表人激动的程度,可以组合多种表情以模拟混合表情。

在目前的人脸表情处理技术中,多侧重于对三维图像的更加细致的描述和建模。通常采用复杂的纹理和较细致的图形变换算法,达到生动的情感表达效果。在此基础上,不同的算法形成了不同水平的应用系统(图4,图5) 人的姿态一般伴随着交互过程而发生变化,它们表达着一些信息。例如手势的加强通常反映一种强调的心态,身体某一部位不停地摆动,则通常具有情绪紧张的倾向。相对于语音和人脸表情变化来说,姿态变化的规律性较难获取,但由于人的姿态变化会使表述更加生动,因而人们依然对其表示了强烈的关注。

科学家针对肢体运动,专门设计了一系列运动和身体信息捕获设备,例如运动捕获仪、数据手套、智能座椅等。国外一些著名的大学和跨国公司,例如麻省理工学院、IBM等则在这些设备的基础上构筑了智能空间。同时也有人将智能座椅应用于汽车的驾座上,用于动态监测驾驶人员的情绪状态,并提出适时警告。意大利的一些科学家还通过一系列的姿态分析,对办公室的工作人员进行情感自动分析,设计出更舒适的办公环境。 在人类的交互过程中,语音是人们最直接的交流通道,人们通过语音能够明显地感受到对方的情绪变化,例如通过特殊的语气词、语调发生变化等等。在人们通电话时,虽然彼此看不到,但能从语气中感觉到对方的情绪变化。例如同样一句话“你真行”,在运用不同语气时,可以使之成为一句赞赏的话,也可以使之成为讽刺或妒忌的话。

目前,国际上对情感语音的研究主要侧重于情感的声学特征的分析这一方面。一般来说,语音中的情感特征往往通过语音韵律的变化表现出来。例如,当一个人发怒的时候,讲话的速率会变快,音量会变大,音调会变高等,同时一些音素特征(共振峰、声道截面函数等)也能反映情感的变化。中国科学院自动化研究所模式识别国家重点实验室的专家们针对语言中的焦点现象,首先提出了情感焦点生成模型。这为语音合成中情感状态的自动预测提供了依据,结合高质量的声学模型,使得情感语音合成和识别率先达到了实际应用水平。 虽然人脸、姿态和语音等均能独立地表示一定的情感,但人在相互交流的过程中却总是通过上面信息的综合表现来进行的。所以,惟有实现多通道的人机界面,才是人与计算机最为自然的交互方式,它集自然语言、语音、手语、人脸、唇读、头势、体势等多种交流通道为一体,并对这些通道信息进行编码、压缩、集成和融合,集中处理图像、音频、视频、文本等多媒体信息。

目前,多模态技术本身也正在成为人机交互的研究热点,而情感计算融合多模态处理技术,则可以实现情感的多特征融合,能够有力地提高情感计算的研究深度,并促使出现高质量、更和谐的人机交互系统。

在多模态情感计算研究中,一个很重要的研究分支就是情感机器人和情感虚拟人的研究。美国麻省理工学院、日本东京科技大学、美国卡内基·梅隆大学均在此领域做出了较好的演示系统。目前中科院自动化所模式识别国家重点实验室已将情感处理融入到了他们已有的语音和人脸的多模态交互平台中,使其结合情感语音合成、人脸建模、视位模型等一系列前沿技术,构筑了栩栩如生的情感虚拟头像,并正在积极转向嵌入式平台和游戏平台等实际应用(图6)。 情感状态的识别和理解,则是赋予计算机理解情感并做出恰如其分反应的关键步骤。这个步骤通常包括从人的情感信息中提取用于识别的特征,例如从一张笑脸中辨别出眉毛等,接着让计算机学习这些特征以便日后能够准确地识别其情感。

为了使计算机更好地完成情感识别任务,科学家已经对人类的情感状态进行了合理而清晰的分类,提出了几类基本情感。目前,在情感识别和理解的方法上运用了模式识别、人工智能、语音和图像技术的大量研究成果。例如:在情感语音的声学分析的基础上,运用线性统计方法和神经网络模型,实现了基于语音的情感识别原型;通过对面部运动区域进行编码,采用HMM等不同模型,建立了面部情感特征的识别方法;通过对人姿态和运动的分析,探索肢体运动的情感类别等等。

不过,受到情感信息的捕获技术的影响,并缺乏大规模的情感数据资源,有关多特征融合的情感理解模型的研究还有待深入。随着未来的技术进展,还将提出更有效的机器学习机制。 情感计算与智能交互技术试图在人和计算机之间建立精确的自然交互方式,将会是计算技术向人类社会全面渗透的重要手段。未来随着技术的不断突破,情感计算的应用势在必行,其对未来日常生活的影响将是方方面面的,目前我们可以预见的有:

情感计算将有效地改变过去计算机呆板的交互服务,提高人机交互的亲切性和准确性。一个拥有情感能力的计算机,能够对人类的情感进行获取、分类、识别和响应,进而帮助使用者获得高效而又亲切的感觉,并有效减轻人们使用电脑的挫败感,甚至帮助人们便于理解自己和他人的情感世界。

它还能帮助我们增加使用设备的安全性(例如当采用此类技术的系统探测到司机精力不集中时可以及时改变车的状态和反应)、使经验人性化、使计算机作为媒介进行学习的功能达到最佳化,并从我们身上收集反馈信息。例如,一个研究项目在汽车中用电脑来测量驾车者感受到的压力水平,以帮助解决所谓驾驶者的“道路狂暴症”问题。

情感计算和相关研究还能够给涉及电子商务领域的企业带来实惠。已经有研究显示,不同的图像可以唤起人类不同的情感。例如,蛇、蜘蛛和枪的能引起恐惧,而有大量美元现金和金块的则可以使人产生非常强烈的积极反应。如果购物网站和股票交易网站在设计时研究和考虑这些因素的意义,将对客流量的上升产生非常积极的影响。

在信息家电和智能仪器中,增加自动感知人们的情绪状态的功能,可以提供更好的服务。

在信息检索应用中,通过情感分析的概念解析功能,可以提高智能信息检索的精度和效率。

在远程教育平台中,情感计算技术的应用能增加教学效果。

利用多模式的情感交互技术,可以构筑更贴近人们生活的智能空间或虚拟场景等等。

情感计算还能应用在机器人、智能玩具、游戏等相关产业中,以构筑更加拟人化的风格和更加逼真的场景。 由于缺乏较大规模的情感数据资源,情感计算的发展受到一定的限制,而且多局限在语音、身体语言等具体而零散的研究领域,仅仅依靠这些还难以准确地推断和生成一个人的情感状态,并进行有效的情感交互。目前,科学家们正在积极地探索多特征融合的情感计算理论模型。很多人认为,今后几年情感计算将在这些方面需要取得突破:

更加细致和准确的情感信息获取、描述及参数化建模。

多模态的情感识别、理解和表达(图像、语音、生理特征等)。

自然场景对生理和行为特征的影响。

更加适用的机器学习算法。

海量的情感数据资源库。 不久前,为了推动我国在这一领域的研究,探讨情感计算和智能交互技术的发展动态与趋势,促进我国科研人员在此领域的交流与合作,中国科学院自动化研究所、中国自动化学会、中国计算机学会、中国图象图形学会、中国中文信息学会、国家自然科学基金委员会和国家863计划计算机软硬件技术主题作为主办单位,在北京主办了第一届中国情感计算与智能交互学术会议。

事实证明,情感计算的概念尽管诞生不久,但已受到学术界和产业界的高度重视,相关领域的研究和应用正方兴未艾,国家自然科学基金委也将其列入重点项目的指南中。值得注意的是,近几年来,与情感计算有密切关系的普适计算和可穿戴式计算机的研究也已获得了蓬勃发展,并同样得到了国家的大力支持。这为情感信息的实时获取提供了极大的便利条件,也为情感计算在国内的发展提供了更好的发展平台。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/795157.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-09
下一篇2023-07-09

发表评论

登录后才能评论

评论列表(0条)

    保存