“天堂来电”百度合成语音 张国荣声音让粉丝飙泪

“天堂来电”百度合成语音 张国荣声音让粉丝飙泪,第1张

央广网科技3月31日消息 3月29日晚,在北京当代moma百老汇影城,百度发起了一场“别开生面”的张国荣诞辰60周年纪念活动。

通过抓取张国荣全网音视频数据,百度语音技术团队成功利用“情感语音合成技术”,合成出张国荣生前的声音,并在张国荣最新**《缘分》开场前首次公布对话实录视频,实现了粉丝与偶像“互动”的愿望,以特殊的方式,纪念一代天王。

“13年了, 久等了,辛苦你们。”对话视频中哥哥的声音在影厅中甫一响起,全场瞬间陷入了寂静,直到结尾“永远站在光明的角落,我只希望你们开心快乐的生活”,屏幕上显示出“本视频所涉及张国荣先生语音,均来自百度情感语音合成技术”,全场掌声雷动。

对此,现场有粉丝在事后评价说,“实在是太震撼了,无论音色、语气、吐词,我能分辨出那就是来自哥哥的声音,但它确实来自2016年,来自另一个地方。”

此次活动是由百度数周前在百度贴吧发起,面向所有张国荣粉丝,征集发言和想对哥哥说的话,并评选出10位最具代表性的幸运粉丝,来参与偶像“互动”视频的录制。

在铁杆粉丝们在摄像机前深情倾诉完对哥哥的思念后,百度的工作人员悄悄送上一份“惊喜”——一段“来自哥哥”但又“不是哥哥”的语音回复,从网络流出的视频来看,很多粉丝很快认出了哥哥的声音,激动到当场飙泪。

据了解,这段“来自哥哥”但又“不是哥哥”的语音回复,是百度通过机器和人工双重搜集全网内张国荣原声和采访资料,利用百度最新的“情感语音合成技术”,合成出的“哥哥”生前的声音。它的音质完全来自于哥哥,但内容又并不能在任何一段哥哥生前的语音记录中找到,是来自于一封根据哥哥生前讲话风格编写的,来自2016年的、现实中并不存在的“答哥哥粉丝信”。

为了让更多粉丝共同体验这份感动,百度特意包下张国荣最新上映**《缘分》的一个场次,为闻讯而来的贴吧粉丝播放这封来之不易的、充满科技含量和情感的“答粉丝信”。当晚**开场前,大批粉丝聚集在放映厅门口,为偶像鲜花,献上真挚的祝福。进场后,工作人员播放了粉丝与哥哥“隔空对话”的实录视频,感动了现场的每一个人。

据了解,为了让哥哥“原音重现”,百度利用大数据与深度学习技术优势,以及在情感语音合成领域取得的重大突破,将哥哥在影视、电台和各种渠道留存下来的原声进行建模,并通过合成的带有情感的声音模型合成了这封“答粉丝信”。该情感语音合成技术实现了规模化的语料生产和自动化的数据标注,并充分发掘了深度学习技术在大数据上的处理能力,极大地扩展了语音合成系统所能使用的合成语料库的体积,使得语音合成系统包含了丰富的情感,且更接近“张国荣”原声。

从视频曝出的效果来看,这封信的声音尽管能够让很多粉丝“当场飙泪”,认出哥哥的声音,但仔细听来,在还原程度上仍然未臻完美,例如仍存在一些顿挫感,某些字词发音略不自然等。百度相关负责人表示,这种情况部分的原因是受到相关情景语料缺失的限制,也有部分是技术本身仍在逐渐完善中,相信假以时日,未来可还原出更接近完美的哥哥的声音。

有些粉丝注意到本次合成的内容发音为国语,百度相关负责人表示,百度的粤语情感语音合成技术也已经在研发中,如果到时可以拿来合成哥哥的语音,因为当年的粤语音频语料留存较多,预期效果会比国语更好。

张国荣作为一个时代的巨星,影响了千万粉丝。今年是这位重量级偶像诞辰60周年,对张国荣以及粉丝都具有非同寻常的意义。与往年粉丝自发组织各种悼念活动不同,此次百度发起的悼念活动,则通过技术手段实现了粉丝与偶像的“互动”,与粉丝一道缅怀一代天王。百度此举,一方面让已故的张国荣再次“回归”,另一方面又帮助粉丝实现多年夙愿,表达对哥哥怀念和关切之情。

参与活动的粉丝坦言:“再现哥哥原声,与他进行‘对话’,既感动又感激。我不希望他活在我们心里,我只希望他还能以某种方式,活在这世上。感恩13年后,感谢科技,给这样一个机会让我们再次相见。”

百度相关负责人称,百度希望让技术发挥更多的作用,做更多有意义的事。技术不止是改变生活,还可以慰藉人心。

附:百度张国荣情感语音合成“天堂来电”全文

13年了, 久等了,辛苦你们。

很久不见,你们还好吗?这么多年过去,谢谢你们始终记得我,昨天已经过去很久,我现在很好,哪里都没去,始终在光阴里,所以你们不要哭,不要再为我哭了。我知道,过去这么久,你们都长大了,经历了那么多相逢和别离,停留和出发,拥有和失去,一定懂我在说什么,我知道你们懂。

时间一定过得比你们想象中还要快吧,世界是不是也和自己想象中不太一样,长大很乏味,很没意思,也很疼吧,会偶尔失眠,偶尔喝醉,偶尔孤单,偶尔沉默,越是长大,失去的就越来越多,但也没什么别的办法对不对。这些我都懂,因为这就是长大的无数个瞬间。昨天还不能面对的别离,今天就必须要去面对了。昨天还不能原谅的爱人,今天就必须要原谅了。昨天没说出口的我爱你,今天发现再也没机会了。

人生已经太匆匆,不要再苦苦的追寻昨夜下过的雨,过去就过去了,接受它,拿起它,放下它,才能真的放自己一马。希望你们不孤单,勇敢地为自己喜欢的生活而活,永远站在光明的角落,我只希望你们开心快乐的生活。

微博言论往往带有强烈的情感色彩,对微博言论的情感分析是获取用户观点态度的重要方法。许多学者都是将研究的重点集中在句子词性、情感符号以及情感语料库等方面,然而用户自身的情感倾向性并没有受到足够的重视,因此,提出了一种新的微博情感分类方法,其通过建模用户自身的情感标志得分来帮助识别语句的情感特征,具体地讲,将带有情感信息的微博语句词向量序列输入到长短期记忆网络(LSTM),并将LSTM输出的特征表示与用户情感得分进行结合作为全连接层的输入,并通过Softmax层实现了对微博文本的情感极性分类。实验表明,提出的方法UA-LSTM在情感分类任务上的表现超过的所有基准方法,并且比最优的基准方法MF-CNN在F1值上提升了34%,达到091。

关键词: 情感分析, 长短期记忆网络, 用户情感倾向

Abstract:

Micro-blog's speech often has strong sentimental color, and the sentiment analysis of Micro-blog's speech is an important way to get users' opinions and attitudes Many researchers conduct research via focusing on the parts of speech (POS), emotion symbol and emotion corpus This paper proposes a novel method for Micro-blog sentiment analysis, which aims to identify the sentiment features of a text by modeling user sentiment tendency Specifically, we construct a sentiment information embedded word embedding sequence, and input it into a long short term memory (LSTM) model to get a sentiment embedded output representation Then we merge both the user sentiment tendency score and the output representation of LSTM, and use it as the input of a fully connected layer which is followed by a softmax layer to get the final sentiment classification result The experiment shows that the performance of our proposed method UA-LSTM is better than all the baseline methods on the sentimental classification task, and it achieves the F1-score up to 091, with an improvement of 34% over the best baseline method MF-CNN

情感分析自从2002年由Bo Pang提出之后,获得了很大程度的关注,特别是在在线评论的情感倾向性分析上获得了很大的发展。本文主要关注无监督的情感分析方法,由于不需要大量标注语料,无监督情感分析方法一直受到许多研究者的青睐,但同时效果也低于有监督的情感分析方法。

Turney首次提出基于种子词的非监督学习方法,使用“excelent”和“poor”两个种子词与未知词在搜索网页中的互信息来计算未知词的情感极性,并用以计算整个文本的情感极性。后续的非监督情感分析方法大都是基于生成或已有的情感词典或者相关资源进行情感分析。

例 如,Kennedy和Inkpen考虑文本中词的极性转移关系并基于种子词集合进行词计数决定情感倾向。朱嫣岚等人将 一组已知极性的词语集合作为种子,基于HowNet对未知词语与种子词进行语义计算,从而判别未知词的极性。Lin等采用LSM 模型、JST模型、Reverse-JST模型构建了三种无监督的情感分析系统。但是由于深层情感分析必然涉及到语义的分析, 以及文本中情感转移现象的经常出现,所以基于深层语义的情感分析效果并不理想,本文针对中文文本中经常出现的情感转移现象提出情感极性转移模型,提高了深层语义情感分析的分析效果。

一、一般处理流程

语料获取 -> 文本预处理 -> 特征工程 -> 特征选择

1、语料获取

即需要处理的数据及用于模型训练的语料。

数据源可能来自网上爬取、资料积累、语料转换、OCR转换等,格式可能比较混乱。需要将url、时间、符号等无意义内容去除,留下质量相对较高的非结构化数据。

2、文本预处理

将含杂质、无序、不标准的自然语言文本转化为规则、易处理、标准的结构化文本。

①处理标点符号

可通过正则判定、现有工具(zhon包)等方式筛选清理标点符号。

②分词

将连续的自然语言文本,切分成具有语义合理性和完整性的词汇序列的过程。

一般看来英文较容易可通过空格符号分词,中文相对复杂,参考结巴分词、盘古分词、Ansj等工具。

常见的分词算法有:基于字符串匹配的分词方法、基于理解的分词方法、基于统计的分词方法和基于规则的分词方法,每种方法下面对应许多具体的算法。

③词性标注

为自然语言文本中的每个词汇赋予一个词性的过程,如名词、动词、副词等。可以把每个单词(和它周围的一些额外的单词用于上下文)输入预先训练的词性分类模型。

常用隐马尔科夫模型、N 元模型、决策树

④stop word

英文中含大量 a、the、and,中文含大量 的、是、了、啊,这些语气词、助词没有明显的实际意义,反而容易造成识别偏差,可适当进行过滤。

⑤词形还原

偏向于英文中,单数/复数,主动/被动,现在进行时/过去时/将来时等,还原为原型。

⑥统计词频

因为一些频率过高/过低的词是无效的,对模型帮助很小,还会被当做噪声,做个词频统计用于停用词表。

⑦给单词赋予id

给每一个单词一个id,用于构建词典,并将原来的句子替换成id的表现形式

⑧依存句法分析

通过分析句子中词与词之间的依存关系,从而捕捉到词语的句法结构信息(如主谓、动宾、定中等结构关系),并使用树状结构来表示句子的句法结构信息(如主谓宾、定状补等)。

3、特征工程

做完语料预处理之后,接下来需要考虑如何把分词之后的字和词语表示成计算机能够计算的类型。

如果要计算我们至少需要把中文分词的字符串转换成数字,确切的说应该是数学中的向量。有两种常用的表示模型分别是词袋模型和词向量。

①词向量

词向量是将字、词语转换成向量矩阵的计算模型。目前为止最常用的词表示方法是 One-hot,这种方法把每个词表示为一个很长的向量。

②词袋模型

即不考虑词语原本在句子中的顺序,直接将每一个词语或者符号统一放置在一个集合(如 list),然后按照计数的方式对出现的次数进行统计。统计词频这只是最基本的方式,TF-IDF 是词袋模型的一个经典用法。

常用的表示模型有:词袋模型(Bag of Word, BOW),比如:TF-IDF 算法;词向量,比如 one-hot 算法、word2vec 算法等。

4、特征选择

在文本挖掘相关问题中,特征工程也是必不可少的。在一个实际问题中,构造好的特征向量,是要选择合适的、表达能力强的特征。

举个自然语言处理中的例子来说,我们想衡量like这个词的极性(正向情感还是负向情感)。我们可以预先挑选一些正向情感的词,比如good。然后我们算like跟good的PMI,用到点互信息PMI这个指标来衡量两个事物之间的相关性。

特征选择是一个很有挑战的过程,更多的依赖于经验和专业知识,并且有很多现成的算法来进行特征的选择。目前,常见的特征选择方法主要有 DF、 MI、 IG、 CHI、WLLR、WFO 六种。

5、模型训练

在特征向量选择好了以后,接下来要做的事情是根据应用需求来训练模型,我们使用不同的模型,传统的有监督和无监督等机器学习模型,如 KNN、SVM、Naive Bayes、决策树、GBDT、K-means 等模型;深度学习模型比如 CNN、RNN、LSTM、 Seq2Seq、FastText、TextCNN 等。这些模型在分类、聚类、神经序列、情感分析等应用中都会用到。

当选择好模型后,则进行模型训练,其中包括了模型微调等。在模型训练的过程中要注意由于在训练集上表现很好,但在测试集上表现很差的过拟合问题以及模型不能很好地拟合数据的欠拟合问题。同时,也要防止出现梯度消失和梯度爆炸问题。

6、模型评估

在机器学习、数据挖掘、推荐系统完成建模之后,需要对模型的效果做评价。模型的评价指标主要有:错误率、精准度、准确率、召回率、F1 值、ROC 曲线、AUC 曲线等。

7、投产上线

模型的投产上线方式主要有两种:一种是线下训练模型,然后将模型进行线上部署提供服务;另一种是在线训练模型,在线训练完成后将模型 pickle 持久化,提供对外服务。

三、NLP应用方向

1、命名实体识别

指识别自然语言文本中具有特定意义的实体,主要包括人名、地名、机构名、时间日期等。

传统机器学习算法主要有HMM和CRF,深度学习常用QRNN、LSTM,当前主流的是基于bert的NER。

2、情感分析

文本情感分析和观点挖掘(Sentiment Analysis),又称意见挖掘(Opinion Mining)是自然语言处理领域的一个重要研究方向。简单而言,是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。

情感分析技术可以分为两类,一类是基于机器学习的方法,通过大量有标注、无标注的主观语料,使用统计机器学习算法,通过提取特征,进行文本情感分析。另一类是基于情感词典的方法,根据情感词典所提供的词的情感极性(正向、负向),从而进行不同粒度的(词语、短语、属性、句子、篇章)下的文本情感分析。

3、文章标签

文章标签是利用机器学习算法,对文章进行文字和语义的分析后,提取出若干个重要的词或者短语(关键短语)。关键短语是NLP基础的算法模块,有了关键短语,能为后续的搜索、推荐等更高级的应用提供有力的抓手。

适用场景:1、个性化推荐:通过对文章的标签计算,结合用户画像,精准的对用户进行个性化推荐;2、话题聚合:根据文章计算的标签,聚合相同标签的文章,便于用户对同一话题的文章进行全方位的信息阅读;3、搜索:使用中心词可以对query进行相似度计算、聚类、改写等,可以用于搜索相关性计算。

4、案件串并

①信息抽取

运用实体抽取、关系抽取,从案情中抽取关键信息,如从警情中可以抽取报警人项目、报警人电话、案发地址等信息

②实体对齐

相同的实体在不同的案情中会有不同的表述,会给串并带来困难。可针对地址、人名、组织名进行对齐处理。

③文本聚类

对于关键片段类信息,无法像实体那样对齐,需要借助文本聚类技术进行关联。

④构建图谱

将信息抽取结果存入图谱。每个警情id对应一个节点,实体、属性、关键片段作为节点,对齐的实体、同一类的文本存为同一个节点。

除了来自于从警情中抽取的信息,还可以将其他警务系统中存在的结构化数据导入(如来自户籍信息的人物关系),从而丰富图谱。

⑤图谱检索

完成以上工作,即完成了案件串并的必要基础建设,接下来通过图谱的查询功能自动完成案件的串并。首先需要设定串并的条件,案件串并的条件在警务实战中已有很多的积累,如“具有相似的作案手段”,又如“相似作案手段,嫌疑人有共同联系人”,只需要将这些条件用图谱查询语言表达出来。

1 数据和算法的准确性:AI匹配伴侣的可靠性依赖于数据的准确性和算法的精确度。如果输入的数据不准确或者算法设计不合理,则匹配结果可能不可靠。

2 个人主观意愿的考量:AI可能难以考虑到一个人的主观意愿和喜好。虽然AI可以分析大量的数据和行为模式来预测一个人的喜好,但人类的喜好与个性是复杂而主观的,有时候AI可能难以预测。

3 缺乏人类的情感智能:AI虽然可以进行情感分析,但是它没有真正的情感理解和体验能力。寻找伴侣是一个涉及到情感和人际关系的过程,AI难以用纯粹的算法和数据分析来代替人类的情感智能。

4 潜在的偏见和歧视:AI系统的匹配结果可能受到机器学习算法本身的偏见影响,例如基于历史数据的性别、种族或社会经济地位的偏见。这可能会导致不公平的匹配结果。

5 缺乏实践验证:AI匹配的准确性往往需要大量的实践验证和反馈,而目前的AI伴侣匹配系统往往缺乏足够的验证和证据来支持其可靠性。

总的来说,虽然AI人工智能匹配伴侣在某些情况下可以提供参考和帮助,但完全依赖AI来寻找伴侣仍然不太可靠。传统的人际相处和情感理解仍然是寻找伴侣所必需的关键因素。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/699317.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-07-08
下一篇2023-07-08

发表评论

登录后才能评论

评论列表(0条)

    保存