与其他的人工智能技术相比,情感分析(Sentiment Analysis)显得有些特殊,因为其他的领域都是根据客观的数据来进行分析和预测,但情感分析则带有强烈的个人主观因素。情感分析的目标是从文本中分析出人们对于实体及其属性所表达的情感倾向以及观点,这项技术最早的研究始于2003年Nasukawa和Yi两位学者的关于商品评论的论文。
随着推特等社交媒体以及电商平台的发展而产生大量带有观点的内容,给情感分析提供了所需的数据基础。时至今日,情感识别已经在多个领域被广泛的应用。例如在商品零售领域,用户的评价对于零售商和生产商都是非常重要的反馈信息,通过对海量用户的评价进行情感分析,可以量化用户对产品及其竞品的褒贬程度,从而了解用户对于产品的诉求以及自己产品与竞品的对比优劣。在社会舆情领域,通过分析大众对于社会热点事件的点评可以有效的掌握舆论的走向。在企业舆情方面,利用情感分析可以快速了解社会对企业的评价,为企业的战略规划提供决策依据,提升企业在市场中的竞争力。在金融交易领域,分析交易者对于股票及其他金融衍生品的态度,为行情交易提供辅助依据。
目前,绝大多数的人工智能开放平台都具备情感分析的能力,如图所示是玻森中文语义开放平台的情感分析功能演示,可以看出除了通用领域的情感分析外,还有汽车、厨具、餐饮、新闻和微博几个特定领域的分析。
那么到底什么是情感分析呢?从自然语言处理技术的角度来看,情感分析的任务是从评论的文本中提取出评论的实体,以及评论者对该实体所表达的情感倾向,自然语言所有的核心技术问题,例如:词汇语义,指代消解,此役小气,信息抽取,语义分析等都会在情感分析中用到。因此,情感分析被认为是一个自然语言处理的子任务,我们可以将人们对于某个实体目标的情感统一用一个五元组的格式来表示:(e,a,s,h,t)
以图为例,e是指某餐厅,a为该餐厅的性价比属性,s是对该餐厅的性价比表示了褒义的评价,h为发表评论者本人,t是19年7月27日。所以这条评论的情感分析可以表示为五元组(某餐厅,性价比,正向褒义,评论者,19年7月27日)。
情感分析根据处理文本颗粒度的不同,大致可以分为三个级别的任务,分别是篇章级、句子级和属性级。我们分别来看一下。
1 篇章级情感分析
篇章级情感分析的目标是判断整篇文档表达的是褒义还是贬义的情感,例如一篇书评,或者对某一个热点时事新闻发表的评论,只要待分析的文本超过了一句话的范畴,即可视为是篇章级的情感分析。
对于篇章级的情感分析而言有一个前提假设,那就是全篇章所表达的观点仅针对一个单独的实体e,且只包含一个观点持有者h的观点。这种做法将整个文档视为一个整体,不对篇章中包含的具体实体和实体属性进行研究,使得篇章级的情感分析在实际应用中比较局限,无法对一段文本中的多个实体进行单独分析,对于文本中多个观点持有者的观点也无法辨别。
例如评价的文本是:“我觉得这款手机很棒。”评价者表达的是对手机整体的褒义评价,但如果是:“我觉得这款手机拍照功能很不错,但信号不是很好”这样的句子,在同一个评论中出现了褒义词又出现了贬义词,篇章级的分析是无法分辨出来的,只能将其作为一个整体进行分析。
不过好在有很多的场景是不需要区分观点评价的实体和观点持有者,例如在商品评论的情感分析中,可以默认评论的对象是被评论的商品,评论的观点持有者也是评论者本人。当然,这个也需要看被评论的商品具体是什么东西,如果是亲子旅游这样的旅游服务,那么评论中就很有可能包含一个以上的观点持有者。
在实际工作中,篇章级的情感分析无法满足我们对于评价更细致,如果需要对评论进行更精确,更细致的分析,我们需要拆分篇章中的每一句话,这就是句子级的情感分析研究的问题。
2 句子级情感分析
与篇章级的情感分析类似,句子级的情感分析任务是判断一个句子表达的是褒义还是贬义的情感,虽然颗粒度到了句子层级,但是句子级分析与篇章级存在同样的前提假设是,那就是一个句子只表达了一个观点和一种情感,并且只有一个观点持有人。如果一个句子中包含了两种以上的评价或多个观点持有人的观点,句子级的分析是无法分辨的。好在现实生活中,绝大多数的句子都只表达了一种情感。
既然句子级的情感分析在局限性上与篇章级是一样的,那么进行句子级的情感分析意义何在呢?关于这个问题,需要先解释一下语言学上主观句与客观句的分别。在我们日常用语当中,根据语句中是否带有说话人的主观情感可以将句子分为主观句和客观句,例如:“我喜欢这款新手机。”就是一个主观句,表达了说话人内心的情感或观点,而:“这个APP昨天更新了新功能。”则是一个客观句,陈述的是一个客观事实性信息,并不包含说话人内心的主观情感。通过分辨一个句子是否是主观句,可以帮助我们过滤掉一部分不含情感的句子,让数据处理更有效率。
但是在实操过程中,我们会发现这样的分类方法似乎并不是特别准确,因为一个主观句也可能没有表达任何的情感信息,知识表达了期望或者猜测,例如:“我觉得他现在已经在回家的路上了。”这句话是一个主观句,表达了说话人的猜测,但是并没有表达出任何的情感。而客观句也有可能包含情感信息,表明说话者并不希望这个事实发生,例如:“昨天刚买的新车就被人刮花了。”这句话是一个客观句,但结合常识我们会发现,这句话中其实是包含了说话人的负面情感。
所以,仅仅对句子进行主客观的分类还不足以达到对数据进行过滤的要求,我们需要的是对句子是否含有情感信息进行分类,如果一个句子直接表达或隐含了情感信息,则认为这个句子是含有情感观点的,对于不含情感观点的句子则可以进行过滤。目前对于句子是否含有情感信息的分类技术大多都是采用有监督的学习算法,这种方法需要大量的人工标注数据,基于句子特征来对句子进行分类。
总之,我们可以将句子级的情感分析分成两步,第一步是判断待分析的句子是否含有观点信息,第二步则是针对这些含有观点信息的句子进行情感分析,发现其中情感的倾向性,判断是褒义还是贬义。关于分析情感倾向性的方法与篇章级类似,依然是可以采用监督学习或根据情感词词典的方法来处理,我们会在后续的小节详细讲解。
句子级的情感分析相较于篇章级而言,颗粒度更加细分,但同样只能判断整体的情感,忽略了对于被评价实体的属性。同时它也无法判断比较型的情感观点,例如:“A产品的用户体验比B产品好多了。”对于这样一句话中表达了多个情感的句子,我们不能将其简单的归类为褒义或贬义的情感,而是需要更进一步的细化颗粒度,对评价实体的属性进行抽取,并将属性与相关实体之间进行关联,这就是属性级情感分析。
3 属性级情感分析
上文介绍的篇章级和句子级的情感分析,都无法确切的知道评价者喜欢和不喜欢的具体是什么东西,同时也无法区分对某一个被评价实体的A属性持褒义倾向,对B属性却持贬义倾向的情况。但在实际的语言表达中,一个句子中可能包含了多个不同情感倾向的观点,例如:“我喜欢这家餐厅的装修风格,但菜的味道却很一般。”类似于这样的句子,很难通过篇章级和句子级的情感分析了解到对象的属性层面。
为了在句子级分析的基础上更加细化,我们需要从文本中发现或抽取评价的对象主体信息,并根据文本的上下文判断评价者针对每一个属性所表达的是褒义还是贬义的情感,这种就称之为属性级的情感分析。属性级的情感分析关注的是被评价实体及其属性,包括评价者以及评价时间,目标是挖掘与发现评论在实体及其属性上的观点信息,使之能够生成有关目标实体及其属性完整的五元组观点摘要。具体到技术层面来看,属性级的情感分析可以分为以下6个步骤:
关于文本中的实体抽取和指代消解问题,我们已经在知识图谱的相关章节中做了介绍,这里就不再赘述。针对篇章级、句子级、属性级这三种类型的情感分析任务,人们做了大量的研究并提出了很多分类的方法,这些方法大致可以分为基于词典和基于机器学习两种,下面我们进行详细的讲解。
做情感分析离不开情感词,情感词是承载情感信息最基本的单元,除了基本的词之外,一些包含了情感含义的短语和成语我们也将其统称为情感词。基于情感词典的情感分析方法,主要是基于一个包含了已标注的情感词和短语的词典,在这个词典中包括了情感词的情感倾向以及情感强度,一般将褒义的情感标注为正数,贬义的情感标注为负数。
具体的步骤如图所示,首先将待分析的文本先进行分词,并对分词后的结果做去除停用词和无用词等文本数据的预处理。然后将分词的结果与情感词典中的词进行匹配,并根据词典标注的情感分对文本进行加法计算,最终的计算结果如果为正则是褒义情感,如果为负则是贬义情感,如果为0或情感倾向不明显的得分则为中性情感或无情感。
情感词典是整个分析流程的核心,情感词标注数据的好坏直接决定了情感分类的结果,在这方面可以直接采用已有的开源情感词典,例如BosonNLP基于微博、新闻、论坛等数据来源构建的情感词典,知网(Hownet)情感词典,台湾大学简体中文情感极性词典(NTSUSD),snownlp框架的词典等,同时还可以使用哈工大整理的同义词词林拓展词典作为辅助,通过这个词典可以找到情感词的同义词,拓展情感词典的范围。
当然,我们也可以根据业务的需要来自己训练情感词典,目前主流的情感词词典有三种构建方法:人工方法、基于字典的方法和基于语料库的方法。对于情感词的情感赋值,最简单的方法是将所有的褒义情感词赋值为+1,贬义的情感词赋值为-1,最后进行相加得出情感分析的结果。
但是这种赋值方式显然不符合实际的需求,在实际的语言表达中,存在着非常多的表达方式可以改变情感的强度,最典型的就是程度副词。程度副词分为两种,一种是可以加强情感词原本的情感,这种称之为情感加强词,例如“很好”相较于“好”的情感程度会更强烈,“非常好”又比“很好”更强。另外一种是情感减弱词,例如“没那么好”虽然也是褒义倾向,但情感强度相较于“好”会弱很多。如果出现了增强词,则需要在原来的赋值基础上增加情感得分,如果出现了减弱词则需要减少相应的情感得分。
另一种需要注意的情况是否定词,否定词的出现一般会改变情感词原本的情感倾向,变为相反的情感,例如“不好”就是在“好”前面加上了否定词“不”,使之变成了贬义词。早期的研究会将否定词搭配的情感词直接取相反数,即如果“好”的情感倾向是+1,那么“不好”的情感倾向就是-1。但是这种简单粗暴的规则无法对应上真实的表达情感,例如“太好”是一个比“好”褒义倾向更强的词,如果“好”的值为+1,那么“太好”可以赋值为+3,加上否定词的“不太好”变成-3则显然有点过于贬义了,将其赋值为-1或者-05可能更合适。
基于这种情况,我们可以对否定词也添加上程度的赋值而不是简单的取相反数,对于表达强烈否定的词例如“不那么”赋值为±4,当遇到与褒义词的组合时褒义词则取负数,与贬义词的组合则取正数,例如贬义词“难听”的赋值是-3,加上否定词变成“不那么难听”的情感得分就会是(-3+4=1)。
第三种需要注意的情况是条件词,如果一个条件词出现在句子中,则这个句子很可能不适合用来做情感分析,例如“如果我明天可以去旅行,那么我一定会非常开心。”,在这句话中有明显的褒义情感词,但是因为存在条件词“如果”,使得这个句子的并没有表达观点持有者的真实情感,而是一种假设。
除了条件句之外,还有一种语言表达也是需要在数据预处理阶段进行排除的,那就是疑问句。例如“这个餐厅真的有你说的那么好吗?”,虽然句子中出现了很强烈的褒义情感词“那么好”,但依然不能将它分类为褒义句。疑问句通常会有固定的结尾词,例如“……吗?”或者“……么?”,但是也有的疑问句会省略掉结尾词,直接使用标点符号“?”,例如“你今天是不是不开心?”,这个句子中含有否定词和褒义词组成的“不开心”,但不能将其分类为贬义情感。
最后一种需要注意的情况是转折词,典型词是“但是”,出现在转折词之前的情感倾向通常与转折词之后的情感倾向相反,例如:“我上次在这家酒店的住宿体验非常好,但是这次却让我很失望。”在这个转折句中,转折词之前的“非常好”是一个很强的褒义词,但真实的情感表达却是转折词之后的“很失望”,最终应该将其分类为贬义情感。当然,也存在出现了转折词,但语句本身的情感并没有发生改变的情况,例如“你这次考试比上次有了很大的进步,但是我觉得你可以做得更好”,这里的转折词没有转折含义,而是一种递进含义。在实际操作中,我们所以需要先判断转折句真实的情感表达到底是哪个,才能进行正确的分析计算。
构建情感词典是一件比较耗费人工的事情,除了上述需要注意的问题外,还存在精准度不高,新词和网络用语难以快速收录进词典等问题。同时基于词典的分析方法也存在很多的局限性,例如一个句子可能出现了情感词,但并没有表达情感。或者一个句子不含任何情感词,但却蕴含了说话人的情感。以及部分情感词的含义会随着上下文语境的变化而变化的问题,例如“精明”这个词可以作为褒义词夸奖他人,也可以作为贬义词批评他人。
尽管目前存在诸多问题,但基于字典的情感分析方法也有着不可取代的优势,那就是这种分析方法通用性较强,大多数情况下无需特别的领域数据标注就可以分析文本所表达的情感,对于通用领域的情感分析可以将其作为首选的方案。
我们在机器学习算法的章节介绍过很多分类算法,例如逻辑回归、朴素贝叶斯、KNN等,这些算法都可以用于情感识别。具体的做法与机器学习一样需要分为两个步骤,第一步是根据训练数据构建算法模型,第二步是将测试数据输入到算法模型中输出对应的结果,接下来做具体的讲解。
首先,我们需要准备一些训练用的文本数据,并人工给这些数据做好情感分类的标注,通常的做法下,如果是褒义和贬义的两分类,则褒义标注为1,贬义标注为0,如果是褒义、贬义和中性三分类,则褒义标注为1,中性标注为0,贬义标注为-1
在这一环节中如果用纯人工方法来进行标注,可能会因为个人主观因素对标注的结果造成一定影响,为了避免人的因素带来的影响,也为了提高标注的效率,有一些其他取巧的方法来对数据进行自动标注。比如在电商领域中,商品的评论除了文本数据之外通常还会带有一个5星的等级评分,我们可以根据用户的5星评分作为标注依据,如果是1-2星则标注为贬义,如果是3星标注为中性,4-5星标注为褒义。又比如在社区领域中,很多社区会对帖子有赞和踩的功能,这一数据也可以作为情感标注的参考依据。
第二步是将标注好情感倾向的文本进行分词,并进行数据的预处理,前文已经对分词有了很多的介绍,这里就不再过多的赘述。第三步是从分词的结果中标注出具备情感特征的词,这里特别说一下,如果是对情感进行分类,可以参考情感词典进行标注,也可以采用TF-IDF算法自动抽取出文档的特征词进行标注。如果分析的是某个特定领域的,还需要标注出特定领域的词,例如做商品评价的情感分析,需要标注出商品名称,品类名称,属性名称等。第四步根据分词统计词频构建词袋模型,形成特征词矩阵,如表所示。在这一步可以根据业务需要给每个特征词赋予权重,并通过词频乘以权重得到特征词分数。最后一步就是根据分类算法,将特征词矩阵作为输入数据,得到最终的分类模型。
当训练好分类模型之后,就可以对测试集进行分类了,具体的流程与建模流程类似,先对测试的文本数据进行分词并做数据预处理,然后根据特征词矩阵抽取测试文本的特征词构建词袋矩阵,并将词袋矩阵的词频数据作为输入数据代入之前训练好的模型进行分类,得到分类的结果。
采用基于机器学习的方法进行情感分析有以下几个不足之处,第一是每一个应用领域之间的语言描述差异导致了训练得到的分类模型不能应用与其他的领域,需要单独构建。第二是最终的分类效果取决于训练文本的选择以及正确的情感标注,而人对于情感的理解带有主观性,如果标注出现偏差就会对最终的结果产生影响。
除了基于词典和基于机器学习的方法,也有一些学者将两者结合起来使用,弥补两种方法的缺点,比单独采用一种方法的分类效果要更好,另外,也有学者尝试使用基于LSTM等深度学习的方法对情感进行分析,相信在未来,情感分析会应用在更多的产品中,帮助我们更好的理解用户需求,提升用户使用智能产品的体验。
随着深度神经网络等算法的应用,情感分析的研究方向已经有了非常大的进展,但依然存在着一些难题是目前尚未解决的,在实操过程中需特别注意以下几种类型数据:
情绪轮在用户体验设计上被广泛的应用,很多情感化设计都是基于情绪轮进行的。但是在人工智能领域,将情绪进行多分类比情感分析的三分类任务要难得多,目前大多数分类方法的结果准确性都不到50%。这是因为情绪本身包含了太多的类别,而且不同的类别之间又可能具有相似性,一个情绪词在不同的语境下有可能表达的是不同的情绪类别,算法很难对其进行分类。即使是人工对文本进行情绪类别标注也往往效果不佳,因为情绪是非常主观性的,不同的人对不同的文本可能产生不同的理解,这使得人工标注情绪类比的过程异常困难。如何让机器可以理解真实的情绪目前还是一个未能攻克的难题。
对某些事物的体验或感受,日常交际的做法与表达……都属于主观类偏情感的询问。
在回答这类问题时,我们不仅要思考实际运用的场景,还需要考虑对方的情感体验。
1了解用户的情感需求和痛点。
以用户的核心需求为出发点,给出实际可行的解决方案。
另外,仔细体味提问蕴含的情感色彩,分析用户是否有情感上的偏向,是积极还是消极。
2结合自身经验回答,建议要具体。
困扰不已的难题、进退两难的处境,做过、经历过,再遇到就能轻松应对。
所以,我们也可以尝试用亲身经历或是类比、故事的方式说明问题的解决方案,让回答更好理解。
3措辞要恰当,维护对方的心理体验。
换位思考,首先要对用户的想法表示同情和理解,尊重对方的感受。
在表达自己的看法时,也要尽量保持客观、中立,避免使用容易引起争议或冲突性的语言。
最后,根据不同的场合和情境,适当切换不同的表达方式,帮助用户更好的处理问题或做出决定。
✅ 合格案例分享
问题类型——怎么做、怎么做
情感类合格案例分享
案例分析:
回答首先说明提问适用什么语气,再分条列出不同的回复话术,清晰完整;
具体话术站在用户的角度考虑,用温馨积极的态度促进夫妻间感情,满足需求。
问题类型——询问体验、感受
案例 1
情感类合格案例分享
案例 2
情感类合格案例分享
案例分析:
以上两个回答,开头都先对某种事物的体验、感受进行总结。
案例 1 从提问职业性质、工作地点及工作量等角度,客观分析了为什么会有累的感受;
案例 2 从亲身经历出发,真诚地分享了自己的心路历程、情感体验,给用户提供参考。
情感化是用户运营的关键抓手。情感是人类的共同语言,也是人类的底层操作系统,我们所有的言行都是由某种情感驱动的。
1)同理心:情感的底层逻辑
同理心的主要表现有两点:一是角色代入;二是感同身受。
2019年,一部名叫《啥是佩奇》的视频短片火爆全网。讲述了一个爷爷为了给孙子准备礼物, 寻找并制作佩奇的有趣故事。
虽然这只是一部**的宣传片,但从另外一个角度来看,它折射出了城乡之间的文化差异,每逢佳节父母对儿女回家的期盼。这种现实就会达到让大家的感同身受,情感共鸣的效果。
2)找到引爆情感的导火索
企业如何抓住年轻用户的情感导火索,吸引他们的注意力,引爆他们的情感,是许多传统品牌需要思考的问题。
所有情感的引爆都是从捕捉公众情绪开始的,情绪通常是飘忽不定的,捕捉它需要敏锐的洞察力。比如新媒体运营组织“新世相”连续策划的“逃离北上广”“佛系少年”“丢书大作战”等活动,其成功的根本原因就在于对公众潜在情绪的精准捕捉。“逃离北上广”是对一线城市白领生活压力的回应,“佛系少年” 是对“90 后”“00 后”年轻群体差异化价值观和生活态度的精准把握,情感引爆从情绪入手,最高境界是将情感升维为价值观,让其成为品牌的人格化标签。比如小米的“ 为‘发烧’而生”,苹果的“Think Different”,京瓷的“积善行,思利他”。情绪、情感都是具象化的、偏感性的表达,而价值观则是情绪、情感的符号化和抽象化,更稳定、更持久。因此,用户运营的短期目标是调动情绪,引发情感共鸣;长期目标是在持续的情感互动中,形成能引发用户广泛共鸣的价值观。
在2008年为在汶川灾区捐款1亿元人民币的王老吉,2021年为河南洪灾低调驰援的鸿星尔克,都抓住了广大用户的情感导火索,以民族大义、社会责任感等情感引爆了用户情感。在这一过程中,王老吉、鸿星尔克都不再是普普通通的市场品牌,而成为爱国爱家的情感映射,成为一种情感符号。
品牌只有通过与用户共情,建立与用户的情感连接,才能获得用户好感,引导用户传播口碑。而讲好品牌故事,与用户平等沟通对话,正是以情感化做好用户运营的第一步。
在近期举办的ISO/IECJTC1/SC35德国柏林会议上,由中国科学院软件研究所、中国电子技术标准化研究院、小i机器人三家中国科研机构和企业共同提出的“信息技术—情感计算用户界面—框架”提案获得正式立项。这是用户界面分委会首个关于情感计算的标准,也是中国在用户界面领域第一个立项的国际标准。
本次立项的标准是情感计算用户界面系列标准的第一个框架标准,该标准共有五部分内容,涉及基本术语、情感交互过程、情感交互框架等方面的规范性描述。后续将对情感的分类和表达、情感计算用户界面的功能接口、情感表达与呈现和情感数据集等四个部分内容制定更详细的标准。
随着信息技术的发展,最稀缺的资源不再是信息本身,而是对信息的处理能力。且绝大多数信息表现为文本形式,如何在如此大量且复杂的文本信息中如何获取最有效的信息是信息处理的一大目标。文本分类可以帮助用户准确定位所需信息和分流信息。同时,互联网的快速发展催生了大量的书评影评、网络聊天、产品介绍等形式的短文本,其包含大量有价值的隐含信息,迫切需要自动化工具对短文本进行分类处理。
基于人工智能技术的文本分类系统依据文本的语义可实现将大量文本自动分类。多种统计理论和机器学习方法被用于文本自动分类。但其存在最大的问题是特征空间的高维性和文档表示向量的稀疏性。中文词条的总数高达二十多万,如此高维特征空间对所有的算法都是偏大的。亟需一种有效的特征抽取方法,降低特征空间的维数,提高分类的效率和精度。
文本分类方法主要分为两大类,分别是基于传统机器学习的方法和基于深度学习的方法。基于传统机器学习的文本分类方法主要是是对文本进行预处理、特征提取,然后将处理后的文本向量化,最后通过常见的机器学习分类算法来对训练数据集进行建模,传统的文本分类方法中,对文本的特征提取质量对文本分类的精度有很大的影响。基于深度学习的方法则是通过例如CNN等深度学习模型来对数据进行训练,无需人工的对数据进行特征抽取,对文本分类精度影响更多的是数据量以及训练的迭代次数。
短文本相对于长文本,词汇个数少且描述信息弱,具有稀疏性和不规范性, 传统机器学习方法的文本表示是高纬度高稀疏的,特征表达能力很弱,而且神经网络很不擅长对此类数据的处理;此外需要人工进行特征工程,成本很高,不能很好的满足短文本分类的需求。而深度学习最初在之所以图像和语音取得巨大成功,一个很重要的原因是图像和语音原始数据是连续和稠密的,有局部相关性。应用深度学习解决大规模文本分类问题最重要的是解决文本表示,再利用CNN/RNN等网络结构自动获取特征表达能力,去掉繁杂的人工特征工程。
短文本分类算法广泛应用于各个行业领域,如新闻分类、人机写作判断、垃圾邮件识别、用户情感分类、文案智能生成、商品智能推荐等。
场景一:商品智能推荐,根据用户购买的商品名称作为预测样本进行文本分类,得到用户交易类别,结合其他数据构建用户画像,针对不同特征的用户画像预测用户下一步的购买行为,智能推荐商品及服务。
场景二:文案智能生成,基于优质文案作为训练集,得到文本分类模型,当用户输入关键词时,智能推荐适配文案。
场景三:给新闻自动分类或打标签,多个标签。
场景四:判断文章是人写还是机器写的。
场景五:判断影评中的情感是正向、负向、中立,相类似应用场景很广泛。
使用深度学习的词向量技术,把文本数据从高纬度高稀疏的神经网络难处理的方式,变成了类似图像、语音的连续稠密数据,将词语转化为稠密向量,解决了文本表示问题。词向量作为机器学习、深度学习模型的特征进行输入,对最终模型的效果作用比较大。
同时,利用CNN/RNN等深度学习网络及其变体解决自动特征提取(即特征表达)的问题,对应的文本分类模型如下:
1) FastText
FastText是Facebook开源的词向量与文本分类工具,模型简单,训练速度快。FastText 的原理是将短文本中的所有词向量进行平均,然后直接接softmax层,同时加入一些n-gram 特征的 trick 来捕获局部序列信息。相对于其它文本分类模型,如SVM,Logistic Regression和Neural Network等模型,FastText在保持分类效果的同时,大大缩短了训练时间,同时支持多语言表达,但其模型是基于词袋针对英文的文本分类方法,组成英文句子的单词是有间隔的,而应用于中文文本,需分词去标点转化为模型需要的数据格式。
2)TextCNN
TextCNN相比于FastText,利用CNN (Convolutional Neural Network)来提取句子中类似 n-gram 的关键信息,且结构简单,效果好。
3)TextRNN
尽管TextCNN能够在很多任务里面能有不错的表现,但CNN最大的问题是固定 filter_size 的视野,一方面无法建模更长的序列信息,另一方面 filter_size 的超参调节很繁琐。CNN本质是做文本的特征表达工作,而自然语言处理中更常用的是递归神经网络(RNN, Recurrent Neural Network),能够更好的表达上下文信息。具体在文本分类任务中,Bi-directional RNN(实际使用的是双向LSTM)从某种意义上可以理解为可以捕获变长且双向的的 "n-gram" 信息。
4)TextRNN + Attention
CNN和RNN用在文本分类任务中尽管效果显著,但都有一个缺点,直观性和可解释性差。而注意力(Attention)机制是自然语言处理领域一个常用的建模长时间记忆机制,能够直观的给出每个词对结果的贡献,是Seq2Seq模型的标配。实际上文本分类从某种意义上也、可以理解为一种特殊的Seq2Seq,所以可以考虑将Attention机制引入。
Attention的核心点是在翻译每个目标词(或预测商品标题文本所属类别)所用的上下文是不同的,这样更合理。加入Attention之后能够直观的解释各个句子和词对分类类别的重要性。
5)TextRCNN(TextRNN + CNN)
用前向和后向RNN得到每个词的前向和后向上下文的表示,这样词的表示就变成词向量和前向后向上下文向量concat起来的形式,最后连接TextCNN相同卷积层,pooling层即可,唯一不同的是卷积层 filter_size = 1。
总结:实际应用中,CNN模型在中文文本分类中应用效果已经很不错了。研究表明,TextRCNN对准确率提升大约1%,不是十分显著。最佳实践是先用TextCNN模型把整体任务效果调试到最好,再尝试改进模型。
参考: 文本分类解决方法综述
制作广告是为了传播信息 情感文案有几种类型 ,传播什么样 情感文案有几种类型 的信息取决于广告委托方的目标。根据目标的不同,广告可以分为以下几种类型:
①直接推销商品的广告。这类广告必须完整地展示产品属性及订购流程等各种细节信息,以便客户可以根据充分的信息来决定是否购买。文案写作的侧重点是解答客户所有的疑问,让对方信任你推销的产品,最终促成交易。直接推销商品的广告是文案写作最常见的形式。
②发掘潜在客户的广告。当企业锁定某个目标消费群体时,就会发出一些邀请客户参与活动之类的广告。此类广告文案写作的侧重点是寻找可能对产品感兴趣的人,引导他们主动向客服人员咨询更多的产品信息。宣传企业与工厂采购人员的大宗交易,往往会采取这种类型的广告。
③吸引客户注意的广告。这类广告主要出现在零售行业和餐饮行业,其目的不在于直接销售,而在于持续吸引客户的注意力,激发他们的购买欲望。比如:发放的传单和优惠券就属于吸引客户注意的广告。你未必会马上消费,但会记住营销信息,以便在需要的时候优先选择。
④企业形象广告。这类广告宣传的对象不是商品,而是企业本身,最终目的是在客户心中塑造一个良好的企业形象。无论是提升公司形象,还是消除企业负面舆论影响,企业形象广告都是一个重要的宣传工具。
哪怕是针对同一个产品或企业的广告,也可以采取五花八门的内容来进行宣传。根据内容的不同,广告文案可以分为以下几种类型:
(1)问题式广告
即在标题中提出问题,在正文中逐渐解开答案。
(2)新闻式广告
用于新产品发布或旧产品更新升级说明。
(3)测验式广告
即在广告文案中设置一个小测试,以了解用户是否是你的潜在客户。
(4)奖励式广告
以阅读广告可以领取某种回报,为吸引客户的手段。
(5)命令式广告
要求客户按照广告的相关要求采取行动。
(6)优惠折扣式广告
告诉客户哪些产品在什么时间段有优惠活动,折扣是多少,在哪里购买,怎样购买等信息。
(7)理由式广告
在文案中列举客户应该购买某款产品的若干个理由。
(8)效果对比式广告
在广告中展现客户使用产品前后的某种差异,以此表明产品的功效。
(9)见证式广告
由名人或资深客户为产品唱赞歌。
(10)故事式广告
讲述人与产品之间的情感故事或励志故事。
(11)信息式广告
向客户提供实用的产品信息,但不直接推销产品。
(12)场合式广告
在文案中描述产品在具体场合中表现出来的优势,比如多功能、便利性、坚固耐用、美观性等。
(13)挑战式广告
向客户发起某种挑战赛,并许诺参赛者能获得不同等级的奖品。
(14)比较式广告
在文案中对比同类产品,让大家看到你的产品在哪些方面优于竞争对手的产品。
(1)传统对用户定义,是以产品为维度对用户行分类,关注点在产品上。商业行为均以产品为中心展开,从商家认为有需求,开始产品生产、分销渠道、广告宣传、用户购买,成交,所有行为均围绕着产品展开。在这样的模式下,所谓“我的用户”是针对厂家和产品而言的,比如:用户购买了a产品,针对a产品的厂家来说,用户为该厂家或a产品的用户。按照这个逻辑分析可得,以往的传统模式,所谓的“用户价值”只是指单一维度的产品价值。有些做得好的企业,给用户“多”增加了一些附加值,比如海底捞,多增加了一个做到极致服务。
(2)满足用户需求?用户到底想要什么?我们按照以上的逻辑分析,用户无非是自私的,用户除了要产品本身的价值外,还想要其他的价值。所谓满足用户需求,就是满足产品本身单一维度的需求外,还要满足其他多维度的其他需求,可就是所谓的客户体验。
(3)什么是用户价值?用户价值就是用户对单一维度的产品价值+期望(欲望)维度的其他需求,经过不理性的大脑对其欲望满足程度的感受。按照这个逻辑,用户的定义,是以人为维度对产品进行分类,关注点在人上。所有的商业行为均以人为中心展开,以人的需求,商家展开生产,宣传,用户定制购买,成交,所有的行为均围绕着人展开。在这样的模式下,所谓“我”的用户,在当下的互联网时代,应该就是所谓的个人ip或企业ip吧。以后所谓“我的用户”应该是,用户选择是谁的客户,他就是谁的客户,无法满足用户多维度需求的商家举步维艰。
(4)细说“人”其他维度的欲望需求?,既然以“人”为维度进行分类,那人性就是本质,人性的特点,1有异质性,用户的特点千差万别,几乎很难找到完全一样的用户2情景性,用户的行为受情景的影响3有可塑性,用户是可变得,其偏好随着认知会随外界不同信息的刺激随时发生变化和演化4自利性,用户是追求个人总效用的最大化。用户价值有几个特点,1是需求的集合,2是众多商家的客户,不稳定3是众多商品的使用者4随着人性的变化,需求随时在变。
个人认为,关于用户价值最大化,最大限度地满足用户需求,现阶段所谓其他维度的需求,主要是精神层面的,比如情感上,感受上,心理上,人性的弱点等一些需求
有愿意加入的朋友吗?一起副业创业
副业赚钱团队-老倪
首先声明本人认为这两种方式并不冲突。而且情感化设计更像是用户体验设计的补充。
下面我们就好好聊一下,情感化设计应该算是腾讯提出来的,我个人也是非常认同的,设计的本质在于传达感情,没人会喜欢一个冷冰冰的设计。而用户体验设计应该算是乔老爷子提出来的,用户体验的本质是给予用户一种良好的使用感受。而这两种设计我认为都应该是贯彻产品始终的,并不是某一个单点的运用。毕竟如今的所有产品更像是一种服务。
首先我作为一名设计师,虽然不是什么大牛,但是还是有一颗设计师的心。我认为如今的很多设计师犯了一个很严重的毛病,就是过于爱炫技,之前腾讯设计团队的一篇文章写的很好,就是设计过于追波风。设计的本质在于服务好产品,漂亮的设计是会给人不错的感受,但前提一定要先把产品服务好,如果说漂亮的设计影响了产品的使用感受,那它仅仅是一个美的设计,并不算一个好的设计。做到服务好产品的设计就算是做好了用户体验设计。
那么怎么算是做好了情感化的设计呢?产品本身是没有情感的,这时候我们用设计传递给用户我们的情感,当然指的是好的一面,这时候不仅会给用户带来良好的使用感受,更会带来更高层次的心理感受,自己的品牌传达也会有很好的体现。
UIpark培训
请使用手机"扫一扫"x
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)