与其他的人工智能技术相比,情感分析(Sentiment Analysis)显得有些特殊,因为其他的领域都是根据客观的数据来进行分析和预测,但情感分析则带有强烈的个人主观因素。情感分析的目标是从文本中分析出人们对于实体及其属性所表达的情感倾向以及观点,这项技术最早的研究始于2003年Nasukawa和Yi两位学者的关于商品评论的论文。
随着推特等社交媒体以及电商平台的发展而产生大量带有观点的内容,给情感分析提供了所需的数据基础。时至今日,情感识别已经在多个领域被广泛的应用。例如在商品零售领域,用户的评价对于零售商和生产商都是非常重要的反馈信息,通过对海量用户的评价进行情感分析,可以量化用户对产品及其竞品的褒贬程度,从而了解用户对于产品的诉求以及自己产品与竞品的对比优劣。在社会舆情领域,通过分析大众对于社会热点事件的点评可以有效的掌握舆论的走向。在企业舆情方面,利用情感分析可以快速了解社会对企业的评价,为企业的战略规划提供决策依据,提升企业在市场中的竞争力。在金融交易领域,分析交易者对于股票及其他金融衍生品的态度,为行情交易提供辅助依据。
目前,绝大多数的人工智能开放平台都具备情感分析的能力,如图所示是玻森中文语义开放平台的情感分析功能演示,可以看出除了通用领域的情感分析外,还有汽车、厨具、餐饮、新闻和微博几个特定领域的分析。
那么到底什么是情感分析呢?从自然语言处理技术的角度来看,情感分析的任务是从评论的文本中提取出评论的实体,以及评论者对该实体所表达的情感倾向,自然语言所有的核心技术问题,例如:词汇语义,指代消解,此役小气,信息抽取,语义分析等都会在情感分析中用到。因此,情感分析被认为是一个自然语言处理的子任务,我们可以将人们对于某个实体目标的情感统一用一个五元组的格式来表示:(e,a,s,h,t)
以图为例,e是指某餐厅,a为该餐厅的性价比属性,s是对该餐厅的性价比表示了褒义的评价,h为发表评论者本人,t是19年7月27日。所以这条评论的情感分析可以表示为五元组(某餐厅,性价比,正向褒义,评论者,19年7月27日)。
情感分析根据处理文本颗粒度的不同,大致可以分为三个级别的任务,分别是篇章级、句子级和属性级。我们分别来看一下。
1 篇章级情感分析
篇章级情感分析的目标是判断整篇文档表达的是褒义还是贬义的情感,例如一篇书评,或者对某一个热点时事新闻发表的评论,只要待分析的文本超过了一句话的范畴,即可视为是篇章级的情感分析。
对于篇章级的情感分析而言有一个前提假设,那就是全篇章所表达的观点仅针对一个单独的实体e,且只包含一个观点持有者h的观点。这种做法将整个文档视为一个整体,不对篇章中包含的具体实体和实体属性进行研究,使得篇章级的情感分析在实际应用中比较局限,无法对一段文本中的多个实体进行单独分析,对于文本中多个观点持有者的观点也无法辨别。
例如评价的文本是:“我觉得这款手机很棒。”评价者表达的是对手机整体的褒义评价,但如果是:“我觉得这款手机拍照功能很不错,但信号不是很好”这样的句子,在同一个评论中出现了褒义词又出现了贬义词,篇章级的分析是无法分辨出来的,只能将其作为一个整体进行分析。
不过好在有很多的场景是不需要区分观点评价的实体和观点持有者,例如在商品评论的情感分析中,可以默认评论的对象是被评论的商品,评论的观点持有者也是评论者本人。当然,这个也需要看被评论的商品具体是什么东西,如果是亲子旅游这样的旅游服务,那么评论中就很有可能包含一个以上的观点持有者。
在实际工作中,篇章级的情感分析无法满足我们对于评价更细致,如果需要对评论进行更精确,更细致的分析,我们需要拆分篇章中的每一句话,这就是句子级的情感分析研究的问题。
2 句子级情感分析
与篇章级的情感分析类似,句子级的情感分析任务是判断一个句子表达的是褒义还是贬义的情感,虽然颗粒度到了句子层级,但是句子级分析与篇章级存在同样的前提假设是,那就是一个句子只表达了一个观点和一种情感,并且只有一个观点持有人。如果一个句子中包含了两种以上的评价或多个观点持有人的观点,句子级的分析是无法分辨的。好在现实生活中,绝大多数的句子都只表达了一种情感。
既然句子级的情感分析在局限性上与篇章级是一样的,那么进行句子级的情感分析意义何在呢?关于这个问题,需要先解释一下语言学上主观句与客观句的分别。在我们日常用语当中,根据语句中是否带有说话人的主观情感可以将句子分为主观句和客观句,例如:“我喜欢这款新手机。”就是一个主观句,表达了说话人内心的情感或观点,而:“这个APP昨天更新了新功能。”则是一个客观句,陈述的是一个客观事实性信息,并不包含说话人内心的主观情感。通过分辨一个句子是否是主观句,可以帮助我们过滤掉一部分不含情感的句子,让数据处理更有效率。
但是在实操过程中,我们会发现这样的分类方法似乎并不是特别准确,因为一个主观句也可能没有表达任何的情感信息,知识表达了期望或者猜测,例如:“我觉得他现在已经在回家的路上了。”这句话是一个主观句,表达了说话人的猜测,但是并没有表达出任何的情感。而客观句也有可能包含情感信息,表明说话者并不希望这个事实发生,例如:“昨天刚买的新车就被人刮花了。”这句话是一个客观句,但结合常识我们会发现,这句话中其实是包含了说话人的负面情感。
所以,仅仅对句子进行主客观的分类还不足以达到对数据进行过滤的要求,我们需要的是对句子是否含有情感信息进行分类,如果一个句子直接表达或隐含了情感信息,则认为这个句子是含有情感观点的,对于不含情感观点的句子则可以进行过滤。目前对于句子是否含有情感信息的分类技术大多都是采用有监督的学习算法,这种方法需要大量的人工标注数据,基于句子特征来对句子进行分类。
总之,我们可以将句子级的情感分析分成两步,第一步是判断待分析的句子是否含有观点信息,第二步则是针对这些含有观点信息的句子进行情感分析,发现其中情感的倾向性,判断是褒义还是贬义。关于分析情感倾向性的方法与篇章级类似,依然是可以采用监督学习或根据情感词词典的方法来处理,我们会在后续的小节详细讲解。
句子级的情感分析相较于篇章级而言,颗粒度更加细分,但同样只能判断整体的情感,忽略了对于被评价实体的属性。同时它也无法判断比较型的情感观点,例如:“A产品的用户体验比B产品好多了。”对于这样一句话中表达了多个情感的句子,我们不能将其简单的归类为褒义或贬义的情感,而是需要更进一步的细化颗粒度,对评价实体的属性进行抽取,并将属性与相关实体之间进行关联,这就是属性级情感分析。
3 属性级情感分析
上文介绍的篇章级和句子级的情感分析,都无法确切的知道评价者喜欢和不喜欢的具体是什么东西,同时也无法区分对某一个被评价实体的A属性持褒义倾向,对B属性却持贬义倾向的情况。但在实际的语言表达中,一个句子中可能包含了多个不同情感倾向的观点,例如:“我喜欢这家餐厅的装修风格,但菜的味道却很一般。”类似于这样的句子,很难通过篇章级和句子级的情感分析了解到对象的属性层面。
为了在句子级分析的基础上更加细化,我们需要从文本中发现或抽取评价的对象主体信息,并根据文本的上下文判断评价者针对每一个属性所表达的是褒义还是贬义的情感,这种就称之为属性级的情感分析。属性级的情感分析关注的是被评价实体及其属性,包括评价者以及评价时间,目标是挖掘与发现评论在实体及其属性上的观点信息,使之能够生成有关目标实体及其属性完整的五元组观点摘要。具体到技术层面来看,属性级的情感分析可以分为以下6个步骤:
关于文本中的实体抽取和指代消解问题,我们已经在知识图谱的相关章节中做了介绍,这里就不再赘述。针对篇章级、句子级、属性级这三种类型的情感分析任务,人们做了大量的研究并提出了很多分类的方法,这些方法大致可以分为基于词典和基于机器学习两种,下面我们进行详细的讲解。
做情感分析离不开情感词,情感词是承载情感信息最基本的单元,除了基本的词之外,一些包含了情感含义的短语和成语我们也将其统称为情感词。基于情感词典的情感分析方法,主要是基于一个包含了已标注的情感词和短语的词典,在这个词典中包括了情感词的情感倾向以及情感强度,一般将褒义的情感标注为正数,贬义的情感标注为负数。
具体的步骤如图所示,首先将待分析的文本先进行分词,并对分词后的结果做去除停用词和无用词等文本数据的预处理。然后将分词的结果与情感词典中的词进行匹配,并根据词典标注的情感分对文本进行加法计算,最终的计算结果如果为正则是褒义情感,如果为负则是贬义情感,如果为0或情感倾向不明显的得分则为中性情感或无情感。
情感词典是整个分析流程的核心,情感词标注数据的好坏直接决定了情感分类的结果,在这方面可以直接采用已有的开源情感词典,例如BosonNLP基于微博、新闻、论坛等数据来源构建的情感词典,知网(Hownet)情感词典,台湾大学简体中文情感极性词典(NTSUSD),snownlp框架的词典等,同时还可以使用哈工大整理的同义词词林拓展词典作为辅助,通过这个词典可以找到情感词的同义词,拓展情感词典的范围。
当然,我们也可以根据业务的需要来自己训练情感词典,目前主流的情感词词典有三种构建方法:人工方法、基于字典的方法和基于语料库的方法。对于情感词的情感赋值,最简单的方法是将所有的褒义情感词赋值为+1,贬义的情感词赋值为-1,最后进行相加得出情感分析的结果。
但是这种赋值方式显然不符合实际的需求,在实际的语言表达中,存在着非常多的表达方式可以改变情感的强度,最典型的就是程度副词。程度副词分为两种,一种是可以加强情感词原本的情感,这种称之为情感加强词,例如“很好”相较于“好”的情感程度会更强烈,“非常好”又比“很好”更强。另外一种是情感减弱词,例如“没那么好”虽然也是褒义倾向,但情感强度相较于“好”会弱很多。如果出现了增强词,则需要在原来的赋值基础上增加情感得分,如果出现了减弱词则需要减少相应的情感得分。
另一种需要注意的情况是否定词,否定词的出现一般会改变情感词原本的情感倾向,变为相反的情感,例如“不好”就是在“好”前面加上了否定词“不”,使之变成了贬义词。早期的研究会将否定词搭配的情感词直接取相反数,即如果“好”的情感倾向是+1,那么“不好”的情感倾向就是-1。但是这种简单粗暴的规则无法对应上真实的表达情感,例如“太好”是一个比“好”褒义倾向更强的词,如果“好”的值为+1,那么“太好”可以赋值为+3,加上否定词的“不太好”变成-3则显然有点过于贬义了,将其赋值为-1或者-05可能更合适。
基于这种情况,我们可以对否定词也添加上程度的赋值而不是简单的取相反数,对于表达强烈否定的词例如“不那么”赋值为±4,当遇到与褒义词的组合时褒义词则取负数,与贬义词的组合则取正数,例如贬义词“难听”的赋值是-3,加上否定词变成“不那么难听”的情感得分就会是(-3+4=1)。
第三种需要注意的情况是条件词,如果一个条件词出现在句子中,则这个句子很可能不适合用来做情感分析,例如“如果我明天可以去旅行,那么我一定会非常开心。”,在这句话中有明显的褒义情感词,但是因为存在条件词“如果”,使得这个句子的并没有表达观点持有者的真实情感,而是一种假设。
除了条件句之外,还有一种语言表达也是需要在数据预处理阶段进行排除的,那就是疑问句。例如“这个餐厅真的有你说的那么好吗?”,虽然句子中出现了很强烈的褒义情感词“那么好”,但依然不能将它分类为褒义句。疑问句通常会有固定的结尾词,例如“……吗?”或者“……么?”,但是也有的疑问句会省略掉结尾词,直接使用标点符号“?”,例如“你今天是不是不开心?”,这个句子中含有否定词和褒义词组成的“不开心”,但不能将其分类为贬义情感。
最后一种需要注意的情况是转折词,典型词是“但是”,出现在转折词之前的情感倾向通常与转折词之后的情感倾向相反,例如:“我上次在这家酒店的住宿体验非常好,但是这次却让我很失望。”在这个转折句中,转折词之前的“非常好”是一个很强的褒义词,但真实的情感表达却是转折词之后的“很失望”,最终应该将其分类为贬义情感。当然,也存在出现了转折词,但语句本身的情感并没有发生改变的情况,例如“你这次考试比上次有了很大的进步,但是我觉得你可以做得更好”,这里的转折词没有转折含义,而是一种递进含义。在实际操作中,我们所以需要先判断转折句真实的情感表达到底是哪个,才能进行正确的分析计算。
构建情感词典是一件比较耗费人工的事情,除了上述需要注意的问题外,还存在精准度不高,新词和网络用语难以快速收录进词典等问题。同时基于词典的分析方法也存在很多的局限性,例如一个句子可能出现了情感词,但并没有表达情感。或者一个句子不含任何情感词,但却蕴含了说话人的情感。以及部分情感词的含义会随着上下文语境的变化而变化的问题,例如“精明”这个词可以作为褒义词夸奖他人,也可以作为贬义词批评他人。
尽管目前存在诸多问题,但基于字典的情感分析方法也有着不可取代的优势,那就是这种分析方法通用性较强,大多数情况下无需特别的领域数据标注就可以分析文本所表达的情感,对于通用领域的情感分析可以将其作为首选的方案。
我们在机器学习算法的章节介绍过很多分类算法,例如逻辑回归、朴素贝叶斯、KNN等,这些算法都可以用于情感识别。具体的做法与机器学习一样需要分为两个步骤,第一步是根据训练数据构建算法模型,第二步是将测试数据输入到算法模型中输出对应的结果,接下来做具体的讲解。
首先,我们需要准备一些训练用的文本数据,并人工给这些数据做好情感分类的标注,通常的做法下,如果是褒义和贬义的两分类,则褒义标注为1,贬义标注为0,如果是褒义、贬义和中性三分类,则褒义标注为1,中性标注为0,贬义标注为-1
在这一环节中如果用纯人工方法来进行标注,可能会因为个人主观因素对标注的结果造成一定影响,为了避免人的因素带来的影响,也为了提高标注的效率,有一些其他取巧的方法来对数据进行自动标注。比如在电商领域中,商品的评论除了文本数据之外通常还会带有一个5星的等级评分,我们可以根据用户的5星评分作为标注依据,如果是1-2星则标注为贬义,如果是3星标注为中性,4-5星标注为褒义。又比如在社区领域中,很多社区会对帖子有赞和踩的功能,这一数据也可以作为情感标注的参考依据。
第二步是将标注好情感倾向的文本进行分词,并进行数据的预处理,前文已经对分词有了很多的介绍,这里就不再过多的赘述。第三步是从分词的结果中标注出具备情感特征的词,这里特别说一下,如果是对情感进行分类,可以参考情感词典进行标注,也可以采用TF-IDF算法自动抽取出文档的特征词进行标注。如果分析的是某个特定领域的,还需要标注出特定领域的词,例如做商品评价的情感分析,需要标注出商品名称,品类名称,属性名称等。第四步根据分词统计词频构建词袋模型,形成特征词矩阵,如表所示。在这一步可以根据业务需要给每个特征词赋予权重,并通过词频乘以权重得到特征词分数。最后一步就是根据分类算法,将特征词矩阵作为输入数据,得到最终的分类模型。
当训练好分类模型之后,就可以对测试集进行分类了,具体的流程与建模流程类似,先对测试的文本数据进行分词并做数据预处理,然后根据特征词矩阵抽取测试文本的特征词构建词袋矩阵,并将词袋矩阵的词频数据作为输入数据代入之前训练好的模型进行分类,得到分类的结果。
采用基于机器学习的方法进行情感分析有以下几个不足之处,第一是每一个应用领域之间的语言描述差异导致了训练得到的分类模型不能应用与其他的领域,需要单独构建。第二是最终的分类效果取决于训练文本的选择以及正确的情感标注,而人对于情感的理解带有主观性,如果标注出现偏差就会对最终的结果产生影响。
除了基于词典和基于机器学习的方法,也有一些学者将两者结合起来使用,弥补两种方法的缺点,比单独采用一种方法的分类效果要更好,另外,也有学者尝试使用基于LSTM等深度学习的方法对情感进行分析,相信在未来,情感分析会应用在更多的产品中,帮助我们更好的理解用户需求,提升用户使用智能产品的体验。
随着深度神经网络等算法的应用,情感分析的研究方向已经有了非常大的进展,但依然存在着一些难题是目前尚未解决的,在实操过程中需特别注意以下几种类型数据:
情绪轮在用户体验设计上被广泛的应用,很多情感化设计都是基于情绪轮进行的。但是在人工智能领域,将情绪进行多分类比情感分析的三分类任务要难得多,目前大多数分类方法的结果准确性都不到50%。这是因为情绪本身包含了太多的类别,而且不同的类别之间又可能具有相似性,一个情绪词在不同的语境下有可能表达的是不同的情绪类别,算法很难对其进行分类。即使是人工对文本进行情绪类别标注也往往效果不佳,因为情绪是非常主观性的,不同的人对不同的文本可能产生不同的理解,这使得人工标注情绪类比的过程异常困难。如何让机器可以理解真实的情绪目前还是一个未能攻克的难题。
不错的。
普通话三分钟命题评分细则:
(1)语音标准程度,共25分。分六档:
一档:语音标准,或极少有失误。扣0分、1分、2分。
二档:语音失误在10次以下,有方音但不明显。扣3分、4分。
三档:语音错误在10次以下,但方音比较明显;或语音错误在10次-15次之间,有方音但不明显。扣5分、6分。
四档:语音错误在10-15次之间,方音比较明显。扣7分、8分。
五档:语音错误超过15次,方音明显。扣9分、10分、11分。
六档:语音错误多,方音重。扣12分、13分、14分。
(2)词汇语法规范程度,共10分。分三档:
一档:词汇、语法规范。扣0分。
二档:词汇、语法偶有不规范的情况。扣1分、2分。
三档:词汇、语法屡有不规范的情况。扣3分、4分。
(3)自然流畅程度,共5分,分三档:
一档:语言自然流畅,扣0分。
二档:语言基本流畅,口语化较差,有背稿子的表现。扣05分、1分。
三档:语言不连贯,语调生硬。扣2分、3分。
(4)说话不足3分钟,酌情扣分:缺时1分钟以内(含1分钟),扣1分、2分、3分;缺时1分钟以上,扣4分、5分、6分;说话不满30秒(含30秒),本测试项成绩计为0分。
(5)离题、内容雷同,视程度扣4分、5分、6分。
(6)无效话语,累计占时酌情扣分:累计占时1分钟以内(含1分钟),扣1分、2分、3分;累计占时1分钟以上,扣4分、5分、6分;有效语料不满30秒(含30秒),本测试项成绩计为0。
注:本细则参考自《普通话水平测试专用教材》。
微博言论往往带有强烈的情感色彩,对微博言论的情感分析是获取用户观点态度的重要方法。许多学者都是将研究的重点集中在句子词性、情感符号以及情感语料库等方面,然而用户自身的情感倾向性并没有受到足够的重视,因此,提出了一种新的微博情感分类方法,其通过建模用户自身的情感标志得分来帮助识别语句的情感特征,具体地讲,将带有情感信息的微博语句词向量序列输入到长短期记忆网络(LSTM),并将LSTM输出的特征表示与用户情感得分进行结合作为全连接层的输入,并通过Softmax层实现了对微博文本的情感极性分类。实验表明,提出的方法UA-LSTM在情感分类任务上的表现超过的所有基准方法,并且比最优的基准方法MF-CNN在F1值上提升了34%,达到091。
关键词: 情感分析, 长短期记忆网络, 用户情感倾向
Abstract:
Micro-blog's speech often has strong sentimental color, and the sentiment analysis of Micro-blog's speech is an important way to get users' opinions and attitudes Many researchers conduct research via focusing on the parts of speech (POS), emotion symbol and emotion corpus This paper proposes a novel method for Micro-blog sentiment analysis, which aims to identify the sentiment features of a text by modeling user sentiment tendency Specifically, we construct a sentiment information embedded word embedding sequence, and input it into a long short term memory (LSTM) model to get a sentiment embedded output representation Then we merge both the user sentiment tendency score and the output representation of LSTM, and use it as the input of a fully connected layer which is followed by a softmax layer to get the final sentiment classification result The experiment shows that the performance of our proposed method UA-LSTM is better than all the baseline methods on the sentimental classification task, and it achieves the F1-score up to 091, with an improvement of 34% over the best baseline method MF-CNN
诗歌鉴赏解题技巧
第一种模式 分析意象、意境型
提问方式:这首诗营造了一种怎样的意境?
提问变体:这首诗描绘了一幅怎样的画面?表达了诗人怎样的思想感情?
解答分析:这是一种最常见的题型。所谓意境,是指寄托诗人情感的物象(即意象)综合起来构建的让人产生想像的境界。它包括景、情、境三个方面。答题时三方面缺一不可。
答题步骤:
①描绘诗中展现的图景画面。并准确概括考生应抓住诗中的主要景物,用自己的语言再现画面。描述时一要忠实于原诗,二要用自己的联想和想像加以再创造,语言力求优美。
②概括景物所营造的氛围特点。一般用两个双音节词即可,例如孤寂冷清、恬静优美、雄浑壮阔、萧瑟凄凉等,注意要能准确地体现景物的特点和情调。
③分析作者的思想感情。切忌空洞,要答具体。比如光答“表达了作者感伤的情怀”是不行的,应答出为什么而“感伤”。
答题示例:
绝句二首(其一) 杜甫
迟日江山丽,春风花草香。
泥融飞燕子,沙暖睡鸳鸯。
注此诗写于诗人经过“一岁四行役”的奔波流离之后,暂时定居成都草堂时。
此诗描绘了怎样的景物?表达了诗人怎样的感情?请简要分析。
答:此诗描绘了一派美丽的初春景象:春天阳光普照,四野青绿,江水映日,春风送来花草的馨香,泥融土湿,燕子正繁忙地衔泥筑巢,日丽沙暖,鸳鸯在沙洲上静睡不动(步骤一)。这是一幅明净绚丽的春景图(步骤二)。表现了诗人结束奔波流离生活安定后愉悦闲适的心境(步骤三)。
第二种模式 分析技巧型
提问方式:这首诗用了怎样的表达技巧?
提问变体:请分析这首诗的表现手法(或艺术手法,或手法)。诗人是怎样抒发自己的情感的?有何效果?
答题步骤:
(1)准确指出用了何种手法。
(2)结合诗句阐释为什么是用了这种手法。
(3)此手法怎样有效传达出诗人怎样的感情。
答题示例:
早行 陈与义
露侵驼褐晓寒轻,星斗阑干分外明。
寂寞小桥和梦过,稻田深处草虫鸣。
此诗主要用了什么表现手法?有何效果?
答:主要用了反衬手法(步骤一)。天未放亮,星斗纵横,分外明亮,反衬夜色之暗;“草虫鸣”反衬出环境的寂静(步骤二)。两处反衬都突出了诗人出行之早,心中由飘泊引起的孤独寂寞(步骤三)。
第三种模式 分析语言特色
提问方式:这首诗在语言上有何特色?
提问变体:请分析这首诗的语言风格。谈谈此诗的语言艺术。
答题步骤:
(1)用一两个词准确点明语言特色。
(2)用诗中有关语句具体分析这种特色。
(3)指出表现了作者怎样的感情。
答题示例:
春怨
打起黄莺儿,莫教枝上啼。啼时惊妾梦,不得到辽西。
请分析此诗的语言特色。
答:此诗语言特点是清新自然,口语化(步骤一),“黄莺儿”是儿化音,显出女子的纯真娇憨。“啼时惊妾梦,不得到辽西”用质朴的语言表明了打黄莺是因为它惊扰了自己思念丈夫的美梦(步骤二)。这样非常自然地表现了女子对丈夫的思念之情(步骤三)。
第四种模式 炼字型
提问方式:这一联中最生动传神的是什么字?为什么?
提问变体:某字历来为人称道,你认为它好在哪里?
解答分析:古人作诗讲究炼字,这种题型是要求品味这些经锤炼的字的妙处。答题时不能把该字孤立起来谈,得放在句中,并结合全诗的意境情感来分析。
答题步骤:
(1)解释该字在句中的含义。
(2)展开联想把该字放入原句中描述景象。
(3)点出该字烘托了怎样的意境,或表达了怎样的感情。
答题示例:
南浦别 白居易
南浦凄凄别,西风袅袅秋。
一看肠一断,好去莫回头。
前人认为,“看”字看似平常,实际上非常传神,它能真切透露出抒情主人公的形象。你同意这种说法吗?为什么?
答:同意。看,在诗中指回望(步骤一)。离人孤独地走了,还频频回望,每一次回望,都令自己肝肠寸断。此字让我们仿佛看到抒情主人公泪眼朦胧,想看又不敢看的形象(步骤二)。只一“看”字,就淋漓尽致地表现了离别的酸楚(步骤三)。
第五种模式 一词领全诗型
提问方式:某词是全诗的关键,为什么?
解答分析:古诗非常讲究构思,往往一个字或一个词就构成全诗的线索,全诗的感情基调、全诗的思想,抓住这个词命题往往可以以小见大,考出考生对全诗的把握程度。
答题步骤:
(1)该词对突出主旨所起的作用。
(2)从该词在诗中结构上所起的作用考虑。
答题示例:
春夜洛城闻笛 李白
谁家玉笛暗飞声,散入春风满洛城。
此夜曲中闻折柳,何人不起故园情?
“折柳”二字是全诗的关键,“折柳”寓意是什么?你是否同意“关键”之说,为什么?
答:“折柳”的寓意是“惜别怀远”,而诗歌的主旨正是思乡之情(步骤一)。这种思乡之情是从听到“折柳”曲的笛声引起的(步骤二)。可见“折柳”是全诗的关键
第六种模式 情感、主旨型
提问方式:表达了怎样的思想感情?这首诗的主旨是什么
提问变体:这首诗反映了怎样的社会现实?这首诗表现了怎样的情趣?或者结合意境提问,或就某一句某一联发问。
答题步骤:
(1)诗歌各句(或相关的句子)分别写了什么内容
(2)运用了何种表达技巧
(3)抒发什么情感
答题示例:阅读下面这首宋词,然后回答问题。(8分)(06年全国卷2)
南柯子 王炎
山冥去阴重,天寒雨意浓。数枝幽艳湿啼红。莫为惜花惆怅对东风。 蓑笠朝朝出,沟塍处处通。人间辛苦是三农①。要得一犁水足望年丰。
〔注〕①三农:指春耕、夏耘、秋收。
(2)试分析下阙的内容,以及作者在词中所抒发的思相感情。
答:描写了农民不避风雨、辛勤劳作的生活,发出了“人间辛苦是三农”的感叹,(步骤一)(因为没有什么特别的表达技巧,所以步骤二跳过)表达了农民盼望风调雨顺、五谷丰登的心情。(步骤三)
再如:阅读下面一首唐诗,然后回答问题。(8分)(05年全国卷2)
邯郸冬至夜思家 白居易
邯郸驿里逢冬至,抱膝灯前影伴身。想得家中夜深坐,还应说着远行人。
[注]冬至:二十四节气之一,唐朝时是一个重要节日。
(2)作者是怎样写“思家”的?
答:冬至夜深时分,家人还围坐在灯前,谈论着自己这个远行之人,(步骤一)作者主要是通过这幅想像的画面,(步骤二)来表现“思家”的。(步骤三 题目已经说明情感)(想像1分,画面描绘2分)
第七种模式 评价题型
提问方式:评价题是先列举出一首或几首诗词,再引用一段古代诗词评论家或后世人对诗词特点的评论语,要求你先判断这个评论是否正确,是否合理,然后阐明理由。这种题型酷似政史考试中的判断说理题。其实这类题型只是前六类题型的变体,没有直接提出问题,需要学生自己分析问的是内容、主旨,还是表达技巧,然后结合问题和诗歌进行恰当的表述。
答题思路:
(1)认真审题
(2)深入阅读理解诗词
(3)结合诗歌内容,结合评论答题
答题注意:紧扣诗文内容,点面结合地分析;阐明理由时,紧扣评论关键词
答题示例:
赤壁 杜牧
折戟沉沙铁未销,自将磨洗认前朝。东风不与周郎便,铜雀春深锁二乔。
有人曾引“一粒沙里见世界,半瓣花上说人情”来概括这首诗的艺术特色。你同意这种观点吗?请作简要说明
分析:这是一首典型的诗词评价题型。诗歌本意很明了,但命题者借用西方一句诗来概括其艺术特色,回答时思维要稍稍转个弯。所谓“一粒沙里见世界,半瓣花上说人情”,就是以小见大,管中窥豹的写法。本文借出土的文物---折戟和吴国二女----二乔来展现三国时期的政治风云变幻。
答案参考:这是一首咏史诗,抒发的是对国家兴亡的感慨,可谓大内容,大主题,但诗人却通过“小物”“小事”来表现的。诗由一个小小的文物“折戟”,联想到汉未分裂动荡的年代,想到赤壁大战中的英雄人物,可谓说是“一粒沙里见世界”。后两句把“二乔”不曾被捉这件小事与东吴霸业、三国鼎立的大主题联系起来,写得具体可感,有情味,有风韵,可谓’“半瓣花上说人情”。
第八种模式 比较评价题型
提问方式:给出两首或几首诗词,要求学生比较阅读后,对其异同进行分析评价。
答题思路:
(1)要通读这几首诗词,把握其思想内容和主要的写法,包括作家作品的背景知识。
(2)要结合题干中的比较角度(思想内容、感情、艺术手法、写法、修辞方法等)来寻求诗词的差异性。
(3)要注意点面结合,既有总体分析,又有具体分析。表述时要注意条理清楚,层次分明。
答题示例: 16.阅读下面两首古诗,然后回答问题。(6分)(05年浙江卷)
齐安郡中偶题 杜牧
两竿落日溪桥上,半缕轻烟柳影中。多少绿荷相倚恨,一时回首背西风。
暮热游荷池上 杨万里
细草摇头忽报侬,披襟拦得一西风。荷花入暮犹愁热,低面深藏碧伞中。
(2)这两首诗都运用了什么表现手法来刻画“荷”的形象?请指出两首诗中“荷”所表现出来的不同情感特点,并作简要分析。(4分)
解析:题目有两问,第一问是问表现手法上的共同点,不要求分析,所以只写出表现手法就可以,当然如果具体说明,也没错。第二问要求分析这两首咏物诗表达出的情感的不同,因此答题时,要按照情感主旨型模式答全两方面的内容
答:第一问:都用了拟人表现手法。
第二问:前一首的“绿荷”有“恨”而“背西风”,(步骤一)含有诗人之恨,表露了伤感不平之情,基调凄怨低沉。(步骤二)
后一首的“荷花”被西风吹动而躲藏于荷叶之中,似是“愁热”,却呈现娇羞之态,(步骤一)表露了作者的怜爱喜悦之情,基调活泼有趣。(步骤二)
----------------------------------
现代文阅读的话,个人认为把各文章类型分开讲解题方法会具体一点!
第一部分(必做题):一般论述类和说明类文章的阅读(15分)
一:依据文体特征读懂文章
(1)根据文体特征读懂文章。一类是以社会科学为研究对象的一般论述类文章(学术论文),主要运用说明的议论的表达方式行文,内容涉及到经济学,教育学,文化学历史学,语言学,美学等,且内容多为介绍学术论点及其分论点,论据,背景和意义。一类是以自然科学为对象的科技说明文,主要运用说明的表达方式行文,内容多为介绍新科技新发现新认识,主体文字若干段落从不同角度具体介绍这个“新”: 背景,构造,原理,特点,现状,发展,评价(优点缺陷)及其研究应用前景。(根据文体特征,可边阅读边猜测下文内容,提高阅读速度。)
(2)注重整体阅读。逐段阅读,标出各段的中心句子,并在头脑中大体复述各段内容。最后在找到全文说明对象(议论对象)的基础上整合文意。
二:选择题的解答
明确此类题目是在玩文字游戏,命题者改造原文设置错部分定语或状语(复句的部分分句),从而改变句意。(1)设误的常用五种方法:添:添加定语或状语, 删:删除句子而改变句意。换:换用别的的词语代替,造成似是而非。调:调换词语或句子顺序,从而改变句意。凑:将意义有关或无关的几个词语(句子)杂糅凑合而造成错误。
(2)仔细辨别干扰项逻辑错误, 特别关注选项中处于定语或状语位置的类似词语是否等值转换:
一偷换概念: 通过漏字,添字,改字,换序等方法扩大、缩小或转移概念。尤要注意代词的指代。
二以偏概全:以部分代整体(或相反),以个别代一般(或相反),以特殊代普遍。重点关注:
a表数量多少的词语(少数,部分,几个,大多数);b表范围大小的词语(凡,全,都 ,所有;部分等);c表程度轻重的词语( 特别,十分,稍微等);d表频率高低的词语(通常,总是; 有时,偶尔等)
三混淆时态:(已然与未然)已经,曾经,过去;现在,目前;将要,尚未等
四混淆模态:(可能与必然)一定,必将; 可能,估计,如果,未必等
五正话反说: 即肯定和否定颠倒。
六顺序错乱: 时间先后错位,逻辑事理先后错位,空间位置错乱。
七颠倒因果: “因”与“果”错位;或 “条件”与“结果”错位。
八强加因果: 即两件事无因果关系,却强行说成有因果关系。
九无中生有: 即原文无此信息。
十答非所问: 即选项回答的不是题干中的问题,或没有答全题干中问题的几层意思。
另外,别让以下几点成为答题盲区:
(1)记住:不能只看选项本身的错对,注意选项是否答非所问;(2)记住:题干中有“根据”、“证据”、“原
因”等字样,选项与题干之间要能构成因果关系;(3)记住:有的选项要选最佳答案,而非正误选择;
(4)记住:题干涉及几层意思,选项中则要答全几层意思。
三:简答题(07年新增题型)的解答
整体阅读,从整体上把握语料:阅读一般论述类文章:从议论说理的角度入手,弄清文章的中心论点是什么,有无分论点,用什么材料来证明观点,论证结构有什么特点;
阅读科技说明文:科技文一般属消息一类,其结构一般为“倒金字塔式”:第一段先引出话题,介绍新工艺、新技术、新见解、新成果,介绍它的构造、原理、发展、现状、评价等等,阅读时首先要明确说明的对象是什么,有什么特点,有什么价值,有什么作用,对社会有什么意义等。 重点与难点:
重难点一: 分析文章的结构层次,把握文章思路的基本方法
技巧1:辩明文体,选准角度 议论文体,可从总体上根据引论、本论、结论来划分,理清行文思路,并分析其内在逻辑关系、材料性质、论证方法,进一步按常见的论证结构——并列、对照、总分、层进——作切分;说明文体,紧扣说明对象,根据其特定的说明顺序,或按时间、空间、或按事物自身的构成,或按事物发展,或按事理逻辑来划分。
技巧2:辨明重要文句。文章中有些句子,如领起句、总结句、过渡句、前呼后应句(包括文中反复出现的文句)
技巧3:审辨标志性词语。可以作为标志性词语的有:A顺序词,B关联词,C指代词,D范围词,E类别词,F过渡词。此外还有文中不同地方反复出现的同义或近义的词语。
技巧4:(1)从形式方面分析①重视具有前后衔接、勾联、照应作用的语言标志;重视有区分层次作用的标点符号。②掌握文章因文体不同而具有的不同的结构规律: 议论文常采用提出问题,分析问题,解决问题的结构来论证事理;说明文常采用总分总式或并列式结构来说明问题。
重难点二: 归纳内容要点,概括中心意思
归纳文章内容要点,概括文章中心意思,是指将文章的整体内容和文章的主题中心用简明的语言表述出来。
1 分析归纳文章的内容要点,要注意以下几点:
■要有文体特征意识: 论述文,论题、论点(分论点)是主要信息,论据和论证是次要信息; 说明文,说明的对象、说明的内
容和对象的特征(特点)是主要信息,说明的方法及运用到的材料是次要信息。
■要有切层分层意识: 研究段与段之间的结构关系或句与句之间的结构关系
同一关系取其一; 相属关系取其”属”; 相并关系取其”和”; 主次关系(偏正关系)取其”主” 。
■要有全文整体意识: 分析归纳时,要从全文出发、整体把握,才能全面准确。
语言组织方法主要有:
(1) 采用摘句法: 抓各段的中心句(各段的中心句往往都是要点),进行压缩;
(2) 采用合并法: 在各层意思不可缺时,可将各层内容合并起来;
(3) 采用提炼法: 对于没有中心句的段落,要分析语句间的关系,把握其内容的重点,选择主要内容;
2 分析归纳中心意思,可以从以下几方面人手:
(1) 寻找中心句(段),概括中心意思: 有的标题即是中心,有的开头点明中心,有的结尾揭示中心。
(2) 合并各段内容, 概括中心意思: 寻找各段中心句, 合并各段主要内容来提炼概括。
(3) 采用整体把握法,概括中心意思: 有的文章(段)没有主旨句,须将全文各段大意综合起来,加以提炼。
重难点三: 分析概括作者在文中的观点态度
是指作者对某具体事物的主观倾向,或赞同或反对,或喜爱或憎恶,带有鲜明的个人主观色彩。其表述因文体而有差异。有的直接说出,有的则分散在字里行间,若隐若现。在具体的分析概括时,首先要抓住文体特点,其次,要抓住一些标志性词句,如“认为”、“觉得”和一些主旨句等。必须从整体上把握文章的内容、思想、主题。 分析的具体做法是:
① 统观全文,筛选出能直接体现作者观点和态度的句子;
② 从材料的中心内容入手来分析作者的观点和态度;
③从作品的表达方式入手来分析作者的观点和态度。
第二部分(选做题):文学类文本和实用类文本的阅读
高分口诀:读懂文章 审准题眼 规范作答
0现代文(各类文本)阅读与答题基本知识
(一)答题基本知识:
1阅读: 注意整体阅读,注意抓三个方面 :一是要有文体特征意识(散文和小说,新闻和传记的文体特征概述见后);二是要有思路分析意识(边读边概括各段落意思及段与段之间的关系);三是要有寻找中心句意识(每段的中心句,特别是文章的开头,结尾,过渡句以及标题)
2审题:从题干中求启示,寻求解题的突破口,确保准确答题。题干具有以下作用: 暗示答题区域; 暗示答题思路; 暗示答题方法; 暗示答案本省。审题时注意:
◆是否选准题眼(答题重点); ◆是否选全要点(要答几个方面);
◆是否选准角度(以谁为陈述主体); ◆ 是否选好恰当的句式(要与设问的句式一致)
组织语言时,注意“问”与“答”要照应好 如问:
“为什么对作者来说这是一次短暂而愉快的旅行?” 则:
(1)题眼(答题重点)是: 短暂而愉快 ; (2)要点(回答的内容)应包括:“短暂”和“愉快”两点;
(3)设问的角度: 以“这”作陈述对象,而不是“作者” ;(4)句式应为: 两个句子,且构成并列关系。
3答题: “规范作答”不能忘记的三个原则: ⑴答案在文中(直接来源于文中或或从文中提炼); ⑵选择并重
组文中关键词句(注意原文表述角度与设问角度是否一致) ; (3)分点分条作答(高考阅卷采点给分) 。
(二)常用写作手法(技巧)(加横线的为高考常考手法)
第一类:表达方式:记叙、描写、抒情、说明、议论
第二类:表现手法:对比、衬托(反衬),变换人称,联想想象, 象征,类比,虚实结合 渲染烘托
第三类:结构方式:前后照应、铺垫,过渡(承上启下)、设置悬念、卒章显志,欲扬先抑、制造波澜 , 特定线索、 记叙顺序(顺叙、倒叙、插叙) ,材料安排(主次、详略等),
第四类:修辞手法:比喻、反复、对比、拟人、夸张、排比、对偶、引用、设问、反问、借代:
第五类:描写手法:
描 写 角 度: 正面描写、侧面描写
描写人物的方法:语言描写、动作描写、神态描写、心理描写、外貌描写,细节描写
描写景物的角度:视觉、听觉、味觉、触觉
描写景物的方法:动静结合(以动写静)、概括与具体相结合、由远到近(或由近到远)
(三)基本题型题(非探究型和评价型)及解答思路
题型1: 理解文中重要语句的含义和表现力
A语句的含义题:还原修辞句的本义;揭示警策句的哲理;转化深奥含蓄句的意思;揭示句子的双关意;
B语句的作用题:要回答该句子在文章结构与内容主题两个方面起的作用。
1文首句:⑴照应标题(开篇点题); ⑵渲染气氛(定下情感基调); ⑶埋下伏笔
⑷设置悬念; ⑸为下文(中心)作辅垫; ⑹总领下文;
2文中句:⑴ 前后照应,⑵承上启下(过渡);⑶总结上文;开启下文;⑷为下文作辅垫
3文末句:⑴总照应开头或标题,结构紧密;⑵卒章显志,揭示中心;⑶总结全文,深化主题;
题型2: 整理文章思路并归纳文章的内容
本题重在弄清文章是怎么写的和写了什么:文章各段说的是什么内容,是从哪些角度说的;段与段之间是什么关系(相并,相承,相属),它们之间是如何照应的,又是如何形成一个有机整体的(各段与中心的关系)。只要你把作者起承转合的行文思路看出来了,把文章的领起段、过渡段、中心段、归旨段、结语段分辨清楚了,文章的脉络层次与主要内容就在你眼前了。
▲叙述性文体的线索:看时间的变化,看空间的变化,看情感的变化,
看故事情节的变化,看事物发展阶段的变化。
▲论述性文体的结构: 并列式,对照式,层进式, 总分式。
▲说明性文体的顺序: 空间顺序,时间顺序;逻辑顺序。
题型3: 分析手法及作用(见前四大类13小类)这里主要举例说明修辞手法的作用:
1比喻:化平淡为生动,化深奥为浅显,化抽象为具体。
2拟人:化物为人,拉近距离,亲切自然; 便于对话,交流情感。
3借代:以简代繁,以实代虚,以奇代凡。
4夸张:烘托气氛,增强感染力,增强联想;创造气氛,揭示本质,给人以启示。
5对偶:便于吟诵,易于记忆,使词句有音乐感;表意凝练,抒情酣畅。
6排比:内容集中,增强气势;叙事透辟,条分缕析;语气强劲,抒情强烈。
7反复:突出思想,强调情感;承上启下,层次清晰;多次强调,增强感染力。
题型4: 分析作者的观点态度,归纳主旨
解题思路:⑴快速读懂原文,深入理解文意(作者记叙、议论了哪些方面的事)→→⑵跳出文章外,整体把握文旨(文章涉及哪些社会问题?)→→⑶舍末逐本,归纳要点,把握文章真意和神魂(作者的真正意图是什么)→→⑷按照题目要求,整理提取有效的信息
望采纳谢谢
情感分析自从2002年由Bo Pang提出之后,获得了很大程度的关注,特别是在在线评论的情感倾向性分析上获得了很大的发展。本文主要关注无监督的情感分析方法,由于不需要大量标注语料,无监督情感分析方法一直受到许多研究者的青睐,但同时效果也低于有监督的情感分析方法。
Turney首次提出基于种子词的非监督学习方法,使用“excelent”和“poor”两个种子词与未知词在搜索网页中的互信息来计算未知词的情感极性,并用以计算整个文本的情感极性。后续的非监督情感分析方法大都是基于生成或已有的情感词典或者相关资源进行情感分析。
例 如,Kennedy和Inkpen考虑文本中词的极性转移关系并基于种子词集合进行词计数决定情感倾向。朱嫣岚等人将 一组已知极性的词语集合作为种子,基于HowNet对未知词语与种子词进行语义计算,从而判别未知词的极性。Lin等采用LSM 模型、JST模型、Reverse-JST模型构建了三种无监督的情感分析系统。但是由于深层情感分析必然涉及到语义的分析, 以及文本中情感转移现象的经常出现,所以基于深层语义的情感分析效果并不理想,本文针对中文文本中经常出现的情感转移现象提出情感极性转移模型,提高了深层语义情感分析的分析效果。
判断文字聊天中的感情,可以看作是情感分析。之前已有的一些情感分析的研究,主要有两种方法。一种是基于词典的方法,基于词典的方法主要在于词典的质量的好坏,此外,还有一些本身就带有歧义的词,不能够简单判定是正面的或者负面的。另一种是基于机器学习的方法。基于机器学习的方法主要是有监督学习,即要找一些类似的聊天语料来对机器进行训练,使得机器能够正确地判断文字中的感情。在训练集上达到足够高的准确率,才有可能在实际测试的时候,准确地预测情感。此外,目前机器能够区分的感情并不多,之前研究的区分的情感,大多是正负两极,或者五级(负面、轻微负面、中性、轻微正面、正面)情感。人类情感的复杂程度远超出这五种,因此如何识别人类的复杂情感也是机器需要研究的课题。但是随着算法的不断改进,在不久的将来,相信机器的准确率能够达到比人更高。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)