<article>
课程地址: https://classcourseraorg/nlp/lecture/31
情感分析 (Sentiment analysis)又可以叫做
意见抽取 (Opinion extraction)
意见挖掘 (Opinion mining)
情感挖掘 (Sentiment mining)
主观分析 (Subjectivity analysis)等等。
引用的论文:
Bo Pang, Lillian Lee, and Shivakumar Vaithyanathan 2002 Thumbs up Sentiment Classification using Machine Learning Techniques EMNLP-2002, 79—86
Bo Pang and Lillian Lee 2004 A Sentimental Education: Sentiment Analysis Using Subjectivity Summarization Based on Minimum Cuts ACL, 271-278
另外需注意,Binarized (Boolean feature) Multinomial Naïve Bayes不同于Multivariate Bernoulli Naïve Bayes,MBNB在文本情感分析上的效果并不好。另外课中也提到可以用交叉验证的方式进行训练验证。
下面罗列了一些比较流行的词典:
当我们拿到一个词我们如何判断他在每个类别中出现的概率呢?以IMDB影评为例
但是!我们不能用单纯的原始计数(raw counts)方法来进行打分,如下图
可以看出,这些否定词同样可以作为单词极性的一个判断依据。
具体步骤为:
联合概率 / 独立的两个概率乘积
之后我们可以看一下统计结果,分别来自于用户好评和差评的统计:
可以看到极性划分的还不错
</article>
</main>
转自csdn
监督学习
目前,基于监督学习的情感分析仍然是主流,除了(Li et al,2009)基于非负矩阵三分解(Non-negative Matrix Tri-factorization),(Abbasi et al,2008)基于遗传算法(Genetic Algorithm)的情感分析之外,使用的最多的监督学习算法是朴素贝叶斯,k最近邻(k-Nearest Neighbor,k-NN),最大熵和支持向量机的。而对于算法的改进主要在对文本的预处理阶段。
基于规则/无监督学习
和基于监督学习的情感分析相比,基于规则和无监督学习方面的研究不是很多。除了(Turney,2002)之外,(朱嫣岚 et al,2002)利用HowNet对中文词语语义的进行了情感倾向计算。(娄德成 et al,2006)利用句法结构和依存关系对中文句子语义进行了情感分析,(Hiroshi et al,2004)通过改造一个基于规则的机器翻译器实现日文短语级情感分析,(Zagibalov et al,2008)在(Turney,2002)的SO-PMI算法的基础上通过对于中文文本特征的深入分析以及引入迭代机制从而在很大程度上提高了无监督学习情感分析的准确率。
跨领域情感分析
跨领域情感分析在情感分析中是一个新兴的领域,目前在这方面的研究不是很多,主要原因是目前的研究还没有很好的解决如何寻找两个领域之间的一种映射关系,或者说如何寻找两个领域之间特征权值之间的平衡关系。对于跨领域情感分析的研究开始于(Blitzer et al,2007)将结构对应学习(Structural Correspondence Learning,SCL)引入跨领域情感分析,SCL是一种应用范围很广的跨领域文本分析算法,SCL的目的是将训练集上的特征尽量对应到测试集中。(Tan et al,2009)将SCL引入了中文跨领域情感分析中。(Tan2 et al,2009)提出将朴素贝叶斯和EM算法的一种半监督学习方法应用到了跨领域的情感分析中。(Wu et al,2009)将基于EM的思想将图排序(Graph Ranking)算法应用到跨领域的情感分析中,图排序算法可以认为是一种迭代的k-NN
Python 有良好的程序包可以进行情感分类,那就是Python 自然语言处理包,Natural Language Toolkit ,简称NLTK 。NLTK 当然不只是处理情感分析,NLTK 有着整套自然语言处理的工具,从分词到实体识别,从情感分类到句法分析,完整而丰富,功能强大。
现代文阅读解析也是很重要的一个问题,那么现代文阅读解析有什么方法呢?下面是我整理的相关内容,欢迎阅读参考!
一、文章开头结尾的作用常见答案
(一)开头的作用:
1吸引读者:
(1)巧设悬念
(2)使用修辞(使文章文字生动)
(3)充满生活情趣
2总领全文
3奠定感情基调
4于后文发生某种关系:(1)对比关系(2)铺垫、伏笔关系 (3)呼应关系(4)欲扬先抑
(二)结尾的作用:
1中心类:(1)点明中心(2)深化主题(3)拓展主题
2于前文发生某种关系:(1)对比(2)呼应
3给读者留下思考余地和想象空间
4委婉含蓄,意味悠长
二、关于总喻和分喻的思维方式
(用于带有较复杂比喻修辞的句子理解题)
思考步骤:1明确陈述主体(基石)
2分清本体喻体(重点)
3理清比喻内容(保障)
三、关于三种人称各自的好处问题
第一人称:(我) :
1使读者有身历其境之感
2便于作者表达自己较复杂情感
(我们):
1说理性有号召力
2 抒情性有感染力
第二人称:(你,你们):
1赞美性质:亲切感
2批评性质:
(1)人:质问之势-气势强烈-表达情感
(2)非人:拟人化—同上
第三人称:(他,他们):客观真实
四、常用的表现手法
(手法;写法;写作方法;艺术手法……)
对比; 象征; 衬托; 比喻; 幽默; 讽刺; 巧设悬念; 侧面描写; 欲扬先抑; 借景抒情; 虚实结合;托物言志;
五、文章多主题多情感时概括作者情感宜用划线摘句法
(常见于写景抒情散文)
1划出中心句
2划出具有感情色彩的词
3分析词句所蕴含的情感,结合全文整理答案
六、文章谋篇布局的常见类型
1一波三折(情节曲折,引人入胜)
2欲扬先抑(突出重点)
3结尾出人意料之外,又在情理之中(引人思考)
4巧设悬念(吸引读者)
5逐层深入(环环相扣,结构严密)
6某种时空关系
7某种对比关系
注:文章的结构特征是无穷的,掌握谋篇布局既是谈结构特征这一本质即可。
七、句子赏析要点
1解析修辞
2描写角度:、
(1)远近、高低、大小对比
(2)虚实结合
(3)视、听、嗅分层次
3选材特征:
(1)小事
(2)细节
(3)某一方面
八、文章选材特点常见答案
1以小见大(易为读者接受) 常见于记叙文和小说
2多用古代故事,典故,寓言,诗词(增强文章文化底蕴) 常见于议论文和杂文
3选材角度宽泛(是文章丰富生动) 常见于散文
九、文章语言特点常见答案
1生动形象(修辞多,语言华丽,多见散文)
2平实(多见小说,记叙文,哲理性散文)
3幽默
十、关于双层含义的问题
1浅层和深层
浅层一般与文章内容有关;深层一般与文章中心有关
浅层一般是物质性的;深层一般是精神性的
2虚写与实写: 梦;现实幻想;现实想象;眼前
3角色主体不同造成的含义不同
十一、逐层深入的集中常见类型
1逻辑性深入:分类无限,重在掌握什么是逻辑性。
2情感的深入: 夸大化;深入化。
3从感性到理性
答题方法
从来都只听说数学有公式,怎么连语文也有,而且还是阅读理解说是公式,其实就是答题术语,我们在参考答案里,不是总能见到“表现了”、“说明了”、“突出了”之类的高频词吗这些,就是我们今天要说的答题术语,也是考场抓分最有效的方法哦!
1理解文中的加点词语
能理解词语的表面意义,以及深层含义和言外之意,并能理解其表达的效果;
能确定词语指代的内容:一般出现在上文,找出后代入原文,看是否通顺合理
2文章概括
内容概括(一句话概括故事情节):人物和事件 (抓要点概括,推动情节发展的要点必须要首尾的关键句必须扣住)
中心思想概括:如:“本文通过某人做某事,表达了作者对__ 赞美与敬佩之情等,赞美了他(人物性格、精神品质)
3主旨句的作用
结构上贯穿全文,内容上点明中心。
4修辞方法及表达作用
比喻,拟人:生动形象地表现出了,表达了情感。
排比:表现了,抒发了,增强了语势,加强了感情。
设问:自问自答,引起读者思考,使文章有起伏。
反问:加强语气,增强语势,表达了(的情感),使文章有起伏。
答题模式
(1)点明何种表现手法 (2) 表现了什么内容(3)表达了怎样的感情 如:此句运用了,从而生动形象表现了,表达了什么……
5记叙顺序及作用
(1) 顺叙(按事情发展先后顺序)作用:叙事有头尾,条理清晰,脉络清楚、印象深刻。
(2) 倒叙:造成了……的悬念,使故事情节更曲折,增强了文章的可读性
(3) 插叙作用:补充交代了……使人物形象更丰富,使中心更突出。
6记叙文中穿插议论的作用
必须从内容、结构两个方面作答
(1)结构上:承接上文、开启下文、总领下文(引出下文)、承上启下(过渡)、照应前文(开头)首尾呼应。
(2)内容上:开篇点题、抒发情感、点明中心,深化主题、画龙点睛
(3)写法上:气氛渲染、托物言志、以小见大、设置悬念、埋下伏笔、为后文作铺垫、欲扬先抑、借景抒情、寓情于景、托物言志等。
象征、托物言志作用:使表达委婉含蓄、深沉感人
其实,阅读题高分还应该需要多练,而不是仅仅依靠上面的万能答题模板,因此,建议同学们在空闲的时候多做阅读训练哦~
专题解读
新闻阅读剖析
常见考点
1理解语句含义题
2筛选整合信息题
3概括分析人物形象题
4导语的作用题
5背景的作用题
6结语的作用题
7文本结构安排题(顺序、倒叙、补叙、日记体)
8鉴赏新闻的表现手法
9分析语言特色题
10分析新闻的文体特征题
11探究新闻的写作背景和写作意图
12探究新闻反映的人生价值和时代精神(文本封闭性和半开放型)
新闻文体的特点
基本特点:迅速及时、内容真实、语言简明。
最主要的特点:“用事实讲话”。
基本结构:
标题、导语、主体、背景、结语。标题、导语、主体是消息必不可少的,背景和结语有时则蕴涵在主体里面,结语有时可省略。
①标题:要求准确、凝练、新颖、醒目。形式有单行标题,多行标题。多行标题——引题(引标):交待形势,烘托气氛,说明背景等。正题(主标):对一则消息内容的高度概括。副题(副标):往往是重要事实,结果的提要。
②导语:消息的第一句话或第一段话以凝练简明的语言,概述新闻的主要内容或事实,鲜明地揭示新闻的中心。写法常见的有叙述式、描写式、评论式、提问式、结论式等。
③主体:对导语内容进行展开和补充,是消息的躯干。按事情发生发展的先后顺序安排层次,按事物之间的逻辑关系安排层次。
④结语:消息的最后一句话或一段话,有的消息,事实说清楚了,就不需要结尾。它可对全文内容作概括性小结;可用带有启发激励性的语言作结;可对发展趋势作预测;可提出值得深思的问题。
解读新闻文本的方法
根据新闻特点我们在复习时可采用如下的六个步骤:
1看标题信息,揣摩新闻类型;
类似作文审题;即通过对题意的揣摩,要能辨出该文的记叙对象,是人物新闻还是事件新闻,是消息还是通讯。
2抓记叙要素,了解大致内容;
这是由文体特点决定的。因为新闻的内容,无论哪种类型,一般都离不开人物、时间、地点和事情的起因、发展、结果这六个要素。
3理行文线索,分清段落层次;
即领悟文章的脉络、顺序,目的是理清作者的行文思路,借此可准确地划分全文的段落层次。
4辨叙述方式,领会布局特点;
即辨析文本主要采用的叙述方式,消息一般都是采用“倒金字塔”式,这跟一般的记叙文不同。而通迅的叙述方式就比较灵活多变,有顺叙、倒叙,中间或许还会有插叙、补叙等叙述方法。这就要求我们阅读时要特别关注了。
5挖中心主旨,理解文本意义;
目的是针对考纲当中D层级的鉴赏评价“评价文本的主要观点和基本倾向”、“评价文本产生的社会价值和影响”和F层级的探究“探讨文本反映的人生价值和时代精神”这几个考点。
6析表现手法,以供鉴赏探究。
一般可以从叙述、描写、抒情、议论等表达方式,烘托、借景抒情、等文学手段,锤词炼句及比喻、拟人等种种修辞方法几个角度去考虑。但由于新闻往往运用多种表现手法,而考试时的阅读时间十分有限,因此一般宜结合新闻对象,抓其中最主要、最突出的来分析。
常见题型及答题套路
1 针对新闻内容,结合生活实际,简明阐述自己的看法
(1)综合权衡,稳妥立论。
(2)回读原文,精选论据。
明确观点之后需要作简明扼要的论述。应回读原文,从原文中精心挑选有力的论据用以支撑自己的观点。这一点非常重要。
(3)简要论述,联系实际。
适当扼要引用原文关键句作为论据,还要作精要的论述,以证明观点的正确。有的时候,还要联系实际适度分析,以使论证更为有力。
(4)精要作结,回扣论点。
最后要用一句话作精要概述,回扣论点作结。句式参考样式:因此……;基于此,我们认为……;简而言之,……
2语句含义题答题套路
结合上下文,抓关键词。表层涵义+深层涵义
3筛选信息题答题套路
①阅读全文,了解新闻报道了什么地点、什么时间、什么人物、发生了什么事,其发展如何、结局如何。
②看清题目,明确筛选要求,寻找答题的有效信息区间。
③在有效信息区间,抓住关键词句,把握新闻要点,进行筛选整合。
④根据题目,结合筛选的词句分条作答。
4新闻导语题答题套路
① 概述新闻的主要内容和事实,鲜明地揭示新闻的中心。
② 抓典型镜头,给读者以现场感和生动感;吸引读者的阅读兴趣。
③ 为全篇奠定恰当(紧张或温馨或欢快或沉郁或悲痛)的感情基调,贯穿全文。
④ 结构上引出下文对某事件的具体描写。
⑤ 手法:用列数字、举例子、作比较等手法表现新闻事件的特点。
5新闻背景题答题套路
①对新闻事实进行解释、补充烘托,加深对新闻的认识和理解
②突出人物特征,
③揭示了新闻事件的意义,体现新闻的主题,增强了新闻的厚度和深度,
④增强表达效果。叙述背景事件,充实文本内容,使新闻更加真实、客观,现场感强,增强文章可读性和感染力。
6新闻结语题答题套路
①总结全文,呼应开头。
②阐明新闻主题或深化主题,使读者更深刻地认清新闻事实的新闻价值和意义,启人心智,引人思考,耐人寻味。
③确保新闻结构的完整性,拾遗补缺,增加补充信息。
④托物寄情,给人回味。
7结构题答题套路
通讯结构的三个基本要求:
揭示新闻事实的内在联系,脉络清晰;服从表达主题的需要;表达上做到完整、又起伏。
新闻结构有:
①倒金字塔结构(或倒叙式结构、悬念式结构),先声夺人,引发阅读兴趣。
②多侧面拼接形式(或横式结构、蒙太奇式结构),从人物不同侧面取材,按照素材的内在联系,多角度立体刻画人物的高尚品格,事件多而不重复、不杂乱。
③主线勾连式。以……为行文的线索
④纵式结构。按照时间的顺序安排层次,清晰明了。
⑤对比结构。
8新闻表现手法题答题结构
分为表达方式:记叙、描写、议论、抒情。+修辞手法+篇章结构+表现手法:细节描写、借景抒情、对比、衬托、渲染、以小见大等。
方法小结
(1)分析表达技巧对表现新闻对象特点的作用
(2)分析表达技巧对表现新闻主题的作用
(3)分析表达技巧对群众体会作者态度的作用
(4)分析表达技巧对突现新闻的社会效应的作用
(5)分析表达技巧对新闻文体特征的效果:增强让群众如临新闻现场的画面感或生动形象的可读性
9语言特色题答题套路
分析文章语言的特点,首先要从整体上看文章语言的句式特点,描写手法的运用及是否使用修辞手法等,然后找出典型的例子进行分析。注意分析时语言简洁、条理清晰。
10文体特征题答题套路
(1)分析新闻内容的真实性
(2)分析新闻的时效性性
11新闻背景写作意图题答题套路
①社论的写作背景
②新闻及新闻社论特点——从“新闻具有实效性、针对性”“新闻人的职业精神”“新闻社论应体现国家的主流意识,起到鼓舞人、激励人、感召人的作用”等方面思考。
12新闻探究题答题套路
①明确观点。
②引据:充分利用原文信息,概述相关事实。
③分析:即归结回扣观点,简要作结。
④开放型探究:要合理联系现实状况,阐发所受启示(正向或反向)。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)