中文情感分析 的难点在哪

中文情感分析 的难点在哪,第1张

情感分析(Sentiment Analysis)

第一步,就是确定一个词是积极还是消极,是主观还是客观。这一步主要依靠词典

英文已经有伟大词典资源:SentiWordNet 无论积极消极、主观客观,还有词语的情感强度值都一并拿下。

但在中文领域,判断积极和消极已经有不少词典资源,如Hownet,NTUSD但用过这些词典就知道,效果实在是不咋滴(最近还发现了大连理工发布的情感词汇本体库,不过没用过,不好评价)。中文这方面的开源真心不够英文的做得细致有效。而中文识别主客观,那真的是不能直视。

中文领域难度在于:词典资源质量不高,不细致。另外缺乏主客观词典。

第二步,就是识别一个句子是积极还是消极,是主观还是客观。

有词典的时候,好办。直接去匹配看一个句子有什么词典里面的词,然后加总就可以计算出句子的情感分值。

但由于不同领域有不同的情感词,比如看上面的例子,“蓝屏”这个词一般不会出现在情感词典之中,但这个词明显表达了不满的情绪。因此需要另外根据具体领域构建针对性的情感词典。

如果不那么麻烦,就可以用有监督的机器学习方法。把一堆评论扔到一个算法里面训练,训练得到分类器之后就可以把评论分成积极消极、主观客观了。

分成积极和消极也好办,还是上面那个例子。5颗星的评论一般来说是积极的,1到2颗星的评论一般是消极的,这样就可以不用人工标注,直接进行训练。但主客观就不行了,一般主客观还是需要人来判断。加上中文主客观词典不给力,这就让机器学习判断主客观更为困难。

中文领域的难度:还是词典太差。还有就是用机器学习方法判断主客观非常麻烦,一般需要人工标注。

另外中文也有找到过资源,比如这个用Python编写的类库:SnowNLP 就可以计算一句话的积极和消极情感值。但我没用过,具体效果不清楚。

到了第三步,情感挖掘就升级到意见挖掘(Opinion Mining)了。

这一步需要从评论中找出产品的属性。拿手机来说,屏幕、电池、售后等都是它的属性。到这一步就要看评论是如何评价这些属性的。比如说“屏幕不错”,这就是积极的。“电池一天都不够就用完了,坑爹啊”,这就是消极的,而且强度很大。

这就需要在情感分析的基础上,先挖掘出产品的属性,再分析对应属性的情感。

分析完每一条评论的所有属性的情感后,就可以汇总起来,形成消费者对一款产品各个部分的评价。

接下来还可以对比不同产品的评价,并且可视化出来。如图。

这一步的主要在于准确挖掘产品属性(一般用关联规则),并准确分析对应的情感倾向和情感强度。因此这需要情感分析作为基础。首先要找到评论里面的主观句子,再找主观句子里的产品属性,再计算属性对应的情感分。所以前面基础不牢固,后面要准确分析就有难度。

中文这个领域的研究其实很完善了,技术也很成熟。但需要完善前期情感分析的准确度。

总的来说,就是中文词典资源不好,工作做得不是很细很准。前期的一些基础不牢固,后面要得到准确的分析效果就不容易了。

1. 说教材

说课首先要说明自己对教材的理解。说教材的目的有两个:一是确定学习内容的范围与深度,明确“教什么“;二是揭示学习内容中各项知识与技能的相互关系,为教学顺序的安排奠定基础,知道”如何教“。说教材包括以下几个方面:

(1) 说教材的地位作用。要说明课标对所教内容的要求,脱离课标的说课那就是无本之木、无源之水,会给人一种虚无缥缈的感觉。还有说明所教教学内容在节、单元、年级乃至整套教材中的地位、作用和意义,说明教材编写的思路与结构特点。

(2) 说教学目标的确定。一说目标的完整性,教学目标应该包括知识与技能目标、过程与方法和情感态度三个方面的目标;二说目标的可行性,即教学目标要符合课标的要求,切合各种层次学生的实际;三说目标的可操作性,即目标要求具体、明确,能直接用来指导、评价和检查该课的教学工作。

(3) 说教材的重点难点。教学重点除知识重点外,还包括能力和情感的重点。教学难点,是那些比较抽象、离生活较远或过程比较复杂,使学生难以理解和掌握的知识。并要具体分析教学难点和教学重点之间的关系。

2. 说学生

就是分析教学对象。因为学生是学习的主体,因此教师说课必须说清楚学生情况。这部分内容可以单列,也可以插在说教材部分里一起说。说学生包括:

(1) 说学生的知识经验。这里说明学生学习新知识前他们所具有的基础知识和生活经验,这种知识经验对学习新知识产生什么样的影响。

(2) 说学生的技能态度。就是分析学生掌握学习内容所必须具备的学习技巧,以及是否具备学习新知识所必须掌握的技能和态度。

(3) 说学生的特点风格。说明学生年龄特点,以及由于身体和智力上的个别差异所形成的学习方式与风格。

3. 说教法与手段

就是说出选用什么样的教学方法和采取什么样的教学手段,以及采用这些教学方法和手段的理论依据是什么。

(1) 说教法组合及其依据。教法的组合,一是要考虑能否取得最佳效果,二是要考虑师生的劳动付出是否体现了最优化原则。一般一节课以一二种教学方法为主,穿插渗透其他教法。说教法组合的依据,要从教学目标、教材编排形式、学生知识基础与年龄特征、教师的自身特点以及学校设备条件等方面说明。因为教学过程是教与学的统一过程,这个过程必须是教法和学法同步的过程,因此教师在说课时还要说明怎样教会学生学习的方法和规律。

(2) 说教学手段及其依据。教学手段是指教学工具(含传统教具、课件、多媒体、计算机网络等)的选择及其使用方法,要尽可能使用现代化的教学手段。教具的选择一是忌多,使用过频,使课堂教学变成教具或课件的展览;二是忌教学手段过于简单,不能反映学科特点;三忌教学手段流于形式。还有说明是怎样依据教学目标、教材内容、学生的年龄特征、学校设备条件、教具的功能等来选择教学手段的。

4. 说教学程序

说教学程序就是介绍教学过程设计,这是说课的重点部分。因为只有通过这一过程的分析才能看到说课者独具匠心的教学安排,它反映了教师的教学思想、教学个性与风格。也只有通过对教学过程设计的阐述,才能看到教学安排是否合理、科学和艺术。教学过程通常要说清楚下面几个问题:

(1) 说教学思路的设计及其依据。教学思路主要包括各教学环节的顺序安排及师生双边活动的安排。教学思路要层次分明,富有启发性,能体现教师的主导作用和学生的主体作用。还要说明教学思路设计的理论依据。

(2) 说教学重点、难点的处理。教师高超的教学技艺体现在突出重点、突破难点上,这是教师在教学活动中投入的精力最大、付出的劳动最多的方面,也是教师的教学深度和教学水平的标志。因此教师在说课时,必须有重点地说明突出教学重点,突破教学难点的基本策略。也就是要从知识结构、教学要素的优化、习题的选择和思维训练、教学方法和教学媒体的选用、反馈信息的处理和强化等方面去说明突出重点的步骤、方法和形式。

(3) 说各教学环节的时间分配。要联系实际教材内容、学生实际和教学方法等说出各个教学环节时间安排的依据。特别要说明一节课里的最佳时间(20——25分钟)和黄金时间(15分钟)是怎样充分利用的。

(4) 说教学设计及其依据。说板书设计,主要介绍这堂课的板书类型是纲目式、表解式、还是图解式等?什么时候板书?板书的具体内容是什么?板书的展现形式是什么?等等。板书设计要注意知识科学性、系统性与简洁性,文字要准确、简洁。说依据可联系教学内容、教学方法、教师本身特点等加以解释。

5. 说教学效果的预测

教学效果是教学目标的归宿和体现。教学效果的预测,既是教师实现教学目标的期望,又是实现教学目标的自我把握程度。教师在说课时,要对学生的认知、智力开发、能力发展、思想品德的养成、身心发展等方面做出具体的、可能的预测。

欢迎分享,转载请注明来源:浪漫分享网

原文地址:https://hunlipic.com/qinggan/4236065.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-08-22
下一篇2023-08-22

发表评论

登录后才能评论

评论列表(0条)

    保存