散文的特点。1、内容上:是作者把自己对生活的感悟或至深的生活经验,通过状物、记人、写景等方式表达出来。所谓自我感悟,也就是对事物的特殊意义和美质的发现、认识。2、形式上:(1)以个人抒情为主,把抒情、叙述、议论熔为一炉;(2)从细处落笔,小中见大;(3)从侧面暗示,发挥读者的想象力;(4)行文自由,结构灵活。综合以上两点:“形散神不散”。阅读散文时,要透过“形”抓住“神”,体会作者所要表达的思想情感,要抓住文章的结构和线索(文脉),要注意欣赏优美的语言。“形散神不散”,是人们用来概括散文特征的常见说法。散文的“形”指散文的外在形式,即选用了怎样的材料,材料又是怎样组织的,采用了怎样的语言和表达方式等。散文的“神”就是散文的主旨,即蕴含于外在的“形”中的思想感情。所谓“形散神不散”,是指散文选材自由、灵活,材料是“散”的,但一经布局谋篇,其“神”始终不散。如何分析散文的“形”?首先要弄清作者布局谋篇的特点和表现手法上的特点;其次要理清散文的线索,如抒情散文一般都是以某种感情为线索来组织、安排材料,采用托物言志、借景抒情的写法,应抓住所托之“物”、所借之“景”进行分析。怎样迅速准确地抓住散文的“神”呢?可以从抓中心句、关键句人手,它们是理解散文主旨的钥匙。这样的句子往往由作者直接点明,常常在文章的开头、结尾和关联过渡的地方,形式上多为议论抒情句。它是作者对所描述内容的直接评价,是散文的“文眼”。三、散文分类。散文有广义、狭义之分。广义散文,是指诗词以外的散体文章;狭义散文,则专指同诗歌、小说、戏剧并称的一种文学体裁。根据表达方式侧重点不同,一般把散文分作记叙散文、抒情散文和议论散文三类。1、记叙散文:以记人、叙事、状物、写景为主的散文。在这类散文中,有的着重是记写、刻画人物,以人物为全篇的中心。如鲁迅的《藤野先生》。它虽然也是以写人物为主,但与小说的区别是明显的。它们不像小说那样多方面地、细致地刻画人物,也不讲求故事情节的完整和曲折。这类散文,还有的侧重是记写一定的风物、场景。作者对它们不是纯客观的描述,而是将外物与内情融合起来,以表达一定的思想、抒发一定的感情。2、抒情散文:以抒发感情为主的散文,它主要是抒发作者对现实生活的感受、激情和意愿。抒情散文抒发的是怎样的感情,如何抒发,都与文章揭示的思想意义是否深广有极大的关系。例如茅盾的《白杨礼赞》中炽热的情感,就是当时生活、战斗在国民党统治区广大革命者的共同感情。作品既表达了对坚持抗战的中国***、抗日军民的热烈拥护和热情赞颂;又表达了作者对国民党顽固、倒退派的强烈憎恨。抒情散文的“情”不是虚的、空的,而是有所依据的。即是说,总有一定的人物、事件或景物作为文章抒写的对象,通过对它们的记叙或描写,达到托物言志、寓情于物的目的。《白杨礼赞》的思想意义和作者的感情,就是通过对白杨树的描绘与赞美,或隐或露、或曲折或直白地表现出来的。这类散文对具体的“物”的描述而表达一定的思想意义,抒发一定的感情的。3、议论散文:以议论为主的散文。它说理,往往借助于事例的简述,形象的描绘和感情的抒发来进行,文学色彩很浓。它同一般议论文一样,要求观点鲜明、概念准确、说理充分、层次明晰、以理服人。但是,它不需要逻辑推理,严密论证。常见的文学性很强的随笔、杂感等短小精悍的文章,皆属此类;作者常常借助于对古今故事、花鸟草虫等具体事物的描叙来说理,显得妙趣横生并富于感情。四、考点分析。1、把握文章内容,概括文章主题。散文选材广泛,行文自由,表达的细想感情丰富多彩,所以准确把握文章的主题也是散文的考点之一。把握散文主题方法是:(1)找到文中的中心句和暗示主题的提示语、关键词语,从中概括文章主题;(2)从所选的材料中概括,材料是为文章中心服务的,我们可以看文章所选的材料表达了作者什么样的观点、态度、感情,从中找到作者要表达的主题思想。考题形式:直接概括全文或某一段落的主题或作者的思想感情。答题要点:(1)能利用原文词语,尽可能使用;(2)没有原文词语可利用时,要注意语言文字表达的准确性和层次性,要做到言简意赅又不漏掉答题点。2、理清文章脉络,把握顺序。作者为了表达自己的思想情感,会精心组织、选取材料;在表达上更是精益求精,特别注意词语在表达上的顺序、层次和分寸感。散文中的顺序,一般包括:选取的材料顺序;段落顺序;句子顺序;词语顺序等。(1)线索线索是作者选择材料的准绳,线索是将文章材料贯穿起来使之成为整体的脉络。我们形象称之为线索,是作者选择材料脉络或描写、记叙的脉络。①以中心人物的性格特征(或品质)为线索。②以人物活动为线索。③以物(或物的特征)为线索。④以人物的感情(或感情变化)为线索。一篇记叙文一般只有一条线索,也有的一主一次或一明一暗两条线索,有的以某一事物为线索,有的以行踪为线索,有的以时间为线索,还有的以感情为线索等。考题形式:直接问文章的线索是什么或说说作者选择材料的依据等答题要点:找到线索,根据提问灵活回答。关键是能判断准线索。(2)顺序(顺叙、倒叙、插叙、补叙)①顺叙是按照事件发展的时间先后的顺序来写。②倒叙是根据表达的需要,把事件的结局或某个最重要、最突出的片断提在前边叙述,然后再从事件的开头按事情原来的发展顺序进行叙述的方法。③插叙是在叙述中心事件的过程中,为了帮助开展情节或描写人物,暂时中断叙述的线索,插入一段与主要事件相关的内容的叙述方法。考题形式:(1)连续的材料或几个段落或词语能否调整顺序?为什么?(2)从原文中抽出一句话或几个词语,让你放回文中可以选择的几个地方。答题思路:形式(1),要注意审题,有的题是不能颠倒顺序的,有的是可以颠倒顺序的。出题人在出题时会有暗示;同时也要推敲材料和段落、词语之间的关系。不管能还是不能,都要谈为什么。思路是要看材料或段落、词语之间的逻辑关系。考题形式(2),从原文中抽出的语句,往往是总结性的或承上启下的,一是靠考生的语感修养;二是对语句进行理性分析。词语顺序也要凭借语感和理性分析,要分析语言环境和词语搭配的问题。这样的题,往往是有选择答案,即使没有选择答案,也不要回答为什么,但思维过程要考虑道词语的逻辑顺序和词语搭配的习惯。(3)前后照应。前提是理解题目中提供的词或句的真正含义,然后才能根据题目要求来寻找它所照应的词或句子。同时还需要大体把握该词或句在文章中所起的作用,然后寻找与之相关的词句。一般情况下,题目中会提示你在固定位置寻找。常见的照应方式:题目与段落之间的照应、开头与结尾之间的照应、前设悬念,后有照应。3、散文在行文上不仅就事论事,就人写人,就物写物,就景写景,它常常由近及远,由此及彼,由物及人,因景写情。这种从某一事物想到与之有一定联系的别的事物的方法就是联想。充分地层开联想,是散文做到情景交融的重要的思维方法和表现手段。分析联想的原由,抓住联想的“联系点”——形与神的共同点,能更好体味散文的感情。尤其是托物言志的散文,联想常常贯穿全篇,起重大作用。作者的写作目的不在物而在人或精神。4、品味语言。在散文阅读中,这是一个大的考点,可以包含很多小项,分析如下:(1)字词含义。原文给一个词语的拼音,让你根据语境和拼音写出词语并结合语境解释词语的含义。这个考点是今年的必考题。填写词语要靠平时的积累,解释词语要根据该词语所在的语境来推断。答题思路:①考虑文章或段落的主题,结合主题来答词语的含义;②根据该词语前后语句的内容、含义来推断。注意:如果知道该词语的原始意义解释,一定不要忽略词语在语境中的含义。(2)词语妙用。考题形式:品评加点词语作用(妙用)或加点词语能否删除。答题思路:①解释词语(在语境中)的含义;②表达作用,词语的表达作用,要结合语境或主题思想来回答,要答该词语对表达作者思想感情或主题思想的作用,有时也可以考虑词语对景物描写意境的作用或人物性格等方面的作用。③体现词语的准确性或生动性。(3)句子的赏析。这类题目所考查的句子多数是指中心句、统领句、转承句、结论句和一些意蕴比较丰富的句子。理解这些句子可以从以下三个方面来理解:从内容上看思想感情、从结构上看作用、从艺术效果上看(理解句势的整散长短对于抒情议论的作用,要理解修辞手法的效果,理解文章技法上产生的效果)。“作用或意义”类题型主要考查对句子的理解。(1)要抓住句子中的关键性词语。(2)联系上下文来理解。有些句子的含义与上下文有着密切的关系,只有顾及全篇,才能理解句子的含义。(3)联系实际,通过联想来理解。(4)从联系时代背景来理解。有的文章要与当时的情况联系起来才能理解。(5)句子在文章中所起的艺术效果,常见的有:(6)哲理性语句的深层含义。这样的题,往往结合发展性考题来考。有时,也会单纯考哲理性语句的含义,这样的考题,关键要抓住中心词,要体会词语的深层含义和双关意义。(7)句子对文章技法上产生的效果。如有的设置悬念(引发读者思考,埋下伏笔、作铺垫等),有的对比映衬,有的烘托渲染,有的欲扬先抑,有的情景交融,有的小中见大,有的升华深化,有的象征寓意等。有的题型就是考查对句子的艺术效果的理解,这就要求我们把握好各种艺术效果的表达方式,做到心中有数,有备无患。5、表达方式的作用。一篇文章或一个文段,一般会以一种表达方式为主,为了表达主题需要,往往几种表达方式综合运用,有时会考(或变相)其它表达方式的作用,有时会把修辞融合在这里考。(1)记叙(或叙述)的作用。可使读者对人物活动和事件发展全貌有个清晰的了解。(2)描写的作用。散文中的描写主要包括景物、人物描写等。景物描写,主要考意境描写的作用,答题时,重点是景物描写对表达作者或人物思想感情的作用,要严格区分小说景物描写与散文景物描写的不同(小说景物描写是渲染气氛或交代时令(季节),衬托人物;散文景物描写是直接表达作者的思想情感或主题的);人物的描写方法,肖像描写(外貌描写)、语言描写、动作描写(行动描写)、心理描写、神态描写,有关细节描写的地方值得注意。人物描写主要是突出人物的思想性格。描写可使人、事、景再现得栩栩如生,使文章更加生动形象。(3)议论的作用。散文中的议论,往往是揭示文章的主题或和抒情结合在一起,表达作者的思想情感,此考点一般不单独出题。可以点明和加深所写事物的意义,起到统领全文,画龙点睛的作用。(4)抒情的作用。要注意作者的思想情感倾向,一般不单独出题,往往和词语表达考点结合起来考。抒情可使文章具有感人力。恰当的穿插抒情、议论往往使文章锦上添花,起到画龙点睛的作用,尤其是文章末尾,作用是深化主题、感情升华、点明中心,照应题目等。6、表现手法。泛指写作上的方法,它必须是一段文字或一篇文章写作的方法。常见的表现手法有:①写景类——借景抒情、寓情于景、情景交融、移情于景②咏物类——托物言志③怀古类——借景抒情、即事抒情④咏史类——借古讽今、借题发挥⑤送别类——即事抒情、即景抒情⑥边塞类——真抒胸臆、借景抒情等等托物言志、借景抒情,是作者在生活中对某些事物有所感触而借助记叙、描写、议论来抒发思想感情的一种艺术手法,其特点是通过描写某一事物的具体形象,运用象征手法(把意义寄托在所描写、赞扬的事物上的写法)来表达作者的某种思想、抒发作者的某种情感。抒情散文多用这种写法。阅读散文时,首先要把握此类文章的结构特点,即先托物后言志物+情意托物寓意,或象征体+象征意义托物言志。其次要分析所托之物的外形特征和内在品格。托物言志的文章往往把大量笔墨花在对所托物的外在的形和内在的质的描绘上,以使所托之意有依附。然而这又不是作者的写作目的,写作的目的还是“意”,即与“物”相应的精神、品质。分析时要从“物”的外形特征和内在品质人手,揭示其象征意义。第三要抓住“物”与“意”之间的类比点即相似点,看文章如何展开联想的。有时也见衬托、对比、侧面描写、象征、卒章显志、讽喻、动静结合(以动衬静、以静衬动、动静结合)、虚实结合(以实写虚、寓虚于实、虚实相生)手法等。7、修辞手法的运用。(1)比喻的作用。①化平淡为生动。②化深奥为浅显。③化抽象为具体。④化冗长为简洁。(2)夸张的作用。①揭示本质,给人以启示。②烘托气氛,增强感染力。③增强联想;创造气氛。(3)对偶的作用。①便于吟诵,易于记忆。②用于诗词、有音乐美。③表意凝炼,抒情酣畅。(4)排比的作用。①内容集中,增强气势。②叙事透辟,条分缕析。③节奏鲜明,长于抒情。(5)反问与设问的区别。①设问不表示肯定什么或否定什么;反问则明确表示肯定和否定的内容。②反问的作用主要是加强语气,设问的作用主要是提出问题,引起注意,启发思考。8、结构和内容上的作用。(1)句子在文章结构上所起的作用,做这类题目的时候只要抓住所考查句子的类型,然后再来按照固定句子固定作用来答题即可:一般情况下,统领句起总起全文的作用,结论句起归结全文的作用,转承句(过渡句)起承上启下的作用,还需注意的是有的情况下,尾句还会起到揭示主题,点明中心的作用,注意根据不同情况来区分。(2)句子在文章内容上所起的作用,这类题主要考查对作者思想感情的理解,因为任何一篇文章都是作者为了表达自己的思想,抒发自己的感情而写的,所以字里行间一定充满了作者的思想感情,是作者思想感情的体现。做此类题时最重要的一点是结合文章的思想感情与中心思想来理解句子在文章中所起的作用。五、常见题型。1、感情变化或是小说情节的发展变化:
一般要求字数相等,答题时要注意在文中定位,并寻找关键词语。2、你喜欢文中的哪个人物,要说清楚理由。(要崇尚美)3、用一句话概况文章写了一个什么故事和表达的主题。语言要简洁。(注意只要求写故事,则不要写自己的感想之类的话)(1)从分析标题入手、从分析材料入手、从分析首段入手、从分析文章中议论或抒情句入手、从分析篇末入手、从概括段意或分析人物事件入手。(2)概括主题的常用格式:本文记叙了(描写了)……的故事(事迹、经过、事件、景物),表现(反映、歌颂、批判、揭露、告诉人们、激励或鼓励人们)……的思想(性格、精神、实质),抒发作者……的感情。(3)概括段意的有效方法。①摘句法:摘出文段的中心句。②概括法:概括文段的主要意思。③联合法:有些文段有两个或两个以上的重要意思,就要把这些意思连接在一起,概括出联合段意。(4)文章要抒发的感情,主要有赞颂、热爱、喜悦、愤怒、忧愁、哀伤、悲痛、憎恨、同情、感激、指责等。4、写景状物的散文要能抓住其与人的共同点,特别是精神方面。赞美物的原因实际上就是因为它具有与人相同的精神。5、人称。记叙文的人称:第一人称(“我”),第三人称(第三者口吻)。记叙文的人称是如果叙述人是作品中的人物,他是以当事人的身份来叙述的,就叫第一人称;如果叙述人并非作品中的人物,他是以作品中人物的对方的身份出现,就叫第二人称;如果叙述人以旁观者的身份出现,就叫第三人称。一般地说,第一人称和第三人称经常使用。如:文章运用了第一人称的写法。这样写有什么好处?答案:第一,便于作者抒发真实感情,表达深深的内疚和悔恨之意。第二,增加文章的真实性。6、注意散文会以描写物的美,到赞美,到落实到具体行动。如:“我也愿做一只小鸟”。表达了作者热爱自然、向往自然、向往自由、赞美生命等的思想感情。7、给文章拟题目,一般就以文章的线索(关键性的“物”)为题。8、亲情类。要注意常规性的词语。如:母亲是怎么的一个人?(勤劳、善良等)9、原因类。如:为什么流泪?(1)到原文中找到相关的句子。(2)原因如感动,或是因为思想感情变化,由理解到不理解等。10、发展性考题。(1)仿写。此考点一般是给一个句子,让考生仿写一个或几个,答题要点:①要读懂题旨要求,出题人让考生做什么,怎么做;②例句的关键词语是什么,要抓住关键词语思考、答题;③在没有答题思路的情况下,要考虑和例句关键词语相对、相同的词语,例如:关键词语是天空,你可以考虑大地、高山、海洋等,联想要丰富,思维开阔。(2)谈感受。这也是散文阅读的热门考题,可分为:(1)对描写对象;(2)对人物情感;(3)品味富有表现力的语言;(4)对文章某些内容或形式提出自己的看法和疑问等。此考点灵活多变,把握的关键是:①能准确读懂原文的含义和作者的思想情感;②要有自己明确的观点或态度,不能模棱两可;③答题时,语言要流畅,不能出病句,语言要有层次性。可以引用诗文或名言回答此题。(3)续写。给一段话的前半部分,让考生续写后半部分,启发考生答题的的思路,往往在原文上。(4)感悟题。是对原文内容的延伸,要在理解原文创作意图、作者创作思路的基础上进行创造活动。答题时,既要联系原文内容,更要从原文中抽取本质的东西,结合实际,发表自己的感悟和见解,体现学生的态度、情感、价值观。如:读完文章,结合自己的生活的理解,得到的启示。回答时要注意向文中的人物或是作者的想法学习
小说《千纸鹤》主要讲述了主人公菊治深陷太田夫人(父亲的情人)的温柔乡中,而后将情感转移到太田夫人的女儿文子的身上,情感纠葛,纷纷扰扰,剪不断理还乱的情丝,菊治该做何抉择最后,文子选择了离开,而菊治与雪子共度余生。
所有的悲剧以死亡结束,所有的喜剧以结婚告终——拜伦
似乎川端康成笔下的主人公,都具有这样的特质,其身上笼罩着淡淡的忧伤,解不开的惆怅,而《千纸鹤》中菊治同样如此,他是一个优柔寡断、懦弱脆弱的人物,时常使自己陷入忧郁与罪恶,一种自身营造的虚无缥缈的境地中去。
父母一直以来都是平淡如水的情感,而太田夫人插足父母之间,成了第三者。小说中最开始菊治对太田夫人是持着厌恶的态度,然而,直到父亲去世后,太田夫人把对菊治父亲的爱,转移到菊治的身上,而菊治也莫名沉沦在这柔情中。文中写道:
诱惑总是那般致命,明知是不道德的行为,连自己都会唾弃自己,但是,情感又是不理智,不受控制的,就让自己苟且偷欢,沉醉其中吧!对于这种不伦之情,他似乎也分不清现实还是幻境,莫名将自己置于这境地,退路在何处,无从得知。文中写道:
按照弗洛伊德精神分析法,他认为每个男子都有俄狄浦斯情结,只是道德的原因将其压抑在内心深处。然而,菊治遇上了太田夫人,他们越过道德的边界,跨进爱的禁区,一边享受爱的错觉,一边内心煎熬着,爱与伦理难以抉择,一切都变得一发不可收拾。
似乎当一切都成了死局时,总有人要站出来打破局面,而太田夫人以她的死划上了句点,拒绝一切的理解与原谅,但是菊治和文子却都被死纠缠住,无法背逆的伤感,渗透骨子的哀伤。
夫人的去世就像一场诅咒,久久缠绕在菊治的心头,时常错觉曾经的美好还在指尖,时常内心倍受煎熬。他常常思索太田夫人寻死的原因,终不得其解,直到文子的一番话语,“死了的人是不会强迫活着的人接受道德。”他渐渐释怀……
整部小说中,文子一直对母亲的行为深感愧疚且耻辱,尤其当母亲把对菊治父亲的爱转移到菊治的身上时,她拼命阻止母亲与菊治的交往,她深知这是错误的开始。文中写道:
情不知何起,一往而深。来回翻阅小说,我始终感受不到文子对菊治的爱,殊不知,那份情竟会那么地深。还好,她始终是理智的,深知他们之间有太对的纠葛与阻拦,摔了志野陶,摔了与菊治有关联的一切,狠狠切断这份情,那个不该爱上的人。文中写道:
你心虽善感,却从不改变。你灵魂柔顺,却从不妥协——拜伦
善良而理智的文子,在意识到自己坠入受到道德与良心责谴的爱情时,理智地选择离开。她知道,这份爱是生命中不能承受的爱的重量,母亲已经以她的死,换得文子的活,不离开,她将会成为下一个母亲。
文子爱上了一个不该爱的男子,她深知他们不能相爱,更没有未来。各种情感交织缠绕杂糅,文子竭力用最后的一丝理智,掐断了这份情,这一段错误的爱情根本就没有开始的必要。或许离开是最好的选择,救赎彼此。
她的离开,让菊治从罪恶中骤然清醒过来,她的离开,既救赎了菊治,也拯救了自己。
远方的她选择祈祷菊治幸福,然后一个人默默无闻地活着,在一个陌生的地方重新开始。虽然我深爱着你,但是我也只能祝福你,放过彼此,各自幸福。
文中多次提到稻村雪子**衣物上的千纸鹤纹样,而雪子**正如千纸鹤那般,代表菊治的情感寄托,以及对于美的终极幻想。
似乎川端康成的小说中,总有一个神化、理想化的人物,那人是纯洁与美好的结合,是不忍亵渎玷污的存在,是主人公菊治的精神净土。文中描写雪子**的笔墨不多,但是总给人眼前一亮之感。文中写道:
菊治一生中遇到的这三个女人,太田夫人是他的欲望宣泄,文子是他得不到的美好,而雪子才是他心灵的归宿,深感安心踏实。
人的一生总会遇到无数的人,然而真爱在哪?不断寻找不断迷失,或许爱为何物,我们皆不明了,只是心得以安放便足够了。
庆幸故事的最后,菊治终清醒明白,这份执着且带有罪恶感的爱只会折磨两人,终逃不出道德伦理的圈子,他选择放弃了杳无音讯文子,寻得如雪花般纯洁的雪子,从此,两人相濡以沫。
http://minieastdaycom/bdmip/180414224336264html
在这篇文章中,主要介绍的内容有:
1、将单词转换为特征向量
2、TF-IDF计算单词关联度
文本的预处理和分词。
如何将单词等分类数据转成为数值格式,以方便我们后面使用机器学习来训练模型。
一、将单词转换为特征向量
词袋模型(bag-of-words model):将文本以数值特征向量的形式来表示。主要通过两个步骤来实现词袋模型:
1、为整个文档集(包含了许多的文档)上的每个单词创建一个唯一的标记。
2、为每个文档构建一个特征向量,主要包含每个单词在文档上的出现次数。
注意:由于每个文档中出现的单词数量只是整个文档集中很少的一部分,因此会有很多的单词没有出现过,就会被标记为0。所以,特征向量中大多数的元素就会为0,就会产生稀疏矩阵。
下面通过sklearn的CountVectorizer来实现一个词袋模型,将文档转换成为特征向量
通过countvocabulary_我们可以看出每个单词所对应的索引位置,每一个句子都是由一个6维的特征向量所组成。其中,第一列的索引为0,对应单词"and","and"在第一和二条句子中没有出现过,所以为0,在第三条句子中出现过一些,所以为1。特征向量中的值也被称为原始词频(raw term frequency)简写为tf(t,d),表示在文档d中词汇t的出现次数。
注意:在上面词袋模型中,我们是使用单个的单词来构建词向量,这样的序列被称为1元组(1-gram)或单元组(unigram)模型。除了一元组以外,我们还可以构建n元组(n-gram)。n元组模型中的n取值与特定的应用场景有关,如在反垃圾邮件中,n的值为3或4的n元组可以获得比较好的效果。下面举例说明一下n元组,如在"the weather is sweet"这句话中,
1元组:"the"、"weather"、"is"、"sweet"。
2元组:"the weather"、"weather is"、"is sweet"。
在sklearn中,可以设置CountVecorizer中的ngram_range参数来构建不同的n元组模型,默认ngram_range=(1,1)。
sklearn通过CountVecorizer构建2元组
二、TF-IDF计算单词关联度
在使用上面的方法来构建词向量的时候可能会遇到一个问题:一个单词在不同类型的文档中都出现,这种类型的单词其实是不具备文档类型的区分能力。我们通过TF-IDF算法来构建词向量,从而来克服这个问题。
词频-逆文档频率(TF-IDF,term frequency-inverse document frequency):tf-idf可以定义为词频×逆文档频率
其中tf(t,d)表示单词t在文档d中的出现次数,idf(t,d)为逆文档频率,计算公式如下
其中,nd表示文档的总数,df(t,d)表示包含单词t的文档d的数量。分母中加入常数1,是为了防止df(t,d)=0的情况,导致分母为0。取log的目的是保证当df(t,d)很小的时候,不会导致idf(t,d)过大。
通过sklearn的TfidfTransformer和CountVectorizer来计算tf-idf
可以发现"is"(第二列)和"the"(第六列),它们在三个句子中都出现过,它们对于文档的分类所提供的信息并不会很多,所以它们的tf-idf的值相对来说都是比较小的。
注意:sklearn中的TfidfTransformer的TF-IDF的计算与我们上面所定义TF-IDF的公式有所不同,sklearn的TF-IDF计算公式
通常在计算TF-IDF之前,会对原始词频tf(t,d)做归一化处理,TfidfTransformer是直接对tf-idf做归一化。TfidfTransformer默认使用L2归一化,它通过与一个未归一化特征向量L2范数的比值,使得返回向量的长度为1,计算公式如下:
下面通过一个例子来说明sklearn中的TfidfTransformer的tf-idf的计算过程,以上面的第一句话"The sun is shining"为例子
1、计算原始词频
a、单词所对应的下标
b、计算第三句话的原始词频tf(t,d)
c、计算逆文档频率idf(t,d)
注意:其他的词在计算tf-idf都是0,因为原始词频为0,所以就不需要计算idf了,log是以自然数e为底。
d、计算tf-idf
所以,第一个句子的tf-idf特征向量为[0,1,129,129,0,1,0]
e、tf-idf的L2归一化
该剧根据倾冷月的同名小说改编而成。在原著小说中,心机极深的黑息,人送称号黑丰息,以丰国之兰息公子的身份迎娶了风国之惜云公,人称白风夕
但在婚后的十年中,两人之间仍是有隔阂,但在经过东旦之战后,双方似乎都获得了新生,黑丰息也为了白风夕在最后放弃了半壁江山,双双归隐。
这部小说是男强女强,男腹黑,女一开始吊儿郎当嫌弃男主老狐狸一只,后续女主落难男主不离不弃日久生情。
白凤夕是一位非常奇特的女子,她背后拥有着高贵的身份,但是却带着江湖侠气出现在我们眼前。
黑丰息和他的名字一样充满着孤傲,在看小说的过程中,想象他的样子,也是穿着黑色的衣服。
且试天下男主感情分析
从读者的角度来看,且试感情线,小白走暗线,主要体现在一些细微的语言和表情以及心理活动上;小黑走明线,一开始读者就能看出小黑几乎无条件的宠溺、包容小白,时常不自觉的吃点小醋,因为不放心小白翻遍宣山救她,亲自给她喂药,小白要他背死人也不反抗,因为燕救了小白还给燕一条活路,鸠占鹊巢他的马车吃完他的糕点、害他饿肚子骑马他也只是惩罚性点了下她腰间的痒穴,时时被讥讽嘲笑甚至恶意揣测他的行为,他明明很在意却也不太与她较气,的的确确从行动上包容她所有的坏毛病所有的言行无忌。
小黑对小白独一无二非同寻常的态度,使得他身边的人都对小白很恭敬。有人觉得小黑对小白这么好是有利益的原因,可能小白内心也这样想,但个人觉得利益因素不大,他应该就是习惯成自然, 他接纳她进入自己的生命从心里把她归为自己人,他没觉得这样的相处有什么问题,一切仿佛理所当然。如果没有燕瀛洲没有玉无缘,大概还要这么理所当然下去。
燕瀛洲的出现,让他颇为不爽,他开始关心她是不是喜欢上别人了,虽然得到了否定的答案,但他们之间维系了近十年的平衡出现了缝隙,这么个路人居然在他们感情里横插一脚的微妙感觉。虽然他“死了”,可接着又认识个皇朝玉无缘,还都对那女人颇为推崇,好像自己珍藏的明珠被别人发现并觊觎了。于是他们在华国的再次相遇,他的眼里多了几分探究,他想试探她对他的感情,奈何小白藏的太好,他自己也弄不清楚自己的心意,所以还是顺着计划求娶华纯然。(为什么前面我说他对小白的好与利益关系不大,因为他之前没想过为了青州娶风惜云,他是想尽量保持他和小白感情的干净的吧。)
他试探小白,“娶华纯然如何呢”他也许自己内心也茫然,想要小白给他一个放弃的理由。小白给他了,小白在他面前非常甜蜜的向往的感叹,玉无缘有多么多么的好……他竟一时控制不住情绪,“你……你难道对他……”,小白诡秘的一笑,让他多关心一下凤栖梧。于是他迷茫到魂不守舍,在街上又被小玉刺激了一通,他来不及细想便冒着暴露身份的危险挑破小玉短命的事实。
(不少人还挺喜欢刷这句天人玉家何以未能天人永寿,私以为这句对无缘非常残忍,因为玉家人本身就是为了八王背负久罗血咒,小黑应该清楚血咒的因果清楚玉家人的无辜,却还拿这话来伤无缘,有点恶毒。这与小黑一贯的气度不符,但这也说明小黑这里内心已经方寸大乱了,他只想着阻止小白和无缘的进一步可能。)
直到纯然点婿那里的放弃,小黑才看清了自己的心意,原来他真的爱那女人,非她不可。这里放弃华纯然与小白的真实身份无关,他那个时候只想到了风夕,不是风夕……就不行。接着跟小白回青州,一是因为担心她,二是因为既然放弃幽州,那他无论如何都要得到青州,至少要得到青州的支持,不能跟其他州联盟。结果在青州,小黑不仅见到了风夕的另一面惜云,还应该隐约感觉到了小白对他的感情突飞猛进的也清晰了许多。
惜云可谓是让他惊叹连连,惜云的文稻武略,惜云的雍容典雅,惜云的清丽脱俗,惜云的英姿飒爽……每一面都让他很是欢喜,除了惜云对他肉眼可见的防备。即便小白说着把青州和风云骑送给他,心头依旧沉重,因为送给他的前提竟然是把他们十年相交归为利益归为他想要风云骑呵,何其可笑,何其冷漠。但他没有反驳,他们吵架就像两头雄狮对峙,他们互不相让,决不甘心落入下风。
人物关系图
1、白风黑息:
风夕:风惜云,风国惜云公主,喜欢过玉无缘
丰息:丰兰息,丰国兰息公子,与风夕江湖齐名十年
最终丰息和风夕放弃天下,携手归隐江湖
2、皇朝和华纯然:
皇朝:皇国太子,喜欢风夕,最终天下的得主,其师傅与丰息的师傅曾经有一场赌局
华纯然:华国公主,喜欢丰息,但最终嫁于皇朝,共主天下
3、玉无缘:喜欢风夕,但无奈玉家命运,舍情弃爱,助皇朝夺天下,早逝
4、凤栖梧:凤氏一族乃皇后之命,卖艺为生,喜欢丰息
5、燕瀛洲:皇国烈风将军,被风夕所救,喜欢风夕,风夕曾答应嫁于燕瀛洲,后被风夕误杀
6、久罗族人:
久容:修久容,跟随风夕,喜欢风夕却不能直言,后为风夕而死;琅华公主钟情于久容
久微:落日楼楼主,似风夕的哥哥一般,无话不说,兄妹情谊
颜九泰:市井中人,却是久罗族人,后跟随风夕
7、韩朴:风夕义弟
8、君品玉:貌似喜欢丰息,但是最终嫁于雪空
9、雪空:萧雪空,皇国扫雪将军,皇朝贴身侍卫,喜欢风夕
10、皇雨:皇国雷雨将军,皇朝的弟弟,
11、九霜:秋九霜,皇国寒霜将军,后嫁于皇雨
12、折笛:风夕的侍卫,被扔在浅碧山习武
13、任穿云:丰息的墨羽四将之一,穿云将军,与任穿雨为亲兄弟
14、任穿雨:丰息的军师
15、钟离钟园:丰兰息的双胞胎侍童
16、东殊放:东朝将领,与风夕落英山一战
17、琅华:白国琅华公主
《理智与情感》的主角是埃莉诺和玛丽安两姐妹,这两位女主角曲折复杂的婚事风波为主线,“理智与情感”对比鲜明。以下分别对两主角分析:
1、埃莉诺是家中的长女,生活中的经历塑造了她理智、冷静和谨慎的性格。她的择偶标准并不看重对方的外貌和经济条件,而是内在修养。她心地善良、性格温柔,总是设身处地考虑他人的需要和幸福,懂得控制自己的感情。
2、十七岁的玛丽安性格十分率真、热情,比较感性,特别注重艺术情趣以及恋人之间的心心相犀。她认为:跟一个趣味不能完全相投的人一起生活,是不会幸福的。她容易受感情支配,在交友的过程中,轻易动情,任性行事,没有理性从事。
(一)通过肖像、行为、语言、心理、和细节等方面的描写分析人物形象。
1.肖像描写。肖像描写是指用精确、生动、形象的语言描绘人物外形各个方面的特点,成功的肖像描写不仅能够使人物凸现在读者眼前,而且可以表现人物的身份、地位、经历、遭遇,从而揭示人物的性格特征。如鲁迅的小说《故乡》中二十年后的闰土肖像描写:“先前的紫色的圆脸,已经变得灰黄,而且加上了很深的皱纹;眼睛也像他父亲一样,周围都肿得通红,……他头上是一顶破毡帽,身上只一件极薄的棉衣,浑身瑟索着;那手也不是我记得的红活圆实的手,却又粗又笨而且开裂,像是松树皮了。”这里的肖像描写使读者感受到旧中国广大农民所经受的饥荒、苛税、兵、匪、官、绅的种种重压,感受到他们身心所忍受的无限的痛苦与摧残。
2.行动描写和语言描写。行动描写与语言描写是通过对人物的动作和对话的具体来表现人物的精神面貌,思想感情和性格特征的描写方式。动作描写给读者鲜明的视觉印象使人物形象具体、可感知、生动化;语言描写则易表现行动所不易显示的细微情感、态度等。总而言之,行动和语言两种形式密切配合,相得益彰。如《孔乙己》通过个性化的语言描写,揭示孔乙己自命清高、迂腐不堪、自欺欺人的性格。课文多次描写他满口“之乎者也”,反映他受封建教育毒害之深。孔乙己用“四书”“五经”中的所谓“圣言”为自己辩解,连偷书也说成“窃书不能算偷”。这些性格化的语言极能表现人物鲜明的个性。如《鲁提辖拳打镇关西》一文里,店小二阻拦鲁达时,是这样描写鲁达的:“鲁达大怒,揸开五指,去那小二脸上只一拳,打得那店小二口中吐水,再一拳,打落两个当门牙齿。”一个“揸”字,把人物怒不可遏,义愤填膺的形象刻画得微妙微肖,充分表现了鲁达爱打抱不平、济危扶贫的性格特征。
3.心理描写。小说家在刻画人物的时候,用心理描写来揭示人物在特定环境中的内心活动的。人物的语言和动作其实是内心世界的反映和外露,要准确而深刻地刻画人物,塑造形象就要把人物的外部形态与内心世界有机地统一起来。例如《最后一课》写小弗郎士上习字课时 ,“屋顶上鸽子咕咕咕地低声叫着,我心理想:‘他们该不会强迫这些鸽子也用德国话唱歌 ’”这就很符合小孩子的心理特点 ,只有小孩子才能在侵略者强迫他们放弃学习祖国语言的权利时 ,由鸽子叫联想到侵略者的罪恶 ,从而表达了孩子们对侵略者的强烈憎恶和对祖国的无比热爱之情。
4.细节描写。细节描写是指人物、环境、物件等方面所作的具体而细致的描写,其特征是细微之处见精神。如《变色龙》中脱大衣穿大衣的细节描写,就暗示人物具有变色龙的特色,揭示了人物见风使舵,欺下媚上的典型性格;外表的变化同卑鄙的心理相映称。足见作者匠心独运。
(二)通过小说精心设置故事情节来分析人物的性格。
人物性格支配、影响着故事情节的进展和情节的发展,同时,人物性格又通过情节获得具体的显现。
1情节的安排以人物为轴心。如《皇帝的新装》按照“爱新装——做新装——穿新装——展新装”安排情节,揭露和讽刺了皇帝和大臣们的虚伪、愚蠢和自欺欺人的丑行。
2从情节的发展中表现人物性格。如《最后一课》中,随着情节的发展,展现了小弗郎士 从怕老师到爱老师,从贪玩无知到恨敌人,从没有民族意识到心中植下爱国的根的爱国思想。
(三)通过典型环境的具体描写分析人物形象。
人在一定环境中生存、活动,事件也总在一定环境是发生、发展。所以小说通常通过典型环境的具体描写刻画人物形象。
1.小说通过对自然环境描写,烘托人物性格,这种自然环境可以由作者来描写,也可以通过小说中人物的眼睛去观察。如鲁迅的《故乡》开头对故乡萧条景象的描写,衬托出“我”的悲凉心情。
2小说通过对社会环境的描写显示人与人之间的关系。如《孔乙己》以咸亨酒店为中心的社会环境描写,不但自然而巧妙地交代了故事发生的社会背景,而且形象而又深刻地揭露了阶级对立、贫富悬殊的社会现实。
(四)如何判断小说主人公
判断人物是否是主人公,不是看人物是否贯穿始终和用的笔墨的多少,而是依据作者所要表达的中心意思,看他是否体现了作者的创作意图。概括人物性格特征应抓住言行心理等方面。因为,人物的性格和人物的言语行动是统一的,什么样的性格决定有什么样的行为,不同性格的人物都有自己独特的语言习惯,所以从人物的语言行动人手,不难把握人物形象的性格特征。肖像、心理描写也是刻画人物的重要手段,分析时也不能忽视。而对那些既具有独特而鲜明的个性,又能反映社会的某些本质,具有某种共性的典型人物,还要从人物之间的关系和人物与主题的关系去分析其典型意义。
《双城记》是19世纪英国杰出小说家查尔斯·狄更斯的一部作品,狄更斯在英国古典作家中,其成就仅次于莎士比亚。《双城记》以法国大革命为背景,以巴黎和伦敦作为故事的发生地。法国贵族厄弗里蒙地侯爵兄弟为了霸占一农妇,几乎虐杀这个农妇全家。医生梅尼特写信向朝廷告发此事,却反被侯爵兄弟关进巴士底狱达18年之久。
小说探讨了法国大革命爆发的原因,肯定了法国大革命的正义性,作者指出,法国大革命的爆发是贵族阶级的腐朽、残忍、飞扬跋扈的结果,是下层人民长期仇恨的总爆发,小说通过厄弗里蒙地侯爵,“朱古力爵爷”的荒*、奢侈、残暴,梅尼特医生和得伐石太太一家的苦难遭遇,雄辩地说明了这一点。作者虽然肯定了法国大革命的必然性与正义性,却反对革命暴力和大规模的群众运动。
1、数据预处理:将原始文本数据进行清洗、分词、去除停用词等预处理操作,得到文本的词袋表示。
2、特征提取:对于每个属性,从词袋中提取出与该属性相关的特征词,例如“价格”、“质量”等。
3、聚类或主题建模:使用聚类或主题建模方法对文本进行无监督学习,将文本按照不同的主题或簇进行分组,从而实现属性级分类,对于聚类方法,可以使用K-means、DBSCAN等算法。对于主题模型,可以使用LDA等算法。
4、情感分析:对于每个属性,计算该属性下文本的情感得分,可以使用情感词典或者情感分类器等方法进行情感分析。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)