一、过去分词作定语
动词过去分词表示的意义是被动的和完成的,单个的分词作定语常常放在被修饰词的前面,而分词短语作定语时,通常置于被修饰词的后面,其作用相当于一个定语从句。且分词所表示的动作与其所修饰的名词构成逻辑上的动宾关系。
1.Most of the artists ____________ to the party were from South Africa.〔MET90〕
A.invited B.to invite C.being invited D.had been invited
简析句中的most of the artists与invited之间是被动关系,故应选用过去分词,相当于who were invited,答案为A。
2.The computer centre,____________ last year,is very popular among the students in this school.〔NMET93〕
A.open B.opening C.having opened D.opened
简析根据句中的last year可知the computer centre去年就开业了,表示完成的动作;而且open与the computer centre又存在被动关系,句意为:去年开办的计算机中心在这所学校里受到学生们的欢迎。答案为D。
3.The first textbooks ____________ for teaching English as a foreign language came out in the 16th century.〔NMET94〕
A.having written B.to be written C.being written D.written
简析根据语境,我们应选D,因为written既表示被动又表示完成的动作。A不能作后置定语,B是不定式的被动语态,表示将来的动作,C表示正在进行的动作,均不合题意。
4.The Olympic Games,____________ in 776 BC,did not include women players until 1912.〔NMET97〕
A.first playing B.to be first played C.first played D.to be first playing
简析根据题意可知,the Olympic Games与play之间是被动关系,因此可以排除A和D,另外B表示将来的动作,也应排除,故答案为C。它可还原成一个非限制性定语从句:which was first played in 776 BC。
二、过去分词作状语
过去分词作状语时,它常与句子的主语构成逻辑上的动宾关系。作条件、原因、时间状语时,分词短语常位于句首;作伴随、方式、结果状语时,分词短语常位于句末。
5.____________ more attention,the trees could have grown better.〔MET90〕
A.Given B.To give C.Giving D.Having given
简析句子主语the trees与give之间是被动关系,故答案选A,过去分词短语Given more attention作条件状语,放于句首。
6.____________ in thought,he almost ran into the car in front of him.〔NMET96〕
A.Losing B.Having lost C.Lost D.To lose
简析be lost in thought为固定搭配,意为“陷入沉思”,因此答案选C。过去分词短语 Lost in thought与句子主语he构成逻辑上的动宾关系,且在句中作原因状语。
注意:过去分词作状语时,有时可以与一些连词连用,如:when, while, if, until, once等,这实际上是过去分词在省略句中的应用。
7.The research is so designed that once ____________ nothing can be done to change it.〔NMET2002〕 A.begins B.having begun C.beginning D.begun
简析答案为D。once begun在句中作条件状语,它是状语从句once it is begun的省略形式,句意为:这项调查研究事先计划的如此完好,以致于一旦开始,什么也无法改变它。
8.Generally speaking, ______according to the directions, the drug has no side effect (2003’上海)
A when taking B when taken C when to take D when to be taken
简析完整的说法应是when the drug is taken according to the directions,…由于主句的主语和从句的主语相同,因此可以省略从句的主语the drug和谓语的一部分is,答案为B。当然也可以省去when。
三、过去分词作表语
过去分词及过去分词短语作表语时,分词所表示的动作与句子的主语构成逻辑上的动宾关系;而现在分词及其短语作表语时,分词所表示的动作与句子的主语构成逻辑上的主谓关系。
9.Cleaning women in big cities usually get ____________ by the hour.〔NMET98〕
A.pay B.paying C.paid D.to pay
10.As we joined the big crowd I got ____________ from my friends.〔NMET2001〕
A.separated B.spared C.lost D.missed
简析第8题答案为C,过去分词paid作系动词get的表语,类似的用法还有:get married,get beaten,get excited,get caught in等。同样,第9题答案为A,句意为:当我们走进人群中时,我和朋友们分开了。
过去分词作表语时,应注意它和现在分词的区别:现在分词常常表示特征,意为“令人……”,而过去分词则表示状态,意为“(某人)感到……”。如:
11.I used to play ping-pong a lot in my spare time,but now I am interesting in football.〔NMET97短文改错〕〔答案〕将interesting改为interested。
四、过去分词作宾语补足语
过去分词作宾语补足语时,常见的句式有:
1.使役动词或感官动词(have, make, see, hear, watch, notice, feel等)+宾语+过去分词。如:
Yesterday I had my bicycle repaired.
The teacher spoke so slowly so that he could make himself understood.
On my way back home, I heard my name called.
另外,have还有“遭受、遭遇”的意思。如:
Yesterday she had her wallet stolen when she was doing shopping.
12.The speaker raised his voice but still couldn't make himself ____________ .〔MET91〕
A.hear B.to hear C.hearing D.heard
简析make oneself heard为固定结构,意为“使自己的声音被别人听到”,再如make oneself understood表示“把自己的意思表达清楚”,故答案为D。
13.-Good morning.Can I help you? -I'd like to have this package __________,madam.〔MET89〕 A.be weighed B.to be weighed C.to weigh D.weighed
简析have sth.done是固定结构,意为“让别人去做某事”或“让某事被别人完成”,该题表示“我想让别人称这个包裹”,因此答案为D,过去分词weighed作this package的宾语补足语。
2.某些动词(keep, leave, get, find)+宾语+过去分词。如:
If I get further information, I’ll keep you informed.
When I came into the classroom, I found it cleared.
3.介词with+宾语+过去分词。如:
The child was crying with the glass broken.
With all the work finished, they hurried back home for lunch.
14.The murderer was brought in,with his hands ____________ behind his back.〔MET90〕
A.being tied B.having tied C.to be tied D.tied
简析在with复合结构中,hands与tie之间含有被动关系,因此首先排除B,另外此处tied不但表示被动,还可以表示完成,因此A、C又可排除,故答案为D。
15.The managers discussed the plan that they would like to see ____________ the next year.〔NMET2000〕
A.carry out B.carrying out C.carried out D.to carry out
简析该题句式结构较为复杂,首先,先行词the plan后跟一个由that引导的定语从句;在定语从句中,关系代词that替代the plan,又充当动词see的宾语,因此该空处于宾语补足语的位置;另外,the plan与carry out之间是动宾关系,故答案为C,构成see sth.done结构。
五、过去分词作独立成分
16.____________ the general state of his health,it may take him a while to recover from the operation.〔NMET2000春季高考〕
A.Given B.To give C.Giving D.Having given
简析此题答案为A。此处given是介词,意为“假设,如果,考虑到”,句意为“鉴于他的健康状况,手术后康复还需要一段时间”。另外,given作为这一含义时,还可作连词,后接从句。如:
It seemed bad-tempered to send him away,given that he only wanted to take photographs.
六、情感动词的分词用法
形容词化的分词一直备受高考的关注,尤其是表心理情感的动词用V-ing形式,还是用V-ed形式,历年都考,其用法请见下表: V-ing 作定语和表语,形式为 sth+V-ingV-ing+n 使令人感到 V-ed作定语和表语,形式为sb+V-edV-ed+n 某人感到
注:1 表示心理情感的动词在教材中多次出现。如 satisfy,please,move,delight,inspire,touch,disappoint,discourage,tire,frighten,excite,interest,surprise等都可以加上适当的分词形式来表示不同的意义。一般来说,V-ing形式有主动意义,是指事物影响到人;V-ed形式有被动意义,是指受了某事物的影响。如:
excited children高兴的孩子们 exciting news令人高兴的消息
2 有时过去分词也可以修饰事物,特别是与人有关的表情、眼神、眼泪、声音等时,要用V-ed形式。如: excited tears激动的泪水 disappointed expression失望的神情
过去分词的用法
非谓语动词的用法讲解:
Huzhou No 2 High School
1 及物动词的过去分词作表语,与句子主语是被动关系,表示主语的状态,既表示被动,又表示完成
(1)_ The cup is broken 茶杯破了
2 不及物动词的过去分词作表语,与句子主语是主动关系,表示主语的状态,只表示动作的完成
(2) He is retired 他已退休
3 有些过去分词作表语时,构成的谓语很接近被动结构
(3)_The city is surrounded on three sides by mountains 这座城市三面环山
过去分词作表语
注意过去分词作表语与被动语态的区别:过去分词作表语,主要是表示主语的状态,而被动语态则表示动作
(1) The cup was broken by my little sister yesterday 茶杯是昨天我小妹打碎的(是被动语态,表示动作)
(2) The library is now closed 图书馆关门了(过去分词作表语)
注意过去分词表示被动或完成, -ing 形式表示主动或进行有些动词如 interest, bore, worry, surprise, frighten 等通常用其过去分词形式来修饰人,用 -ing 形式来修饰物
(3) The book is interesting and I'm interested in it 这本书很有趣,我对它很感兴趣
过去分词作定语
作定语用的过去分词相当于形容词,其逻辑主语就是它所修饰的名词及物动词的过去分词作定语,既表被动又表完成;不及物动词的过去分词作定语,只表完成
1 过去分词用作定语,如果是单个的,常置于其所修饰的名词之前
We must adapt our thinking to the changed conditions 我们必须使我们的思想适应改变了的情况
2 过去分词短语用作定语时,一般置于其所修饰的名词之后,其意义相当于一个定语从句,但较从句简洁,多用于书面语中
The concert given by their friends was a success他们朋友举行的音乐会大为成功
3过去分词短语有时也可用作非限制性定语,前后常有逗号
(1)The meeting, attended by over five thousand people, welcomed the great hero 他们举行了欢迎英雄的大会,到会的有五千多人
4 用来修饰人的过去分词有时可以转移到修饰非人的事物,这种过去分词在形式上虽不直接修饰人,但它所修饰的事物仍与人直接有关
(2) The boy looked up with a pleased expression 男孩带着满意的表情举目而视
过去分词作状语
1 过去分词作状语过去分词作状语表示被动的和完成的动作
(1) Written in a hurry, this article was not so good! 因为写得匆忙,这篇文章不是很好
注意written 为过去分词作状语,表示这篇文章是被写的,而且已经被写 值得注意的是,有些过去分词因来源于系表结构,作状语时不表被动而表主动这样的过去分词及短语常见的有: lost (迷路); seated (坐); hidden (躲); stationed (驻扎); lost / absorbed in (沉溺于); born (出身于); dressed in (穿着); tired of (厌烦)
(2) Lost / Absorbed in deep thought, he didn't hear the sound因为沉溺于思考之中,所以他没听到那个声音
2 过去分词作状语时其逻辑主语为主句的主语,此时应注意人称一致
(1) Given another hour, I can also work out this problem
再给我一个小时,我也能解这道题(given 为过去分词作状语,它的逻辑主语为主句主语 I ,即 I 被再给一个小时)
(2)_ Seen from the top of the hill, the city looks more beautiful to us
从山顶看城市,城市显得更漂亮(seen 为过去分词作状语,表"被看",由语境可知,它的逻辑主语必须是城市,而不是"我们",因为"我们"应主动看城市)
注意如果过去分词作状语时,前面再加逻辑主语,主句的主语就不再是分词的逻辑主语,这种带逻辑主语的过去分词结构实际上属于独立主格结构
(1) The signal given, the bus started 信号一发出,汽车就开动了(the signal 是 given 的逻辑主语,因此主句主语 the bus 就不是given 的逻辑主语
(2) Her head held high, she went by 她把头昂得高高地从这儿走了过去(her head 是 held high 的逻辑主语,因此主句主语 she 就不再是held high 的逻辑主语)
3 过去分词作状语来源于状语从句
(1) Caught in a heavy rain, he was all wet 因为淋了一场大雨,所以他全身湿透了 (caught in a heavy rain 为过去分词短语作原因状语,它来源于原因状语从句 Because he was caught in a heavy rain)
(2)_Grown in rich soil, these seeds can grow fast 如果种在肥沃的土壤里,这些种子能长得很快( grown in rich soil 为过去分词作条件状语,它来源于条件状语从句 If these seeds are grown in rich soil
注意状语从句改成过去分词作状语时有时还可保留连词,构成"连词+过去分词"结构作状语
When given a medical examination, you should keep calm 当你做体格检查时要保持镇定
4 过去分词作状语的位置过去分词可放在主句前作句首状语,后面有逗号与主句隔开;也可放在主句后面,前面有逗号与主句隔开
He stood there silently, moved to tears = Moved to tears, he stood there silently 他静静地站在那里,被感动得热泪盈眶
过去分词作宾语补足语
(一)能够接过去分词作宾补的动词有以下三类:
1 表示感觉或心理状态的动词如:see, watch, observe, look at, hear, listen to, feel, notice, think等
(1) I heard the song sung in English 我听到有人用英语唱过这首歌(过去分词sung的动作显然先于谓语动作heard;)
(2)_He found his hometown greatly changed 他发现他的家乡变化很大(过去分词changed的动作显然先于谓语动作found)
2 表示"致使"意义的动词如:have, make, get, keep, leave等
(1) I'll have my hair cut tomorrow 明天我要理发
(2) He got his tooth pulled out yesterday 他昨天把牙拔了
(3) Don't leave those things undone 要把那些事情做完
注意过去分词所表示的动作一定和宾语有逻辑上的动宾关系
(二)使役动词have接过去分词作宾补有两种情况
1 过去分词所表示的动作由他人完成
(1) He had his money stolen他的钱给偷了(被别人偷去了)
2 过去分词所表示的动作由句中的主语所经历如:
(2) He had his leg broken他的腿断了 (自己的经历)
"with +宾语+过去分词"结构
"with +宾语+过去分词"结构中,过去分词用作介词 with的宾语补足语这一结构通常在句中作时间,方式,条件,原因等状语例如:
(1) The murderer was brought in, with his hands tied behind his back 凶手被带进来了,他的双手被绑在背后(表方式)
(2) With water heated, we can see the steam 水一被加热,我们就会看到水蒸气(表条件)
(3) With the matter settled, we all went home 事情得到解决,我们都回家了(表原因)
(4)_She stood in front of him, with her eyes fixed on his face 她站在他面前,眼睛注视着他
(5) He stood for an instant with his hand still raised 他仍然举着手站了一会儿
情感分析是自然语言处理中的一个重要应用,它旨在通过分析文本的情感倾向来了解人们对某个主题或事件的情感态度。在干中文分词应用中,情感分析通常是通过对文本进行分词、词性标注、实体识别等处理后,再应用机器学习或深度学习等技术来判断文本的情感倾向。因此,情感分析可以被视为语句关系判断的一种应用,它能够帮助我们更好地理解人们对某个主题或事件的态度和情感倾向,进而为企业、政府等组织提供更加精准的决策支持。
我在 《爬取百万页面 分析用户画像》 中分析了用户的书籍喜好,这里继续尝试通过影评文章的抓取、内容清洗、影评句子提取,建立机器学习情绪预测模型,挖掘分析用户对流行**的喜好。
涉及的NLP(自然语言处理)知识点:
涉及的ML(机器学习)知识点:
**的拍摄成本高、票价也不低,消费者投入的关注度和观看成本高(最终的投入成本是包括注意力投入、金钱投入、时间投入和感情投入)。
简单算下观看一部**的成本(步骤):先看下预告内容,做下同期上映**的比较,觉得导演、演员阵容都不错,下定决心要看了,跟男/女友/老婆 /老公/基友/闺密做推荐,推荐成功后去选座买票,观影当天说不定还得先吃个饭,饭后乖乖的在影院呆上90分钟(关键时刻还得憋尿),观影结束后指不定还得来个夜宵、开个房间探讨下人生什么的。。。
读一本书的成本(步骤):1打开书/电子阅读器/手机;2 读!
这样对比看一部**比读一本书的投入成本高多了!
因此观众给出的反馈自然也比书籍会强烈一些,特别是满怀期待看完却发现是一部烂片,有种上当受骗的感觉。
因此对**光是通过词频作为喜好度是不够的,用户可能反复的在骂呢。
所以需要引入多一个分析的因子:情绪。用户提及某个**时的情绪是怎么样的,是积极愉悦、还是负面愤怒,加上这个才能有效判定用户对**或者某个事物的喜好。
在豆瓣上,用户的评分就是最直接的情绪数值:5力荐,4推荐,3还行,2较差,1很差。
但在这类写作平台上,发布文章时是没有一个选项来填写分数,也没提供选择心情的选项。
“所言即其所思”,这是普遍人性。每个用户写下的文字表达想法,在字里行间都会不经意的使用一些情绪用词来表达,这些便是我可以获取的“原始数据”。
精准推荐!用户谈论得多的东西未必是TA所喜爱的,也许是TA痛恨的(比如说前任)。如果用户在自己大力差评某部**的文章底部看到另一部相似烂片的推荐,推荐文案还写着“亲,我猜你还喜欢看这些”,估计这用户会有种吃了苍蝇刚吐出来发现迎面又飞来几只的感觉。
通过用户在讨论某事物时上下文的情绪分析,来判断对该事物的喜恶,将预测结果加入对事物的打分计算中,最后得出一个可量化、可计算的分数值,便是一个精准推荐系统的需要解决的问题。
理论上只需要一句话:要识别出文章中提及的**,以及作者对该**的评论,是好评还是差评,作为文章作者对该**的喜恶,并根据评论的情绪强烈程度转化为喜恶程度即可。
那实际上,就要解决以下问题:
下面逐一细说。
我采集了上几个比较受欢迎的**专题以及一个大V帐号文章(数据截止至采集数据时):
但由于对专题页面加了访问限制,每个专题只能访问到最新的200个列表页面,因而每个专题可获取2~3000篇文章,以此作为抽样数据样本。
要分析对**的评价,首先就要获取到文章中提到**名称有哪些,最简单的匹配规则便是提取书名号 《》 内的内容。
而实际获取到的**名称真可谓“脏乱差”,有**名、书籍名、文章名等,有些**名称会用缩写引用(如《变1》、《复联》、《生化危机4/5/6》),或者中英文混合在一起(如《机器人总动员(wall-e)》),甚至还有错漏别字(如《那些年,我们一起追过的女孩》,多了个“过”字),以及包含中英文特殊标点空白符号等,例如:
因此需要进行一轮“数据大清洗”,我使用如下清洗策略:
其中“**专用词典”,是通过采集了 「猫眼 影片总票房排行榜」 2000~2017年间上榜的所有**,约有3000+部,如图:
再根据文章中所收集到的**名称的候选文本,抓取「豆瓣网」的官方**名字(遭遇了豆瓣业内闻名的反爬策略就不多说了),合并去重后约有8400多部。看一眼才发现好多**连听都没听过,有些**名称还挺有趣,以后有时间还可以做下**名称的分析。
为了解决错别字,我通过文本相似性算法,在**专用词典里找出与之最相似名称。
知名的相似算法有不少,如:
经过简单比较,我选择了其中表现最好的 jaro_winkler_distance
运用到文章内容上,可得到相似**名称,感觉效果还可以:
构建一个Pipeline用于提取页面中**名称,对单个页面测试效果如下:
运用到所有页面上:
至此完成了**名称的提取、清洗,得出每篇文章提及的**名称,如图:
判断一篇文章的情绪,最简单的做法是通过提取所有情绪词来统计下词频及其权重可得到一个粗糙的结果,但这样的结果对“影评”类文章不是很准确。
根据观察,一篇**评论文章中,往往会有大段的**情节描述,然后夹杂一两句评论。而有些**本身剧情就是比较负面、阴暗的(如灾难片类的),但影片本身质量很高(如《釜山行》,豆瓣评分82),如果文章内容包含大量的剧情描述,那么得到关键词会偏向于负面情绪,并不能用于表达出作者对**的喜好情绪。
因此我使用了这样的提取策略:
评论句子提取的结果示例如下:
这样的策略对有些内容不是很适用,例如这样的标题:《同样是豆瓣92分,它或许比《摔跤吧!爸爸》更深》,这是典型的“借势营销”型文案,文章内容中推介的是另外一部韩国**《熔炉》,而时下《摔跤吧!爸爸》正热,标题中带上这个会更吸引用户点击。
另外一个思路是对文章进行摘要提取,然后对摘要进行情绪识别。而对于文章的主题提取,可以使用在ML算法中的用于解决 主题模型 问题的算法(如LDA),但不确定是否适合影评这种混合了大量剧情描述的文章内容。
得到相关评论文本后,便可对文本进行分词及情绪识别,这里有两种做法,一是使用带有情绪情感度的专业词典,配合专有算法;另外一种是使用机器学习算法。
一开始我使用了大连理工大学的《大连理工情感词汇本体库》,是目前最权威的中文情绪词典,共含有情感词共计27466个,包含了词语的词性种类、情感类别、情感强度及极性等信息,例如:
中文情感词汇本体的情感分类体系是在国外比较有影响的Ekman的6大类情感分类体系的基础上构建的。在Ekman的基础上,词汇本体加入情感类别“好”对褒义情感进行了更细致的划分。最终词汇本体中的情感共分为7大类21小类,如图:
把情感词典加入分词词典,对候选每个句子进行分词,得出情感词组,并累加每个情感词的强度值作为句子的情感值。
但经过测试后,发现预测效果并不理想,究其原因发现是情感词典中命中的词语太少,在句子中得不到相关词语,也就无法判断情感极性和强度。
使用情感词典的测试结果:
而专业词典的扩展需要专业领域知识,扩展起来很困难,我目前没找到更新的专业词典,国内这块的资料相当匮乏,而国外有个知名的SentiWordNet库,中文NLP研究的难度系数可想而知。
鉴于情感词典的资源限制,决定尝试使用机器学习来对文本做正、负面情绪预测。
1) 构建分词词典:
分词需要构建专用领域的词典,这样得到的分词结果才会更精确。
因为只需要有正负情感类别、不需要有情感强度及极性等信息,我使用了网络上公开的一些情感词典,:
合并、清洗和去重后,最终构建出了 14000+ 个词的积极情绪词典, 18000+ 个词的消极情绪词典。
积极词典:
消极词典:
2) 准备训练语料
从网上搜集到几个带有积极、消极的标注的评论语料数据集,分别包含了书籍、DVD、音乐、购物领域的各有4000条评论,如下图:
可惜没找到中文影评相关的语料,但找到 国外英文的影评语料 ,对,英文资料很丰富。。。
3) 训练模型
由于是文本型特征,分类算法上选择了 朴素贝叶斯 ,把数据分为2份,一半训练,另一半做测试。
使用 jieba 分词工具,对文本进行分词得到候选词组,把得到的词组作为特征输入来训练情绪预测模型。
训练后的模型测试结果如下:
训练后的模型在书籍、音乐、影碟及购物评论的语料上都有不错的效果。
在提取出的影评短句上测试:
又是“无聊”、“又俗又傻”而一个“但”字就反转了情绪,真是难为分类器了:
经过反复对比实验,发现语料的质量决定了模型的精度,而语料的扩展对比扩展专业词典却容易多了。例如几年前都没有“ 因吹斯汀 ”这些网络流行词,更不知道它代表是正面情绪,以后只要不断更新相关领域的语料库来重新训练则可得到更精确的模型。
俗话说“是骡子是马拉出来遛遛”。
得到一个预测情绪的模型后,便可对影评文章进行预测,但预测的结果是否准确?准确率又有多高?这又是个问题。
每当事情陷入停滞,我就会想起日本漫画大师安达充说过“当故事情节发展不下去的时候,加入一个新角色,是最简单的做法”。
这时需要祭出一个“旁证”了。这所谓的“旁证”,也就是目前大家比较认可的**评分网站——豆瓣网。
大家都知道豆瓣网上的**用户通过打星(5力荐,4推荐,3还行,2较差,1很差),转换得出的10分制的评分,我们可简单把1 49分视作负面评价、5 10分视作正面评价,没有分数的视作中性评价。再把豆瓣的评价结果视作大部分人认同的结果,当然这样肯定是有偏差的。
大胆假设,小心求证,先试试看吧。
根据**名词典再次去抓取豆瓣网上的**信息,这次包含了**分数::
使用获取到的**专题『**院』文章内容测试,结果如下:
1048篇中,豆瓣评分结果与模型预测符合的有974篇,准确率是929%,WOW!真的这么准吗?
看下详细结果,豆瓣评分是正面的有1022条,预测对了973篇,例如:
而豆瓣评分是负面的有28条记录,而模型只预测出1篇是负面的:
真的是模型预测错了吗?
从负面例子中抽样看看模型分解的结果:
评论《麻烦家族》(豆瓣评分48)的:
从自动摘要出来的句子来看,实际上文章作者表现出正面情绪,模型预测为正面,预测正确
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)