下面小编给大家带来分词: 连词+分词(短语),本文共4篇,希望能帮助到大家!

篇1:连词+分词(短语)
连词+分词(短语)
有时为使分词短语与主句关系更清楚,可在分词前加连词。 连词有: when,while,if though,after, before, as. 但分词的主语和主句的`主语必须为同一个,如:While waiting there, he saw two pretty girls come out of the building.
waiting 和saw 的主语相同。
篇2:语法--分词
9. 分词
9.1 分词作定语
分词前置
we can see the rising sun. 我们可以看到东升的旭日
he is a retired worker. 他是位退休的工人
分词后置 (i分词词组;ii 个别分词如given, left; iii 修饰不定代词 something等)
there was a girl sitting there. 有个女孩坐在那里
this is the question given. 这是所给的问题
there is nothing interesting. 没有有趣的东西
过去分词作定语
与其修饰的词是被动关系,相当于一个被动语态的定语从句。
most of the people invited to the party were famous scientists.
most of the artists invited to the party were from south africa.
典型例题
1) the first textbook ___ for teaching english as a foreign language came out in the 16th century.
a. have written b. to be written c. being written d. written
答案d. 书与写作是被动关系,应用过去分词做定语表被动,相当于定语从句 which is written
2)what's the language ____ in germany?
a. speaking b. spoken c. be spoken d. to speak
答案b. 主语language与谓语动词之间有被动的含义。
spoken是动词speak的过去分词形式,在句中作定语,修饰主语language, spoken 与 language有被动关系。该句可以理解为:
what's the language (which is) spoken in german?
9.2 分词作状语
as i didn't receive any letter from him, i gave him a call.
->not receiving any letter from him, i gave him a call.
由于没有收到他的信,我给他打了电话。
if more attention was given, the trees could have grown better.
->given more attention,the trees could have grown better.
假如多给些照顾,那些树会长得更好。
典型例题
1)_____ some officials, napoleon inspected his army.
a. followed b. followed by c. being followed d. having been followed
答案b. napoleon 与follow 之间有被动的含义。being followed除表达被动之外,还有动作正在进行之意。 followed by(被…跟随)。本题可改为: with some officials following, napoleon inspected his army.
2)there was a terrible noise ___ the sudden burst of light.
a. followed b. following c. to be followed d. being followed
答案b. 由于声音在闪电后,因此为声跟随着光,声音为跟随的发出者,为主动。用现在分词。
3)_______, liquids can be changed into gases.
a. heating b. to be heated c. heated d. heat
答案c. 本题要选一分词作为状语。现在分词表主动,正在进行的;过去分词表被动的,已经完成的。对于液体来说是加热的受动者,是被动的,因而选c。它相当于一个状语从句 when it is heated,…
注意: 选择现在分词还是过去分词,关键看主句的主语。如分词的动作是主句的主语发出,分词就选用现在分词,反之就用过去分词。
(being ) used for a long time, the book looks old.
由于用了很长时间,这本书看上去很旧。
using the book, i find it useful.
在使用的过程中, 我发现这本书很有用。
9.3 连词+分词(短语)
有时为使分词短语与主句关系更清楚,可在分词前加连词。 连词有: when,while,if though,after, before, as. 但分词的主语和主句的主语必须为同一个,如:
while waiting there, he saw two pretty girls come out of the building.
waiting 和saw 的主语相同。
9.4 分词作补语
通常在感官动词和使役动词之后,如:
i found my car missing. 我发现我的车不见了。
i'll have my watch repaired. 我想把我的手表修一下。
9.5 分词作表语
现在分词: 表示主动,正在进行
过去分词: 表示被动,已经完成
she looked tired with cooking. 她由于忙着做饭,看上去有些疲倦。
he remained standing beside the table. 他依然站在桌旁。
9.6 分词作插入语
其结构是固定的,意思上的主语并不是句子的主语。
generally speaking 一般说来
talking of (speaking of) 说道
strictly speaking 严格的说
judging from 从…判断
all things considered 从整体来看
taking all things into consideration 全面看来
judging from his face, he must be ill. 从他的脸色看,他一定是病了。
generally speaking, dogs can run faster than pigs. 总的来说,狗比猪跑得快。 (speaking 并不是dogs 的动作)
9.7 分词的时态
1)与主语动词同时,
hearing the news, he jumped with joy. 听到这一消息,他高兴得手舞足蹈。
arriving there, they found the boy dead. 刚一到那儿,他们就发现那男孩死了。
典型例题
the secretary worked late into the night, ___a long speech for the president.
a. to prepare b. preparing c. prepared d. was preparing
答案b. 此处没有连词,不能选d,否则出现了两个谓语动词worked和was preparing。 只能在b,c中选一个。又因前后两个动作同时发生,且与主语为主动关系,应用现在分词。
2)先于主动词
while walking in the garden,he hurt his leg. 在花园里散步时他伤了腿。
分词作时间状语,如果先与主动词的动作,且强调先后, 要用having done。
having finished his homework, he went out.
=as he had finished his homework, he went out.
做完作业后,他出去了。
典型例题
___ a reply, he decided to write again.
a. not receiving b. receiving not c. not having received d. having not received
答案c. 本题考查分词的时态与分词的否定式。根据题意判断,分词的动作(接信)发生在谓语动词的动作(决心再写信)之前,因此用分词的完成式。分词的否定式的构成为not +分词,故选c。该句可理解为:because he had not received a reply, he decided to write again.
9.8 分词的语态
1)通常,现在分词表示主动,过去分词表示被动,例如:
he is the man giving you the money. (= who gave you…) 他就是给你钱的那个人。
he is the man stopped by the car. ( = who was stopped by…)
他就是那个被车拦住的人。
2)不及物动词的过去分词表示动作已经发生
gone, fallen, retired, grown-up, escaped, faded, returned
例: a well-read person. 一个读过许多书的人
a much-travelled may 一个去过许多地方的人
a burnt-out match 烧完了的火柴
篇3:中文分词
中文分词 (Chinese Word Segmentation) 指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂的多、困难的多。
目录基本信息算法分类技术难点应用收缩展开基本信息背景
存在中文分词技术,是由于中文在基本文法上有其特殊性,具体表现在: 1.与英文为代表的拉丁语系语言相比,英文以空格作为天然的分隔符,而中文由于继承自古代汉语的传统,词语之间没有分隔。 古代汉语中除了连绵词和人名地名等,词通常就是单个汉字,所以当时没有分词书写的必要。而现代汉语中双字或多字词居多,一个字不再等同于一个词。 2.在中文里,“词”和“词组”边界模糊 现代汉语的基本表达单元虽然为“词”,且以双字或者多字词居多,但由于人们认识水平的不同,对词和短语的边界很难去区分。 例如:“对随地吐痰者给予处罚”,“随地吐痰者”本身是一个词还是一个短语,不同的人会有不同的标准,同样的“海上”“酒厂”等等,即使是同一个人也可能做出不同判断,如果汉语真的要分词书写,必然会出现混乱,难度很大。 中文分词的方法其实不局限于中文应用,也被应用到英文处理,如手写识别,单词之间的空格就很清楚,中文分词方法可以帮助判别英文单词的边界。
作用
中文分词是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。 中文分词技术属于自然语言处理技术范畴,对于一句话,人可以通过自己的知识来明白哪些是词,哪些不是词,但如何让计算机也能理解?其处理过程就是分词算法。
影响
中文分词对于搜索引擎来说,最重要的并不是找到所有结果,因为在上百亿的网页中找到所有结果没有太多的意义,没有人能看得完,最重要的是把最相关的结果排在最前面,这也称为相关度排序。中文分词的准确与否,常常直接影响到对搜索结果的相关度排序。从定性分析来说,搜索引擎的分词算法不同,词库的不同都会影响页面的返回结果。
算法分类现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。按照是否与词性标注过程相结合,又可以分为单纯分词方法和分词与标注相结合的一体化方法。
字符匹配
这种方法又叫做机械分词方法,它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。按照扫描方向的不同,串匹配分词方法可以分为正向匹配和逆向匹配;按照不同长度优先匹配的情况,可以分为最大(最长)匹配和最小(最短)匹配;常用的几种机械分词方法如下: 1)正向最大匹配法(由左到右的方向); 2)逆向最大匹配法(由右到左的方向); 3)最少切分(使每一句中切出的词数最小); 4)双向最大匹配法(进行由左到右、由右到左两次扫描) 还可以将上述各种方法相互组合,例如,可以将正向最大匹配方法和逆向最大匹配方法结合起来构成双向匹配法。由于汉语单字成词的特点,正向最小匹配和逆向最小匹配一般很少使用。一般说来,逆向匹配的切分精度略高于正向匹配,遇到的歧义现象也较少。统计结果表明,单纯使用正向最大匹配的错误率为1/169,单纯使用逆向最大匹配的错误率为1/245。但这种精度还远远不能满足实际的需要。实际使用的分词系统,都是把机械分词作为一种初分手段,还需通过利用各种其它的语言信息来进一步提高切分的准确率。 一种方法是改进扫描方式,称为特征扫描或标志切分,优先在待分析字符串中识别和切分出一些带有明显特征的词,以这些词作为断点,可将原字符串分为较小的串再来进机械分词,从而减少匹配的错误率。另一种方法是将分词和词类标注结合起来,利用丰富的词类信息对分词决策提供帮助,并且在标注过程中又反过来对分词结果进行检验、调整,从而极大地提高切分的准确率。 对于机械分词方法,可以建立一个一般的模型,在这方面有专业的学术论文,这里不做详细论述。
理解法
这种分词方法是通过让计算机模拟人对句子的理解,达到识别词的效果。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。它通常包括三个部分:分词子系统、句法语义子系统、总控部分。在总控部分的协调下,分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断,即它模拟了人对句子的理解过程。这种分词方法需要使用大量的语言知识和信息。由于汉语语言知识的笼统、复杂性,难以将各种语言信息组织成机器可直接读取的形式,因此目前基于理解的分词系统还处在试验阶段。
统计法
从形式上看,词是稳定的'字的组合,因此在上下文中,相邻的字同时出现的次数越多,就越有可能构成一个词。因此字与字相邻共现的频率或概率能够较好的反映成词的可信度。可以对语料中相邻共现的各个字的组合的频度进行统计,计算它们的互现信息。定义两个字的互现信息,计算两个汉字X、Y的相邻共现概率。互现信息体现了汉字之间结合关系的紧密程度。当紧密程度高于某一个阈值时,便可认为此字组可能构成了一个词。这种方法只需对语料中的字组频度进行统计,不需要切分词典,因而又叫做无词典分词法或统计取词方法。但这种方法也有一定的局限性,会经常抽出一些共现频度高、但并不是词的常用字组,例如“这一”、“之一”、“有的”、“我的”、“许多的”等,并且对常用词的识别精度差,时空开销大。实际应用的统计分词系统都要使用一部基本的分词词典(常用词词典)进行串匹配分词,同时使用统计方法识别一些新的词,即将串频统计和串匹配结合起来,既发挥匹配分词切分速度快、效率高的特点,又利用了无词典分词结合上下文识别生词、自动消除歧义的优点。 另外一类是基于统计机器学习的方法。首先给出大量已经分词的文本,利用统计机器学习模型学习词语切分的规律(称为训练),从而实现对未知文本的切分。我们知道,汉语中各个字单独作词语的能力是不同的,此外有的字常常作为前缀出现,有的字缺常常作为后缀(“者”“性”),结合两个字相临时是否成词的信息,这样就得到了许多与分词有关的知识。这种方法就是充分利用汉语组词的规律来分词。这种方法的最大缺点是需要有大量预先分好词的语料作支撑,而且训练过程中时空开销极大。 到底哪种分词算法的准确度更高,目前并无定论。对于任何一个成熟的分词系统来说,不可能单独依靠某一种算法来实现,都需要综合不同的算法。例如,海量科技的分词算法就采用“复方分词法”,所谓复方,就是像中西医结合般综合运用机械方法和知识方法。对于成熟的中文分词系统,需要多种算法综合处理问题。
技术难点有了成熟的分词算法,是否就能容易的解决中文分词的问题呢?事实远非如此。中文是一种十分复杂的语言,让计算机理解中文语言更是困难。在中文分词过程中,有两大难题一直没有完全突破。
歧义识别
歧义是指同样的一句话,可能有两种或者更多的切分方法。主要的歧义有两种:交集型歧义和组合型歧义,例如:表面的,因为“表面”和“面的”都是词,那么这个短语就可以分成“表面 的”和“表 面的”。这种称为交集型歧义(交叉歧义)。像这种交集型歧义十分常见,前面举的“和服”的例子,其实就是因为交集型歧义引起的错误。“化妆和服装”可以分成“化妆 和 服装”或者“化妆 和服 装”。由于没有人的知识去理解,计算机很难知道到底哪个方案正确。 交集型歧义相对组合型歧义来说是还算比较容易处理,组合型歧义就必须根据整个句子来判断了。例如,在句子“这个门把手坏了”中,“把手”是个词,但在句子“请把手拿开”中,“把手”就不是一个词;在句子“将军任命了一名中将”中,“中将”是个词,但在句子“产量三年中将增长两倍”中,“中将”就不再是词。这些词计算机又如何去识别? 如果交集型歧义和组合型歧义计算机都能解决的话,在歧义中还有一个难题,是真歧义。真歧义意思是给出一句话,由人去判断也不知道哪个应该是词,哪个应该不是词。例如:“乒乓球拍卖完了”,可以切分成“乒乓 球拍 卖 完 了”、也可切分成“乒乓球 拍卖 完 了”,如果没有上下文其他的句子,恐怕谁也不知道“拍卖”在这里算不算一个词。
新词识别
命名实体(人名、地名)、新词,专业术语称为未登录词。也就是那些在分词词典中没有收录,但又确实能称为词的那些词。最典型的是人名,人可以很容易理解。句子“王军虎去广州了”中,“王军虎”是个词,因为是一个人的名字,但要是让计算机去识别就困难了。如果把“王军虎”做为一个词收录到字典中去,全世界有那么多名字,而且每时每刻都有新增的人名,收录这些人名本身就是一项既不划算又巨大的工程。即使这项工作可以完成,还是会存在问题,例如:在句子“王军虎头虎脑的”中,“王军虎”还能不能算词? 除了人名以外,还有机构名、地名、产品名、商标名、简称、省略语等都是很难处理的问题,而且这些又正好是人们经常使用的词,因此对于搜索引擎来说,分词系统中的新词识别十分重要。新词识别准确率已经成为评价一个分词系统好坏的重要标志之一。
应用在自然语言处理技术中,中文处理技术比西文处理技术要落后很大一段距离,许多西文的处理方法中文不能直接采用,就是因为中文必需有分词这道工序。中文分词是其他中文信息处理的基础,搜索引擎只是中文分词的一个应用。其他的比如机器翻译(MT)、语音合成、自动分类、自动摘要、自动校对等等,都需要用到分词。因为中文需要分词,可能会影响一些研究,但同时也为一些企业带来机会,因为国外的计算机处理技术要想进入中国市场,首先也是要解决中文分词问题。在中文研究方面,相比外国人来说,中国人有十分明显的优势。 分词准确性对搜索引擎来说十分重要,但如果分词速度太慢,即使准确性再高,对于搜索引擎来说也是不可用的,因为搜索引擎需要处理数以亿计的网页,如果分词耗用的时间过长,会严重影响搜索引擎内容更新的速度。因此对于搜索引擎来说,分词的准确性和速度,二者都需要达到很高的要求。研究中文分词的大多是科研院校,清华、北大、哈工大、中科院、北京语言学院、山西大学、东北大学、IBM研究院、微软中国研究院等都有自己的研究队伍,而真正专业研究中文分词的商业公司除了海量科技以外,几乎没有了。科研院校研究的技术,大部分不能很快产品化,而一个专业公司的力量毕竟有限,看来中文分词技术要想更好的服务于更多的产品,还有很长一段路。
篇4:was 加过去分词是什么时态
It was a Monday, so she was at home.
那是个星期一,所以她在家。
I was honest about what I was doing.
我对我所做的一切毫不隐瞒。
He was lying—or was he?
他在说谎,还是没有说谎?
文档为doc格式