收藏 分享(赏)

儿童语言的设计.pdf

上传人:爱文献爱资料 文档编号:21752883 上传时间:2024-04-21 格式:PDF 页数:5 大小:2.68MB
下载 相关 举报
儿童语言的设计.pdf_第1页
第1页 / 共5页
儿童语言的设计.pdf_第2页
第2页 / 共5页
儿童语言的设计.pdf_第3页
第3页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、海外专家谈儿童语言习得卡米尔乌德迪恩等语言跨界谈语输入中没有任何疑问词前置的证据,儿童依然会产出疑问词前置的特殊疑问句。此外,他们在产出疑问词前置的问句时,也会产出省略了疑问词的问句,或者在疑问词基础生成的位置填充复指性成分。托克皮辛语儿童产出的这些句子结构在他们的语言输人中是不可能出现的,尽管这些结构可以出现在世界上的其他语言中。那么一个值得思考的问题是:如果托克皮辛语儿童不是从语言输人中习得这些结构的,这些结构又从何而来?正如前文所讨论的,我本人遵循的是语言习得天赋观。在该框架内给出的一种解释是:人类语言所允准的疑问句类型是由普遍语法先天赋予儿童的。普遍语法不是某种特定的语法,而是一种先天

2、的语言机制,它决定了哪些语言知识是儿童先天所具备的。儿童无需特意去学习这些知识,因为这些知识是先验的、与生俱来的。此外,这些知识也决定了儿童如何习得语言,语言知识的学习需要经过普遍语法的过滤,它决定了儿童如何去选择语言中的选项。回到托克皮辛语。对于如何构造特殊疑问句,普遍语法给托克皮辛语儿童提供了两种选项:疑问词移位和疑问词留在原位。尽管他们的语言输入中没有任何支持疑问词移位的证据,但在普遍语法的指导下,他们知道疑问词移位是一种可能的操作,所以当他们需要产出疑问句时,就会使用这种操作。同样,和上文提到的泰语儿童的情况类似,托克皮辛语儿童要最终习得母语语法,就必须限制某些母语中不被允许的选项。具

3、体而言,他们要习得母语中的特殊疑问句,就必须摒弃疑问词移位这种选项。我们的研究发现,他们在4 6 岁之间还没有完全摒弃普遍语法所提供的这种选项。通过以上两个儿童语言习得的实例,我们可以发现,儿童具备的语言知识远远超过他们周边环境中的语言输人所能提供的知识。儿童在习得母语过程中所构建的关于语言结构的假设受到先验的、与生俱来的知识的引导,这些知识可以帮助他们厘清纷繁复杂的语言输入,克服语言习得过程中可能出现的困境。这也就解释了儿童为何在语言习得上表现出了高度的一致性,不同语言背景的儿童都会经历相似的语言发展阶段,且无需纠正或指导,6 岁之前就已基本习得自已的母语。同时,这也可以解释儿童为何会如此有

4、规律地偏离他们周边环境中的语言输人。儿童习得语言并不是一种随意、没有条理的过程,他们对语言规则的假设以及相应所犯的错误也并不是随机、不可预测的。恰恰相反,儿童受规则的约束和引导,这些规则可能会出现在他们周边的语言环境中,也可能不会。支持这一点的证据有很多,我刚才已经谈到了泰语和托克皮辛语儿童语言习得的两个例子。尽管在我看来,这些证据足以支持语言习得天赋观,但依然有很多同行对此持怀疑态度。所以,我的研究目标之一就是发掘出更多来自儿童语言习得的实例,从而更好地揭示普遍语法的印记。(清华大学李婧,浙江大学周鹏译)儿童语言的设计【美 杨鹏要习得一门语言,儿童必须具备从有限的语言输人中得出抽象和能产的语

5、言规则的能力。因此,要理解儿童如何习得语言,就要考察语言输人的属性以及在语言输人的基础上形成的规则的属性。在大数据的时代,我们很容易忽略这样一个事实,那就是儿童习得一门语言实际上只需要很少的数据。根据丹尼尔斯温利(DanielSwingley)教授一项研究的估计,儿童每年听到大约1 0 0 万个句作者简介:杨鹏(CharlesYang),男,美国宾夕法尼亚大学教授。7语言战略研究2023年第5 期总第4 7 期子,其中大多数都非常简短,平均只包含5 个单词。然而,相比于输人总量的稀少,儿童语言输入更为显著的一个特点是其所包含的语言结构的稀疏性。从统计上看,词汇的分布非常不均匀。例如,在英语母语

6、儿童接触到的语言输入中,出现频率最高的1 0 0 个单词占所有出现的单词的比例高达6 2%,其余的绝大多数单词都只是零星出现,落在分布的长尾上。如果类推到语法上来,显然语法的空间比词汇更加稀疏,因为罕见词构成的组合就更为罕见。当然,某种表达在语言输人中没有出现并不意味着这种表达就不存在,罕见甚至从未出现过的表达仍然可能是语言的一部分。一个经典的例子就是乔姆斯基的“Colorlessgreen ideas sleepfuriously”(无色的绿色念头愤怒地睡觉)。这个句子语义上毫无意义,统计上基本不可能出现,但它确实完全符合英语语法。即使是最短、最简单的结构也同样面临着稀疏性的问题。例如,在英

7、语中,名词 sun(太阳)几乎总是和定冠词the连用,指的就是天空中那个炙热的等离子星球。但当语境中讨论的是其他行星系统时,英语母语者同样可以理解或使用a sun来表示某颗恒星、some suns来表达一些恒星。因此,我们可以把儿童习得语言理解为他们在习得如何填补稀疏的语言输人留下的空白。许多人对乔姆斯基提出的“语言学理论主要关注在一个完全同质的语言社区中的理想的说者和听者”这样一种观点表示质疑,因为他们注意到不同的语言显然存在着很多不同之处。然而,令人惊的是,对乔姆斯基这一观点最大的证据却来自威廉拉波夫,他是使用定量方法研究语言变异、使用与变化的一位先驱。拉波夫发现,儿童在同一语言社区中习得

8、的语法出奇地一致:“(儿童语言习得的)最终结果是,其语言产出中绝对的和可变的特征都高度统一,他们所表现出的个体差异并没有语言学上的显著意义。”近年来,研究者又开始重新关注儿童学习者的个体差异。作为两个孩子的父亲,我当然知道每个孩子都是不一样的。有的孩子喜欢小动物,有的喜欢运动,有的喜欢安静,并且每个孩子都有各自不同的家庭和成长环境。那么,现在我们面临的一个问题是:如何理解个体层面的变异性和群体层面的一致性,两者之间究竟什么关系?两者之间的张力集中体现在儿童词汇习得上(这也是近年来个体差异研究的焦点),以及儿童基于词汇所构建的规则之中。得益于儿童语言发展的纵向追踪记录,我们可以比较儿童习得的词汇

9、和相关的规则。通过比较,我们发现,从平均水平来看,任意两个儿童所习得的前1 0 0 个单词中,只有不到2 0%是相同的;前5 0 0 个单词的重叠率仅上升到3 0%左右,而前1000个单词(3 岁儿童词汇量的上限)的重叠率仅略高于4 0%。而在相同的发展阶段,儿童的语法却表现出高度的一致性:语序以及语言单元(如词和短语)的组合规则等语法知识早在两岁时就已经牢固建立;并且他们都习得了构词的基本规则,甚至会犯同样的错误,比如sleeped(正确形式为slept)和foots(正确形式为feet)。该发现表明,规则的掌握不可能依赖于特定单词的习得,这与基于使用的语言学习观的主张截然相反,根据该派学者

10、的观点,高度一致的学习结果是很难实现的。语言学家常说“所有的语法都有漏洞”(也可以理解为“任何语法都有例外”)。英语的过去时系统就是一个很好的验证。“加-ed”这一条规则并不适用于那1 5 0 个左右的不规则动词,这些不规则动词是随着语言的历时发展而遗留下来的,其过去时的构成具有任意性。然而,“加-ed”这一规则仍可以有效地扩展到新词上,例如,当google一词在2 0 世纪9 0 年代拥有动词属性之后,googled作为其过去时形式马上就被大家所接受了。过去的研究重视语言的规则部分以及基于有限规则的无限性,但我们也不应忽视不规则的部分,及其给语言学习带来的挑战。正如索绪尔所言,语言中总是包含

11、具有任意性的成分,这种任意性在语言的各个层面都有体现。例如,汉语普通话中有几十个量词:除了通用量词“个”之外,大多数量词都需要通过记忆来学习,8海外专家谈儿童语言习得卡米尔乌德迪恩等语言跨界谈尽管它们或多或少都带有一些语义倾向。汉语母语者对某些名词应该具体搭配哪个量词的意见并不一致,例如,应该说“一台拖拉机”“一辆拖拉机”“一架拖拉机”,还是视情况而定?再比如,在瑞典语这种标记词汇性别的语言中,“老虎”和“椅子”属于同一性别,但与其语义非常相似的“狮子”和“桌子”却属于不同性别。要学习这样的知识,只能通过死记硬背。语言的组合过程有时候也具有任意性。例如,每个人都知道不规则动词stride的过去

12、时形式是strode(如“I strode down the street”),但大家似乎都不能确定其过去分词的形式,感觉当需要表达“I二have英语助动词都可以和否定词进行缩合,如isnt、d o n t、c a n t、w o n t、s h o u l d n t 等,但美式英语使用者并不会将 am和may与否定词进行缩合而产出 amnt或maynt。问题是,amnt和maynt的语义和语音形式是完全自然的,为什么美式英语就不允许出现这样的组合呢?我们可以想一想,英语是所有屈折语中形态最简单的一种,在构词过程更复杂的语言中,这种组合的任意性会成倍地增加。即使是在看似最具规则的句法中,也无

13、法避免一定程度上的任意性。在英语中,某些动词(约200个)之后可以嵌入另一个句子,以此来表达某种感知、心理状态或者说话方式:(1)a.Jo h n s a w t h a t Bi l l a t e t h e p i z z a.(约翰看见比尔吃了比萨。)b.John reasoned thatBill ate thepizza.(约翰推断比尔吃了比萨。)c.John whispered thatBill ate the pizza.(约翰小声说比尔吃了比萨。)对于大多数英语母语者而言,在(2)所示的3 个例句中,只有see引导的句子才可以对其内嵌从句的宾语进行提问:(2)a.What d

14、id John see that Bill ate _?b.*What did John reason that Bill ate _?c.*What did John whisper that Bill ate _?实际上,英语中像see这样的允许长距离移动的动词约有3 0 个。但学习这些知识的过程却是非常简单的:我们只需要听到别人这样使用即可,没有任何底层规律或原因。儿童语言习得所表现出的这些主要特征反映了一个核心主题:语言是系统性和任意性的对立统一。每个儿童的语言经验(所接触到的语言输人)很大程度上是人类语言的一个任意样本。然而,从这种任意性中却可以涌现出系统性的规则。数据的稀疏性要求儿

15、童非常积极地对规则进行泛化,从而生成无限的语言表达一一但他们并不会时时刻刻都这么做。儿童什么时候进行泛化、什么时候不进行泛化,是语言习得研究中最深奥的谜团,当然这也是研究动物学习和机器学习时同样面临的问题。在我研究的早期阶段,根据当时“所有语法选项都是先天可及”的正统理论,我将简单的领域通用的概率学习机制引人语法选择中。但是,语言所表现出的种种稀疏性与任意性表明,这种方法存在着严重的缺陷。同时需要指出的是,并非所有语法选项都是先天可及的。一方面,语言中有很多方面的知识儿童要到很晚才能习得;另一方面,儿童语言发展呈现出清晰的有质变的不同阶段。一个经典例子是英语过去时的习得。在3 岁之前,儿童在使

16、用不规则过去时形式时并不会犯错。之后,过度泛化的错误就突然出现了,他们会使用goed和sleeped这样的错误形式。这些形式在成人提供的语言输入中并不存在,它们肯定是儿童自已创造的,这实际上标志着“加-ed”这一规则的涌现。但这条规则是英语特有的,其他像汉语、泰语这样的分析型语言没有,因此也就不可能是儿童与生俱来的。9down the street”时,have后面跟 stridden、s t r o d e 和strided似乎都不太合适。再比如,大多数语言战略研究2023年第5 期总第4 7 期现在我们已经很清楚,儿童必须自已形成语法,而不是简单地从一些预先存在的语法集合中挑选某个规则。此

17、外,儿童形成的语法必须好到足以覆盖语言输人数据。实际上,也仅需好到这个程度,否则就没法有效地解释高度可变的个体经验在该过程中所起的作用。同时,语法的范围也需要受到限制,语言中有很多特征只需要记忆就可以获得,不需要形成语法规则。要学习这些语言特征往往需要花一些时间,有时候甚至会慢慢出现一种停滞状态。从机器学习和认知科学的标准思维模式来看,儿童的这种表现是不符合预期的,因为它们致力于从简单性、概率、覆盖范围或上述因素的综合考量来给数据提供最佳解释,它们认为学习总会有一个最佳假设。相比之下,要得出关于自然语言语法的最佳假设却没有那么简单直接。以上我们谈到的这些示例表明,不产出诸如amnt、s tr

18、id d e n 以及(2 b c)中的形式才是正确的学习结果。这就表明,就语言学习来说,即使拟合效果最好的语法也未必足够好。三容忍原则是关于儿童如何发现语言规则的一个假说。需要注意的是,该假说只适用于儿童确实可以发现规则的语言领域。这一原则实际上是基于一种非常简单的直觉,即泛化需要足够数量的支持证据:例如,总共有1 0 个例子,除了一个例外,其他9 个例子都支持某个规则,那么对该规则的泛化就应该出现。但如果1 0 个例子中只有2 个支持某个规则,我想一般人是不会对该规则进行泛化的,这种情况下学习者应该只会去记住这两个例子。下面我们来具体看一下这一原则:(3)容忍原则如果不遵循某种模式的特例e

19、的数量不超过阈值%=N/lnN(N 是该集合的基数)的话,那么该模式就会泛化。例如,只有当语言输人中加-ed的规则动词的数量和不加-ed的不规则动词的数量相比具有绝对优势时,“加-ed”的过去时规则才有可能在儿童语言中涌现。这只有在儿童的词汇量达到一定水平时才会发生,因为英语中不规则动词也属于那些出现频率最高的动词,它们在儿童的早期词汇中占据主导地位,会阻碍“加-ed”的过去时规则的形成。因此,儿童会表现出先记忆后泛化的发展轨迹。规则的隐现取决于儿童不断校准其日益扩大的词库中出现的例外情况。容忍原则符合儿童语言的设计特征。表1 提供了N的一些示例值和关联值ON。需要注意的是,随着N的增加,按比

20、例急剧下降。因此,基于较少的词汇量所定义的规则更容易形成。此外,儿童的早期词汇中只包含高频词项,因为这些词项有更多机会在语言的一般规则中得到证实,这也就有效减少了稀疏性问题。在容忍原则的框架下,规则形成的比例标准将个体差异归一化为统一的语法:只要例外的数量落在阈值的同一侧,无论具体的词项是什么,所得规则都是相同的。最后,在容忍原则框架下,规则只要满足充分条件就可以:如果没有达到容忍阈值,学习者就仅仅记住输入的形式而不会形成规则。表1 基于基数N(个数)形成规则所被允许的例外的最大数NN的百分比从音韵、形态和句法的习得到语言变异和变化的研究,目前已有大量证据支持容忍原则。不仅如此,人造语言学习的

21、研究也给该原则提供了相关证据。在人造语言研究的范式中,研究者可以精准1010440.020630.0501224.01002121.02003718.55008016.0100014414.4海外专家谈儿童语言习得卡米尔乌德迪恩等语言跨界谈地操纵规则遵循项目和例外项目的数量。尤其是,有的研究发现,婴儿在内隐学习任务中遵循容忍原则,表明容忍原则不仅作用于语言中的规则形成,而且很有可能是一种一般的学习和泛化原则。四我们来总结一下,在乔姆斯基掀起语言学和认知科学领域革命之后的几十年来,普遍语法和先天论究竟发生了什么变化。大家越来越清晰地认识到,普遍语法比我们之前想象的要简单得多。人类与生俱来的更有可

22、能是一种获得语法的能力,而不是具体的语法规则本身。这是一个非常重要的区别。正如理解线性函数很可能是人类独有的能力,但这并不意味着一个两岁的幼儿已经拥有了斜率和截距这样的概念。同样,普遍语法应该只包括人类真正独有的能力一一合并,即形成可组合且具有层级性的结构的能力。这种能力并不包含名词、动词、形容词等具体的词类,而是一种能够根据儿童接收到的语言数据来创建这些类别和结构的能力。当我们谈学习机制的时候,这种机制往往可以在语言和语言之外的其他领域同时运作,它需要完成儿童语言习得过程中的主要的繁重工作。(清华大学黄瑞迪、张潇文,浙江大学周鹏译)跨语言视角下的儿童语言习得【意】玛丽亚特蕾莎瓜斯蒂本文旨在阐

23、释跨语言视角对理解儿童语言习得进程的重要性。前人研究多关注英语母语儿童,本文希望通过呈现来自不同母语背景的儿童语言数据来论证跨语言视角的重要性。我们希望强调的一点是,跨语言数据给我们理解儿童语言习得进程提供了以往只基于英语研究不能得到的观察视角,甚至推翻了很多基于英语研究所得出的结论。在过去的1 5 年间,儿童语言研究从以英语为中心的视角逐渐转向跨语言视角。这种转向给一些既定假设和结论带来了挑战。我们来看一个被动结构(见句子(1)习得的示例。前人基于英语儿童的习得数据认为,儿童直到5 岁才能习得被动结构。造成儿童习得被动结构困难的原因是,英语被动结构的产生需要把施事论元thedog从其基础生成

24、位置(1)中尖括号所示位置)移位到主语位置(1)中方括号所示位置),从而在两者之间构建一个论元链(1)中箭头所示),而儿童最初不能成功构建该论元链。根据该理论框架,尽管儿童最初不能成功构建论元链,但也可以理解一些被动结构,因为他们会把动词性被动分析成形容词性被动。以(1)为例,儿童会把(1)中过去分词washed简单地处理成一个类似(2)中happy的形容词,不涉及任何移位操作。(1)The dog was washed(by the child).(小狗被小朋友洗过。)(2)The dog was happy.(小狗很高兴。)在英语中,被动结构可以分为动词性被动和形容词性被动,并且有时两者之间存在歧义,因此,英语儿童最初把被动结构分析成形容词性被动这个观点看起来似乎是合理的。但如果我们从跨语言的视角来看,该观点就不那么合理了。例如,在希腊语中,动词性被动和形容词性被动有着各自独特的形式,作者简介:玛丽亚特蕾莎瓜斯蒂(MariaTeresaGuasti),女,意大利米兰比可卡大学教授。11

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 综合论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:文库网官方知乎号:文库网

经营许可证编号: 粤ICP备2021046453号世界地图

文库网官网©版权所有2025营业执照举报