当代科技进步和社会发展,尤其是以计算机科学技术、网络技术和通讯技术为核心的信息科技的发展,把语言学推到了现代科学技术的核心和前沿,很多学科领域也对语言学不断提出新的期待。日趋兴盛的语言科学技术,迅速成为当代最具活力和发展潜力的领域之一,它不仅是推动语言研究革命性发展的巨大动力,而且也成为高新科技发展和信息化建设的最重要基础之一,还是新学科、新技术、新产业、新职业的母机。
然而,怎样界定“语言科学技术”?目前国内外还研究不多,像李葆嘉教授带领的团队这样系统研究并付诸实践者更是少有。很有必要加以探讨。
一、关于语言科学技术的简单回顾
语言科学技术有一个不断发展演变的过程。回顾语言科学技术发展的历史,对于我们全面认识语言科学技术的含义具有重要意义。
语言研究发端很早,但严格意义上的语言科学的产生,一般认为是在十九世纪初。
众所周知,西方近代科学的发展,形成了科学主义思潮。科学主义思想广泛渗透到众多领域,也深刻地影响了语言学的发展,加之哲学社会科学一些思潮的作用,促使语言研究走上了科学之路。其标志就是历史比较语言学的诞生。
18世纪末期,梵语引起了欧洲人的关注,学者发现梵语和拉丁语、希腊语等欧洲语言在词汇和语法结构方面有着惊人的相似,从而激发了研究这些语言之间关系的兴趣,开始关注语言系统及其历史。具有突破性的标志是,英国学者威廉·琼斯1786年在印度加尔各答举行的亚洲学会年会上发表了历史性的演讲,他根据梵语、希腊语、拉丁语等在动词词根和语法形式方面的显著相似性,确认了它们之间的亲缘关系,从而开创了语言研究的新时代。英国语言学史学者罗宾斯说:“如果可以武断地用某一年标志当代语言科学的起点的话,这一年就是离19世纪仅有十多年的时间的1786年。”(1)
到了19世纪初期,历史比较语言学成熟起来。1808年, 德国学者施勒格尔(F.Schlegel)发表了《论印度人的语言和智慧》一文,注重比较不同语言的内部结构,指出梵语和拉丁语、希腊语、波斯语、日耳曼语等在词根及语法结构的深层具有一致性,并首次使用了“比较语法”这一术语;丹麦学者拉斯克(R.Rask)1814年向丹麦科学院提交了《试论古斯堪的纳维亚语或冰岛语的起源》,首次明确提出了比较语言学的方法和原则,被认为是历史比较语言学的创始人之一;德国语言学家葆朴(F.Bopp)在1816年发表了《论梵语与希腊语、拉丁语、波斯语和日耳曼语动词变位体系的对比》一文,通过对这些不同语言动词屈折形式的相似性分析,发现了这些语言语法系统的一致性,其功绩在于以同源语言材料为基础,建立具有普遍意义的理论,推进了历史比较语言学的发展,所以也有学者把1816年看做历史比较语言学的诞生年;(2)德国语言学家格里姆(J.Grimm)1822出版《德语语法》第二版,对日耳曼语和其他印欧语之间辅音的对应性进行了系统阐述,发现了其中的音变规律,被称为“格里姆定律”……尤其是19世纪中叶以后,历史比较语言学进一步向科学化方向发展,突出的表现是,在达尔文进化论影响下,自然主义语言观进一步强化,科学方法大量运用。
典型的代表是德国语言学家施莱歇尔(A.Schleicher),他集已有研究之大成,致力于重构古印欧语,并创建了语言谱系树。他公开声称:“语言是自然有机体,其产生不以人们的意志为转移;语言根据确定的规律成长起来,不断发展,逐渐衰老,最终走向死亡。我们通常称为‘生命’的一系列现象,也见于语言之中。语言学是关于语言的科学,因此是一门自然科学;一般说来,语言学的方法在总体上与其它各门自然科学的方法是一样的(这里我们当然不考虑语文学这门历史的学科—原注)。(3)”当时很多学者都有类似的看法和做法。正是在这种观念影响下,那个时期的语言研究大量采用自然科学的理论和方法,例如施密特(J.Schmidt)基于地理学的语言变化“波浪理论”,史迈勒(J.A.Schmeller)、本哈迪(k.Bernhardi)等人得益于地理学的方言地理学和语言地图的研制,波特(A.F.Pott)、缪勒(F.Max Müller)等人仿照地质学对语言形成与发展的推断,拉普(K.M.Rapp)、布吕克(E.Brücke)、梅克尔(C.L.Merkel)等人对语音所做的生理学和解剖学的分析,奥地利医生加尔(F.J.Gall)、法国医生布罗卡(P.Broca)、德国医生威尼克(C.Wernicke)创立的脑神经学和神经生理学,威尼克、弗洛伊德(S.Freud)等关于失语症的研究,俄罗斯数学家布里亚科夫斯基、英国数学家摩根等运用数学方法对语言的研究,此外,洪堡特(W.v.Humboldt)的语言发展观和普通语言学思想,等等。
生物学、地质学、地理学、生理学、解剖学、物理学、数学等理论方法和研究模式都曾不同程度地被语言学所运用。这些大大彰显了语言学的科学特征。因此,有不少学者就像施莱歇尔一样把语言学归入自然科学。历史比较语言学跳出了过去孤立地研究一种语言且主要研究书面语言的局限,运用比较的方法去探讨不同语言的亲缘关系及其演变规律,从而促成了语言科学的正式确立。美国语言学家萨丕尔(E.Sapir)指出:“语言学的科学发展可以说是从比较与重建印欧语言开始的。在细致的研究过程中,致力于印欧语研究的语言学家们逐渐发展出一种技术,相对于任何其他研究人类风俗习惯的科学学科而言,这种技术更趋于完善。许多关于比较印欧语言学的简明论述都具有齐整性与规律性,这些特性令人想起自然科学中的公式或所谓定理。”(4)因此,一般都认为,在十九世纪之初,“一种叫做语言学的新语言科学诞生了。和语文学不同,语言学的方法不仅把语言当做学习文学的工具,而且把它当做研究的独立对象。”(5)苏联语言学家契科巴瓦也认为:“只有在应用历史观点的基础上去研究语言的时候,语言的研究才变成了科学的研究。所以语言研究的整个历史可以分为两个意义并不相同,价值绝不相等的时期:第一个是科学前的时期(自古代起到十九世纪),第二个是科学时期(自十九世纪起)。”(6)这是对早期语言科学的一般认识。
进入20世纪,索绪尔《普通语言学教程》的出版,带来了语言学的“哥白尼革命”,催生了结构主义,于是现代语言学诞生了。结构主义把语言看做具有内部结构的符号系统,重视结构分析和事实描写,无论是布拉格功能学派、哥本哈根语符学派,还是美国描写学派都采用严格、系统的分析描写方法研究语言结构及其规律,使语言研究得以深化和精密化,并对其他学科产生了重要影响。五十年代,乔姆斯基的转换生成语法又带来了新的革命,它以高度形式化的规则描写和解释语言,力图构建普遍语法,揭示人的语言能力,尽管困难重重,不尽人意,但开启了语言研究进一步科学化的新途径,并为其他学科提供了新思想和新方法。可以说,“转换生成语言学的诞生,带来了一场意义深远的革命,受益者不仅是语言学自身。过去,语言学界从别的学科领域‘输入’新观点、新方法;现在,语言学的一系列成果可以‘输出’了。首先是计算机科学,它欣然接受了现代语言学的惠赐,依靠‘形式语言学’作为它的基础理论。最先进的信息处理工具—计算机,跟最古老的信息处理工具—语言,紧密地结合起来了。这种结合,使计算机作为‘人的大脑的延伸’功能更扩大,效用更提高;另一方面,使语言获得了新的表现形态,即在口语(有声语言)、书面语(文字记录)之外的第三个形态—人机对话(计算机语言)形态。”(7)
新世纪,语言研究又出现了新气象。最突出的表现有两点:一是理论方法的多元化和研究手段的科技化。具体来说,功能语言学更为人重视,认知语言学方兴未艾,日新月异的计算机技术、语料库技术、网络技术等日益广泛地应用于语言研究,语言学的科学特征进一步强化。二是学科领域又有新拓展。语言学与计算机科学、信息科学、人工智能、认知科学、脑科学、医学等深度结合,不断开拓新天地,原有的交叉学科不断成熟,新兴交叉学科方兴未艾,如:计算语言学、工程语言学、网络语言学、认知语言学、神经语言学、心理语言学、病理语言学、生态语言学、侦查语言学、经济语言学、语言经济学、语言政治学、情报语言学、法律语言学、电视新闻语言学、医学语言学、广告语言学、数理语言学、人类语言学、模糊语言学、社会语言学,等等。
语言技术的概念自20世纪中叶以来才逐渐得到人们的关注,并有了飞跃性发展。其实,宽泛一点说,语言技术自古有之。最原始的语言技术是语言的运用、表现技术,例如论辩术、演讲术、游说术、修辞术、契刻术、雕版印刷术、制字术等都属于语言技术的范畴。而具有现代技术特征的语言技术则是随着近代科学技术的发展而产生的。例如,文艺复兴以来,英国语言学者就开始探索语音分析技术和声学实验技术及其在速记、语言教学等方面的应用,这方面到了19世纪有了较大发展;1780年左右德国人克拉岑施坦首先制造出一台能发出a、e、i、o、u五个元音的装置,稍后德国人堪布伦发明了一架“说话机器”,并撰写了《人类语言的机制,兼述一架说话机器》一书。(8)后来英国人惠茨顿、美国人贝尔也发明了类似的简单装置。“卓越的贝尔家族移居美国以后,语音学方面的研究使电话在美国诞生……A.G.贝尔跟他父亲A.M.贝尔(A.M.Bell,1819-1905)、祖父A.贝尔(A.Bell,1790-1865)一样,也把语音学应用于语言训练和语言矫正等方面。”(9)德国学者有了言语障碍矫治等方面的尝试。而20世纪中叶以来,随着语言学与计算机科学技术的密切结合,语言技术日新月异,深入到了人类生活的方方面面。
由以上简单回顾可以看出,语言学在发展过程中,科学特征不断得以强化,最突出的有三次飞跃性发展,而且都是“世纪性飞跃”:“第一次是在19世纪,正是历史比较语言学大行其道的时候。历史比较语言学家们用严谨的比较方法重构语言的历史面貌,并且在达尔文之前就具有了进化的思想,这给当时各个科学的领头人物都留下了深刻的印象。生物学家达尔文、地质学家赖尔、社会学家斯潘塞以及马克思和恩格斯都以非常赞赏的口气谈论历史语言学的成就,达尔文和赖尔在他们的著作中都引证历史比较语言学家的工作,认为他们的工作提供了进化过程的一个例证。许多社会科学家们也都试图从历史比较语言学的工作中获得启示,以便把自己的学科也引上科学的道路”;第二次是20世纪,“以索绪尔为代表的结构主义和以乔姆斯基为领头人的生成语法都具备了方法论上的高度严谨性和经验材料上严格的可验证性,这不仅使从事语言学研究的人自信心大增,在所有的语言学教科书上都堂堂正正地标上:‘语言学就是研究语言的科学’,其他学科的人也都被新语言学理论的精致结构所倾倒,一时间‘语言学是人文学科的领头学科’的说法四处流播。出于对语言学的科学性的信服,人文学科的许多领头人物,如精神分析学的拉康、人类学的列维·斯特劳斯、哲学的福柯等都在语言学里寻找可供学习的典范……这一切都让人相信语言学已经具有了真正科学的基本特征。”(10)第三次是进入21世纪,计算语言学的飞速发展和语言科学与众多学科的广泛交融,使语言科学的科学性得到了前所未有的彰显。
总而言之,语言科学技术有一个逐步发展的过程,人们对其认识也有一个逐步深化的过程,其内涵和外延也有一个不断丰富和拓展的过程。这就决定了对语言科学技术的界定,应该与时俱进。
二、关于语言科学技术含义的一般看法
由于语言科学技术处于不断发展的过程之中,加之人们的观念、视角等不同,因而对其认识也是见仁见智。
在西方,语言科学大多是指对语言的科学研究,大体相当于“语言学”,为的是强调语言学的科学性质。以下是较有代表性的说法:
托马斯•乔治•塔克尔(1908)认为:“语言科学应该研究语言的所有资料和现象,换句话来说,应该研究话语(speech)的所有事实。通过精细的观察和小心的求证,研究可确定的各种语言的结构、它们的历史与转换、它们之间的相互关系、差异以及这些差异的形成原因和规律。”(11)
哈特曼和斯托克《语言与语言学词典》说: “语言科学(linguistic sciences)这一术语概括了上述研究(指语言学各分支及流派-引者注)以及语音学(Phonetics)和语义学(Semantics)。”(12)并明确地把语言科学(linguistic science)看做“语言学”的可替换术语。
戴维•克里斯特尔《现代语言学词典》说:“近年来,复数的语言科学(linguistic sciences)一语已被不少人用作语言学和语音学的统称,因为语音学被认为严格地讲属于前语言学研究。同样也有不少人认为语言学和语音学的区别并不像名称所示那么大,他们很乐意用单数的语言科学(linguistic science)作为统称。‘语言学’仍是最通行的名称。”(13)
罗宾斯有较细致的解释:“我们说语言学在较严格的意义上是一门科学,意思是说语言学研究的是一种特殊的材料,即口语和书面语;语言学研究是通过可以公开传达和描述的方法,通过可以陈述的原则和成体系的理论来进行的。在这个过程中,语言学的目的是分析材料,并尽可能联系规律和规则,对研究范围内变化万千的语言现象(言谈或书面语中的话语)做出概括性的一般陈述。语言学方法的运用和理论的阐述遵循科学的三个标准:(1)穷尽性,对所有相关材料做详尽的研究。(2)一致性,整个论述的各个不同部分不相互矛盾,穷尽性原则和一致性原则也不相互矛盾。(3)简洁性,在研究的各方面条件相等的情况下,使用更为简洁的陈述或术语较少的分析,而非冗长的陈述或术语较多的分析。有时候这被称为‘提纲挈领’(capturing of generalizations)。”(14)可见,罗宾斯所谓语言科学也是说的对语言本体进行的科学研究。
在我国,使用“语言科学”这一术语的不多,《中国大百科全书》、《辞海》等重要工具书都未收录(也未收录“语言技术”)。吕叔湘1980年在中国语言学会成立大会开幕式上发表了题为《把我国语言科学推向前进》的长篇讲话,本次会议的论文集也以《把我国语言科学推向前进》命名,由湖北人民出版社1981年出版。上海辞书出版社编《语言学百科词典》对“语言科学”的解释是:“对语言研究的一般名称。这一用语(science of language)在国外的出现早于语言学(语言学一词源自德语Sprachwissenschaft,于十九世纪上半叶开始使用),二者的含义基本相同。本世纪五十年代,美国描写语言学派中有些人把语音学列为前语言学,因而有人把包括语音学和语义学在内的语言学称作语言科学;现在国外也有人以science of language指宏观语言学。”可见,我国学者大体上也是把“语言科学”这一术语当做“语言学”的同义词在使用。
由上述可知,国内外学者对于“语言科学”这一概念的一般界定,主要还是基于对语言科学过去状况的认识,未能关注语言科学的新发展,不能完全涵盖当代语言科学发展的范围。
目前我们见到的对“语言科学”界定最为全面的是德国学者哈杜默德·布斯曼的《语言学词典》,摘录如下:
Sprachwissenschaft 语言科学[也作→Linguistik]。一门学科,其目的在于从理论和实践各个重要的方面对语言和言语及其与其他相关科学的关系进行描写。(据英语和法语的习惯,“语言学”经常被理解为上述广义的语言科学的同义词,但在狭义上它被理解为“内部”或“独立”的语言科学。参看语言学(2))。如果说语言科学的研究对象是人类语言这一符号系统,那么,它就是普通符号学→Semiotik的一个专门分支。其研究对象和由此而采用的研究方法决定了语言科学是介于自然科学和社会科学之间的科学。根据研究兴趣的不同,语言科学一方面分为外部的和内部的语言科学,即将包含广泛、涉及所有外部关系的语言科学于(当为“与”—引者注)仅仅研究语言内部结构的语言科学区分开来;另一方面,又有普通的和实用的语言科学之分,即将以普遍(一般)规律为研究目标的语言理论(参看普遍性→Universalien、语言类型学→Sprachtypologie)与以某一具体语言的问题为研究对象的语言科学区分开来。研究人类语言诸多不同的着眼点构成了语言科学的分支学科系统。(1)以语言的符号特点、各个语言层面的结构和系统性为出发点,形成了语言学的音系学→Phonologie、形态学→Morphologie、构词法→Wortbildung、句法→Syntax、语义学→Semantik、语用学→Pragmatik和篇章语言学→Textlinguistik等分科;(2)各分科既可以用共时观(针对语言状态)也可以用历史观(考察在历史进程中语言的发展变化)予以研究(参看共时语言学与历时语言学→Synchronievs. Diachronie、语言变迁→Sprachwandel);(3)用语言心理学或心理语言学→Psicholinguistik或神经语言学→Neurolinguistik研究言语发生和语言感知的个体条件(参看语言习得→Spracherwerb、语言障碍→Sprachstörung);(4)语言社会学、社会语言学→Soziolinguistik和人类文化语言学→Ethnolinguistik研究语言与其社会条件的关系;(5)第(4)分科与语言的地区分布及影响存在部分重叠(参看方言→Dialekt、方言学→Dialektologie);(6)应用语言学→AngewandteSprachwissenschaft 涉及语言教学的要求问题(参看外语教学法→Fremdspachendidaktik)、翻译技术问题、机器翻译→MaschilelleÜbersetzung问题以及言学数据处理→Linguistische Datenverarbeitung和语言规划问题(参看语言接触→Sprachkontakti)。关于语言科学和语文学的界定请参看Anttila[1973]和Fromm[1981]。
哈杜默德·布斯曼的这个界定较全面地概括和反映了语言科学的发展状况。
关于语言技术,前面已经说过,发端很早,但真正意义上的语言技术是随着近代科学的产生而发展起来的,但过去成就不大,并未引起人们的注意,也很少有人使用这一术语,更少有人界定和阐释。
1948 年,奥地利维也纳电信技术学院教授、奥地利专业标准委员会主席佩提士( Pertitsch) 指出:“全部的信息技术构成了一种统一,它与人类语言之间存在着深刻的相互影响关系。”“信息技术应该被语言技术充实起来。”(17)与此同时,奥地利维也纳术语学派的创始人维斯特对“语言技术”与“语言科学”进行了区别,他认为,语言科学研究内部语言的法则,研究语言符号的自然生成和接受,但是不会对语言的塑造和形成施加影响,它与语言技术的关系大约就像物理学与工程技术的关系一样。维斯特认为“语言”这个词有两重意义:即语言系统(语言创造)和语言运用。语言技术要完成的任务主要体现在语言运用方面。他把语言技术分为“词汇语言的语言技术”和“词汇语言之外的语言技术”。他所谓“词汇语言的语言技术”,主要涉及的是语言运用技术和翻译技术,重点是标准词典的编纂;所谓“词汇语言之外的语言技术”,指缩略词、国际十进分类法 ( die internationale Dezimalklassfikation,简称 DK)等符号系统和各种用作符号的图形。此外,他还谈到了“创造语言的技术”,亦即“语言规划”,从本质意义上说就是语言标准化。(18)可见,那时的“语言技术”主要指语言的运用、加工、翻译、词典编纂、规范化和标准化等技术,其主要方面属于传统意义上的“语言工程”。
传统的语言技术还包括语言研究技术。本文前面提到的萨丕尔认为19世纪的历史比较语言学家们在细致的研究过程中,“逐渐发展出一种技术”,这种技术相对于任何其他人文科学学科而言,更趋于完善;“汤姆逊把语言学明确地划分为前科学的语言学和科学的语言学,他倾向于将这门科学发展中的一切进步,完全归功于语言描写技术的改进。”(19)这都是指语言研究技术。
计算机科学技术的发展,使语言技术获得了空前的发展机遇和崭新的发展空间,以自然语言处理为旨归的新语言技术得到了人们的高度重视,并迅速得以广泛应用。也正是由于这一背景,中外不少学者把“语言技术”看做是“自然语言处理”、“语言处理技术”、“语言工程”(20)的同义词。例如中国科学技术信息研究所的定义是:“语言技术(Language technology),即自然语言处理技术(Natural language processing, NLP),又称人类语言技术(Human language technology),包括书面语言文本处理(Text processing)和语音及口语处理(Speech processing)两大技术范围。语言技术是当前最重要的智能信息处理技术,联结着各类信息媒体技术(多媒体技术)和知识处理技术,为未来基于数字网络信息的知识服务奠定着重要的技术基础。语言技术的基础理论研究部分称为计算语言学(Computational linguistics)。也可以将计算语言学分为两部分,即理论计算语言学(Theoretical Computational linguistics)和应用计算语言学(Applied computational linguistics),而应用计算语言学基本上等同于语言技术或自然语言处理技术。”(21)宗成庆等认为:“自然语言理解、自然语言处理和计算语言学三个术语在内涵和外延上各有所侧重,但主体内容相互重叠,为了表述简单,在不引起混淆的情况下……通称为人类语言技术(human language technology)。中文信息处理(Chinese language information processing)则是专指以中文为主要研究和处理对象的人类语言技术。”(22)有学者甚至误以为“语言技术”这一术语也是因有了自然语言计算机处理技术而“新近才出现的”。(23)这是现在较流行的看法。我们认为,把自然语言处理技术看做是语言技术的一种是正确的,但完全等同则是不合适的。
李葆嘉于本世纪初提出了“语言科技思维”,认为“随着信息时代的到来,语言研究的技术化趋势日益明显,当代语言学已经显示出‘语言科学’与‘语言技术’的二分互补格局,‘语言科学与语言技术’可以合称为‘语言科技’。” “与传统语言学不同,无论是从手段还是就目标,目标对准自然语言处理的当代语言学其性质都应界定为‘语言科技’。‘语言科技’这一新概念,其内涵是以语言学研究为枢纽,沟通计算机应用、数学、认知科学和现代教育技术等相关学科以实现语言信息处理的技术化;其外延表现为语言信息科技、语言教学科技和语言研究科技。”(24)可以看出,李葆嘉所说的“语言科技”主要是指语言信息处理科技。这无疑对语言科学技术的认识有了新的拓展,令人欣喜。但就当今语言科学技术发展的实际而言,似亦有未能概全之憾。因为语言信息处理科技尽管是当代语言科技最为重要的部分之一,但毕竟不是全部。
三、我们的初步认识
如前所述,语言科学技术是一门历史悠久的学科,它随着时代的发展在不断演进。在不同的历史阶段中,它的内涵和范围是不尽相同的。要对其进行准确界定,就必须充分考察其现实阶段性。
19世纪的语言科学,最核心的学科特征当是自然语言观和历史比较法;20世纪的语言科学,最突出的学科特征无疑是以结构主义和转换生成语法为代表的高度形式化的理论追求;而当下语言科学最鲜明的特征则是更高层次上的科学化和技术化,并从过去的仅着眼本体,拓展至本体和应用兼顾;从服务人际,拓展至服务人-机。乍看起来,当今的语言科学在某种程度上似乎是对19世纪语言科学的回归。其实不然。那时的语言科学主要体现为一种较为朴素的自然语言观和对科学理论及方法的相对简单的借鉴乃至模仿;而当今的语言科学则是真正地向科学化深入发展,向技术化广泛推进,与其他学科深度交融,这与19世纪的语言科学有着质的不同。这是我们理解当今语言科学技术内涵与范围时,必须正视的客观现实。
就语言科学发展的实际来说,我们可以把语言科学简单定义为:
语言科学是关于语言及其应用的科学。
展开来说,语言科学就是指对人类语言及其应用进行的科学研究。既包括对语言系统的结构及其规律的科学研究,也包括对语言起源、语言生成、语言机制、语言心理、语言认知、语言习得、语用等语言自然属性和社会属性方面的研究,还包括语言应用及与语言密切相关的边缘性交叉性研究。其要义有五:其一,不仅研究本体,也研究应用;其二,既注重人文性,也注重科学性;其三,既重视理论性,也重视实践性;其四,既追问历史,也关注现实。其五,既服务于人,也服务于机器。简言之,当代语言科学在继承传统,重视语言的人文性的同时,强调语言研究的科学观念、语言学理论方法的科学性和语言应用的科技功能,并积极解决现实问题。
语言技术是语言科学的衍生物。自然,语言科学技术就是语言科学和语言技术的合称。二者的关系,乃如生物学之于生物技术。
语言技术由于得力于计算机科学与技术、网络技术、通讯技术等信息科学技术的发展而飞速发展,已经深入到人类生活的方方面面,可以毫不夸张地说,几乎每个人都在运用和享受语言技术的成果。但遗憾的是,至今还没有见到对语言技术的系统论述和全面界定。
综合各方面因素,我们对语言技术做出如下界定:
语言技术是指以语言为对象或以语言为工具而形成的具有操作性的方法、手段与技能。
根据语言技术发展的实际,我们把语言技术大体上分为五个类型:
1.语言表现技术:就是使语言呈现出来的技术。如契刻、书写、雕版、铸字、打字及输入法、文字照排、速记、录音、语言文字复制、语言文字存储等技术。当然也可包括人的口头表达技术和书面表达技术,如论辩术、演讲术、游说术、修辞术等等。
2.语言训练技术:就是进行语言能力培训的技术。如发音训练技术、写作训练技术、口头表达训练技术、语言教学技术、语言评测技术。
3.语言处理技术:就是对自然语言进行加工处理的技术,当今最重要的是语言信息的计算机处理技术。如语言文字编码技术、语言文字传输技术、字库词库技术、语言翻译技术、文献摘要技术、机器的语言生成识别与理解技术、语料库技术、语音合成技术、文本加工技术、语言文字的标准化技术等。
4.语言应用技术:就是把语言手段和语言学理论方法及成果应用到其他领域的技术。换言之,就是语言功能的技术化和语言学理论方法及成果的跨领域应用。例如信息过滤技术、语言情报(信息)分析技术、语言侦查技术、信息检索与提取技术(包括多媒体、跨语言检索与提取)、语言康复技术、心理咨询语言技术、谈判语言技术、声控技术、人工智能技术、通讯语言技术等。
5.语言研究技术:就是研究语言所使用的技术手段。例如:语音的声学分析、语言统计、语言描写分析、语言调查、语言建模等。
注释:
(1)R.H.罗宾斯《简明语言学史》,许德宝等译,中国社会科学出版社2004,第164-165页。
(2)参见康德拉绍夫《语言学説史》,杨余森译,武汉大学出版社1985,第45页。
(3)奥古斯特•施莱歇尔《达尔文理论与语言学》,姚小平译,《方言》2008年第4期。
(4)萨丕尔《语言学作为一门科学的地位》,见高一虹等译《萨丕尔论语言、文化与人格》,商务印书馆2011第96页。
(5)布斯拉耶夫《俄语历史语法试编•前言》(1858),转引自拉•绍尔《汤姆逊俄译本附录》,世界图书出版公司2009,第145页。
(6)契科巴瓦等《语言学中的历史主义问题》,高名凯译,五十年出版社1954,第1页。
(7)陈明远《语言学和现代科学》,四川人民出版社1983,第11页。
(8)见姚小平《17-19世纪的德国语言学与中国语言学》,外语教学与研究出版社2001,第75、74页。
(9)R.H.罗宾斯《简明语言学史》,许德宝等译,中国社会科学出版社2004,第218页。
(10)褚孝泉《语言科学探源》,上海外语教育出版社2006,第4页。
(11)托马斯•乔治•塔克尔《自然语言史导论》,转引自裴文《剑桥语言学笔记》,世界图书出版公司2008,第125页。
(12)哈特曼和斯托克《语言与语言学词典》,黄长著等译,上海辞书出版1981,201页
(13)戴维•克里斯特尔《现代语言学词典》,沈家煊译,商务印书馆2000,第209页。
(14)罗宾斯《普通语言学导论》,申小龙等译,复旦大学出版社2008年,第7页。
(15)《语言学百科词典》,上海辞书出版社1993,第459页。
(16)哈杜默德•布斯曼的《语言学词典》,陈慧瑛等译,商务印书馆2003,第510页。
(17)Picht H.Schmitz K.D.Ausgewählte Schriften aus dem Gesamtwerk von Eugen Wüster. Terminologie und Wissensordnung[M].Wien: TermNet Verlag,2001.
(18)参见邱碧华《浅谈欧根·维斯特1948年对语言技术与信息技术的论述》,《中国科技术语》,2012年第4期。
(19)拉•绍尔《汤姆逊俄译本编者序》,见世界图书出版公司2009年中译本第19页。
(20)需要注意到是,“语言工程”有两个不同的意义:一是指语言规划,一是指自然语言的计算机处理。这里是后者。
(21)中国科学技术信息研究所/国家工程技术数字图书馆网页《语言技术与知识技术学科介绍》,。
(22)宗成庆 高庆狮《中国语言技术进展》,《中国计算机学会通讯》,2008年第8期。
(23)王惠临等《语言技术和知识技术—知识服务的重要技术基础》,《图书情报工作》,2006年第9期。
(24)李葆嘉《论语言科学与语言技术的新思维》,《南京师范大学文学院学报》2002年第1期。
参考文献
1.陈明远《语言学和现代科学》,四川人民出版社1983。
2.褚孝泉《语言科学探源》,上海外语教育出版社2006。
3.康德拉绍夫《语言学説史》,杨余森译,武汉大学出版社1985。
4.李葆嘉《论语言科学与语言技术的新思维》,《南京师范大学文学院学报》2002年第1期。
5.罗宾斯《简明语言学史》,许德宝等译,中国社会科学出版社2004。
6.罗宾斯《普通语言学导论》,申小龙等译,复旦大学出版社2008。
7.施莱歇尔《达尔文理论与语言学》,姚小平译,《方言》2008年第4期。
8.汤姆逊《十九世纪以前的语言学史》,黄振华译,世界图书出版公司2009
9.姚小平《17-19世纪的德国语言学与中国语言学》,外语教学与研究出版社2001。
本文来源于李葆嘉主编《互动与共鸣:语言科技高层论坛文集》,世界图书出版公司,感谢赵世举教授的支持!!