首页 > 文章中心 > 正文

质量标准和依据

前言:本站为你精心整理了质量标准和依据范文,希望能为你的创作提供参考价值,我们的客服老师可以帮助你提供个性化的参考范文,欢迎咨询。

质量标准和依据

论文关键词语文词典收词质的标准量的依据

论文摘要文章从词与短语、新词与旧词、语文词与百科词、语言义与言语义四个方面讨论汉语语文词典的收词问题,认为语文词典收词应该把质的标准和量的依据结合起来,既要做到收词标准明确,执行标准严格,标准具有可操作性,又要兼顾词条的总量控制以及量的平衡和量的统计、力避收词增义的主观随意性。

2005年3月至6月,笔者有机会参加了《现代汉语规范词典》(李行健主编,外语教学与研究出版社、语文出版社,2004。以下简称《规范》)的审订修改工作,负责T、W两个字母的全部词条。在审阅过程中产生了一些想法。在查阅《现代汉语词典》(商务印书馆,2005。以下简称《现汉》)的过程中,也有一些感触。下面即以这两部词典为据,讨论语文词典收词的若干问题。

一、词与短语

词典,顾名思义,应当只收词和功能与词相当的固定短语。但由于受语文辞书收词立目传统习惯的影响,目前汉语语文辞书往往字、词典功能不明,词典往往兼具字典的功能。笔者曾主张区分两者功能,让它们各司其职。

无论词典以什么样的单位立目,词无疑是诃典的主体。因此,对词的确定乃是关键。《规范》和《现汉》都不同程度地存在收词标准不严、失之过宽的情况,《规范》尤甚,主要表现为收了不少短语或叫“短语词”。例如,“挨(áī)”字头下,《规范》收录“挨板子、挨呲儿、挨打、挨刀、挨斗、挨黑枪、挨闷棍、挨蒙、挨批、挨日子、挨时间、挨宰、挨整、挨揍”14条,《现汉》收录“挨板子、挨批、挨宰、挨整”4条。《规范》14条注有引申义或比喻义的有“挨板子、挨打、挨刀、挨黑枪、挨闷棍”5条,《现汉》4条注有比喻义的有“挨板子、挨宰”2条。下面是两词典对以上没有转义的词的释义:

挨眦儿<口>受批评;受训斥。(《规范》)

挨斗遭受批判斗争。(《规范》)

挨蒙遭受欺骗。(《规范》)

挨批遭受批评或批判。(《规范》)

挨批受到批评或批判。(《现汉》)

挨日子艰难痛苦地度时日。(《规范》)

按时间无所事事,苦等时间过去。(《规范》)

挨整遭受打击迫害。(《规范》)

挨整受到打击迫害。(《现汉》)挨揍挨打。(《规范》)

“挨(áī)”,两词典都收录“遭受;忍受”、“困难地度过(岁月)”、“拖延”三个义项。《规范》对语素和词都标注词性,《现汉》只有词才标注词性,因此,《现汉》标注词性的单位可以认为是词。根据《现汉》的词性标注和举例,“挨(áī)”的三个义项都可以独立成词,“呲儿”(申斥;斥责)、“斗”(斗争)、“蒙”(欺骗)、“批”(批判;批评)、“日子”、“时间”、“整”(使吃苦头)、“揍”(打)都可以独立成词,两部词典都有解释。也就是说,整体意义等于成分意义的加合,而且每个成分都可以独立成词。因此没有理由作为词收录。如果这样收词的话,“挨鞭子、挨棍子、挨冻、挨饿、挨骂、挨训”都可以收,那么词典就会变得臃肿不堪。

即使注有转义的几条也有商榷的余地。比如“挨打”,《规范》的解释是“遭受殴打;比喻遭受批评或处罚”。《现汉》未收。这个比喻义到底是否凝固成了词义?再如“挨宰”,两部词典都收了“宰”的比喻义“比喻向买东西或接受服务的人索取高价”,都注了动词,那么“挨宰”就可以通过成分义相加得出。因此,“挨宰”是不是词也要打个问号。

还有,《规范》收了“鹅蛋”、“鸭蛋”(认为有转义,如“今天考数学,吃了个鸭蛋”),不收“鸡蛋、鸟蛋、龟蛋”;收了“岸边”,不收“河边、水边、地边、路边”;收了“猜着、猜中”,不收“猜对、猜透”。《现汉》均不收。

这里涉及汉语中词和短语的划界这个老大难问题。关于汉语词的确定,笔者曾有论述,此处不赘。词典应从严掌握收词标准。王同亿所编词典受到批评,收词不严是很重要的一个原因。我们认为,如果一个片段同时符合以下条件,就不宜收作词条:(1)各成分都可以独立成词;(2)组合义等于成分义的加合,没有引申、比喻等整体义;(3)各成分的意义词典都有解释。

二、新词与旧词

毫无疑问,词典应该及时增补反映社会变化的新词和新义。例如,《现汉》收录了“欧元”,《规范》收录了“欧共体、欧盟、欧元”,笔者认为有增补的必要。再如,在“垃圾”条下,《现汉》增补了“比喻失去价值的或有不良作用的事物”的义项,举了“垃圾邮件、清除社会垃圾”的例子。《规范》也增补了类似的比喻义。这种增补就很有必要。但增补的词条却有商榷的余地。《规范》收了“垃圾电站、垃圾股、垃圾邮件、垃圾债券”4条,《现汉》只收“垃圾股、垃圾邮件”2条。《现汉》和《规范》都收了“水电站”,即“利崩水力发电的设施”,与此相类,“垃圾电站”是“利用垃圾发电的设施”,而不是“废弃无用的电站”的意思,照顾到系统性,可收。但“垃圾股、垃圾邮件、垃圾债券”中的“垃圾”用的都是比喻义,“像垃圾一样的东西”的意思,两部词典都有解释,而不是整个词语有比喻义,我们认为没有必要增补。我们用百度搜索引擎搜索浏览了一下网页,就发现有“垃圾短信、垃圾网页、垃圾文件、垃圾食品”等许多说法,为什么这些词语不收?新词和新义随时都会出现,哪些该收,哪些不收,应该有个标准。笔者认为,对拟收新词,一要看是不是符合上面讲的收词标准,二要考虑使用度(通用面+使用频率),应以语料统计数据作支撑。不能看“新”就收,以避免滥收。

跟新词相对的是旧词。旧词是产生时间较长的词。根据在现代语文生活中的使用频率,大致可以分为三类:一是仍在频繁使用的词,如“人、我、看、大、很”等这些基本词,可称为“传承词”。二是只在一些语体或特殊场合里使用的词,又分为文言词和历史词。文言词如“兹、此、故(因此)、其、之”等,形成庄重、典雅的风格;历史词如“朕、太监、妃子”等,在描述历史事件时要用到。三是现代已经不再使用的词,如“印(我)、汝(你)”,可称为“古语词”。

对前两类,现代汉语词典收录一些常用的是必要的。对第三类,我们认为没有必要收录。因为我们编纂的是“现代汉语”词典,应立足于现代汉语这个共时平面。但《规范》《现汉》都不约而同地收了“印”等古语词。究其原因,可能有两个方面:一是编者可能觉得工具书应满足查考的需要,为方便读者,酌收一些古语词。二是由长期以来字典、词典不分的传统造成的。如果不收这些古语词,有些字在词典里就没有了,如“印”便是。词典编纂者内心里还是觉得多收些字为好。笔者认为,这两点考虑都是没有必要的。不同词典的功能不同,要查这些字(或词),找古汉语字典(或词典)便是。一旦收了这些词,就会引发其他问题,比如哪些该收,哪些不收,用何标准。比如收了“印(我)”,同属于上古第一人称代词的“我、吾、余、予、朕、台”都得收录并给予解释,但《现汉》和《规范》对“台”的第一人称代词用法都没有解释。如果都一一交代,则又侵吞了古汉语词典的领地。这在理论上和实践上都是不可取的。另外,在《现汉》中出现“而今安在”这样的例句,就像在现代社会里突然见到一个古人一样别扭。

因此,编纂现代汉语词典,还需要站稳“现代”脚跟,在现代口语和书面语里都不用的词不应该收录。

三、语文词与百科词

语文词典收词自然以一般的语文词语为主。人类知识是个庞杂的系统,语文词语与百科词语(含专科词语)并没有截然的分界线。基于词典的工具性,语文词典适量地收录百科词语是必要的,但应有所控制。如何把握这个“度”,是个需要认真探讨的问题。目前的语文辞书对百科词语并没有明确的收录标准。我们比较了一下《现汉》和《规范》字母A下的条目,《现汉》共列字头、词目526条,《规范》共565条。

两词典均收的百科词语是:

阿昌族、阿斗、阿Q、阿拉伯人、阿拉伯数字、阿片、锕、埃(长度单位)、锿、癌、艾滋病、砹、爱克斯射线、爱神、瑷珲(爱辉)、安(安培的简称)、安瓿、安乐死、安理会、安培、安息日、安慰赛、桉、氨、氨基、氨基酸、氨气、氨水、铵、按揭、胺、暗场、暗射地图、暗物质、暗转、盎司、凹版、凹面镜、凹透镜、奥林匹克运动会、奥运村、奥运会、澳抗。(计43条)

《现汉》收而《规范》不收的百科词语是:

阿尔茨海默病、阿尔法粒子、阿尔法射线、阿伏伽德罗常量、阿是穴、埃博拉出血热、艾叶豹、艾鼬、爱斯基摩人、馒尼、安全玻璃、盎格鲁撒克逊人、澳门币。(计13条)

《规范》收而《现汉》不收的百科词语是:

阿凡提、阿米巴、阿摩尼亚、阿司匹林、阿托品、埃博拉、爱鸟周、安哥拉兔、安全填埋、桉油、鞍鼻、奥林匹克精神、奥赛、奥申委、奥斯卡金像奖、奥委会、奥校、澳币、澳洲。(计19条)

以上所列个别词目是否属于百科词语还可讨论,但不影响大局。《现汉》共收百科词语56条,占总词条(含字头)数的约10.65%,《规范》共收百科词语62条,占总词条(含字头)数的约10.97%,都在十分之一强。两词典A字母下所收百科词语合计75条,相同的约占57%,不同的约占43%。

通过抽样调查,可以得到这样的认识:不同词典对百科词语的收录差别很大,没有明确的标准。表现在:(1)收词差别率较高;(2)同一词语词形却不同,如《现汉》是“埃博拉出血热”,《规范》是“埃博拉”,《现汉》是“澳门币”,《规范》是“澳币”;(3)收词带有一定的随意性,比如《现汉》收了不太常见的“阿尔茨海默病”,却不收常用西药“阿司匹林”,《规范》收了“阿拉伯人”,却不收“爱斯基摩人、盎格鲁撒克逊人”,如此等等。

我们认为,语文词典对百科词语的收录,一要进行总量控制。语文词典毕竟不是百科词典,百科词语在数量上只能占少数。一部中型语文词典,百科词语控制在多大比例比较适宜,目前的研究还不充分。《现汉))1996年修订版“语文类词条占72%,哲学社会科学占11%,科技占17%”。这个比例是否合适,还可以讨论。二要制订收词标准。哪些该收,哪些不该收,应该明确。三要进行语言使用度调查。为了避免收词的主观随意性,应该统计百科词语的使用度,包括通用度和使用频率两个方面,选取那些使用度高的百科词语,不能仅凭个人语感取舍。

四、语言义与言语义

与收词密切相关的是收义。词语既有稳固的意义,可以脱离具体语境而为言语集团所共同理解,也有临时产生的意义,需要借助一定的语境才能获知。前者是语言义,后者是言语义。词典收的是语言义,还没有凝固为语言义的词义暂不收录。例如“腿子”,《现代汉语词典》(1996)的释义是:①(方>腿:~发软。②狗腿子。《现汉》的释义是:<口>狗腿子。《规范》的释义是:①<口>腿部:他的~很细,跑得很快。②狗腿子。三部词典没有一部举出“腿子”单用时当“狗腿子”讲的实例,只有在跟“狗”结合时才有此义,也就是说,“腿子”的“狗腿子”义只是在“狗腿子”这个语境里的言语义,不宜收录,可把“狗腿子”作为整体收录(《现汉》《规范》皆收)。附带说一下,“腿子”是“腿”的方言说法。,所以《现汉》未列此义。未被普通话吸收的方言词,注<方>比注(口>准确,“方言”与“口语”并不等同。《现汉》2005年版对1996年版在这方面的修改不一定都十分妥帖。

再如,《规范》对“替班”、“替补”、“替工”三词的释义分别是:

替班团代替别人上班:他今天请假,我来~。名替班的人:他是~。

替补动替换填补:由你~三号队员。固替换别人填补空缺的人:充当~。

替工动代替别人做工:姐姐有病,妹妹去~。名代替别人做工的人:他是临时去当~的。

《现汉》三词皆收,但只有“替工”注了名词用法。先看实际语言用例(2007年9月8日笔者用google搜索,只取前两个阿页的部分内容),

(1)今天开始就要连上七天了,因为同事要年休,而我就要替班。(2)“明天下班时,你提前在店里替一会儿班,效果就出来了。”老婆强压,局长只好魁强为之。第二天下班,吴局长果然站在小店里打起了替班。

(3)本人22岁,开挖掘机两年半多,开过大中小多种机型,专门帮人替班……

(4)这个中心还提供替班司机调度服务。

……

(12)掘金替补赴意大利淘金,前六号新秀竟难在联盟立足……

(13)……而董方卓则在三轮联赛后,在曼联队锋线伤兵众多的情况下历史上第一次进入替补席。

(14)然而即便是这样,近四场比赛只获得了两次替补上场机会,岑登心中总有些觉得不爽。

(15)……当替补时显然比他今天首发要表现得好一点。

(16)成品汽油的“替补品”——复合元铅汽油横空入世。

(17)勇士队急缺替补……

……

(30)小S待产,《康熙》再找替工,蔡康永首选张小燕。

(31)仲裁委认为,无论崔某属于何种性质的员工,只要有为A公司工作的事实存在,A公司就应依法与其签订劳动合同,并为其缴纳各种社会保险,临时替工并不能成为公司免除此项义务的理由。

(32)明天要去当一天的替工,朋友外出进货,临时拉我去充当打工老板。

根据对用例的初步调查,“替班”还未发展出指人的意义,即使有,也是临时性用法,不能作为词典收录的依据;“替补”的情况复杂一些,例(12)、(15)、(17)都可以理解成指人的名词,只有根据更大范围的语料统计才能确定,但至少可以认为“替补”的名词用法正在发展之中;“替工”的名词用法已很确定。

根据上面分析,《现汉》只为“替工”注名词义是稳妥的,《规范》为“替班”注名词义,失之轻率。对于“替补”这样正在发展中的语言现象,不同词典可以有不同的处理。我们认为,先观察一段时间,不必急于确定,待稳定下来再作处理。当然,如果编纂的是新词词典或描写型词典,可以积极一些,而规范型词典收词和收义必须慎重。

总之,语文词典收词应该有个“度”,既要有质的标准,也要有量的依据。“质的标准”指收词标准要明确,哪些词或词义该收,哪些词或词义不该收,应该有个可操作的标准。“量的依据”既包括词条的总量控制,不能无限膨胀;也包括量的平衡,比如语文词与百科词保持多大比例比较合适;还包括量的统计,对词语使用进行较大规模的语料统计,力避收词增义的主观随意性。