前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇古汉语范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
关键词:偏义复词;特点;作用
中图分类号:H109.2 文献标识码:A 文章编号:1005-5312(2013)08-0211-01
一、古汉语偏义复词成因分析
从对我国传统语言学的研究中不难发现古人在遣词造句以表情说理时往往用语宽缓不迫,偏义复词这种两个语素并用却只有一个语素表义的方法切合了古人的语用习惯,因而古书中就有大量的偏义复词现象。古人在行文时明明可以用一个单音词就可以表达意思,却偏两个语素连用且其中一个语素只是作为陪衬,”这种用法并不是古人没有道理肆意为之,而确实是古人为追求行文不迫,音节舒缓,句式整齐的表达效果而有意而为。
(1)有孙母未去,出入无完裙。(杜甫《石壕吏》)
(2)陟罚臧否,不宜异同。(诸葛亮《出师表》)
例一中“出入”偏“出”义,即是说,出门时没有合适的衣服。这是五言诗中为求字数匹配和韵律的需要而加了“入”字,实则“入”字并不表意。例二也都如此。由此可见,古人行文多用字数相等,结构相当的句子来达到一种音节协调、对称之美,偏义复词的大量使用正是切合了古人的语用习惯。
在上古时期,单音节词还是能满足人们交际表达的需要的。然而,到了西周、春秋时期,单音节词的构词方式已经远不能满足人们的对新词的需求了。偏义复词是以单音节词连用为基础而逐渐发展起来的。可以说,如果没有双音节词连用的构词方式,也不会出现偏义复词。只是偏义复词在构词时与复合词中其他类型有所不同。偏义复词是两个语素联合而成,但其构成方式不是简单的二者意义的融合或者相加构成新义,而是其中一个单音节词在构词的新词中占据全部意义,而另一个单音节词则只是虚化成了只表示语法意义。因而偏义复词实际上是由一个表示词汇意义的单音节词加上一个没有词汇意义只有作为构词成分的语法意义的单音节词组合而成。因此不难看出,古人行文修辞上的需要以及汉语双音词化的过程都促成了偏义复词的产生。
二、偏义复词的特点
偏义复词特点可从其组合方式和表达意义两方面分析。
从组合方式上看,偏义复词有两个特点:一是词序组合的不固定性;二是语素组合的不稳定性。古汉语偏义复词是以两个单音节词组合为基础,它和其他双音节合成词一样,经历临时性的组合到凝成词的发展变化。这类偏义复词的陪衬语素,只有在特定的语言环境中才能显露出来,一旦脱离了具体的语言环境,其临时性即会消失,恢复其固有的词汇意义。有时会颠倒语素的顺序而组成不同的词。如:“我有亲父母,逼迫兼弟兄。”(《孔雀东南飞》)和“今君相楚二十余年,而王无子,即百岁后将更立兄弟。”(《史记・春申君列传》)此二例中“弟兄”、“兄弟”都是偏义复词,前一例偏义于“兄”,后一例偏义于“弟”。
从偏义复词的词汇意义上看,其具有以下几方面的特征:词义的随意性、狭义性、模糊性。古汉语偏义复词因其组合的不凝固性遂导致了其词义的随意性。有时偏义于前一个语素,有时有偏义于后一个语素。而具体偏义那个语素,就需要在具体的语境中来分析。偏义复词也是复合词的一种,属于联合式复合词。两个单音节语素的组合只是其中一个承载了全部词汇意义,另一个则不表意。因此,它必然有一个特殊的特点,即是它的词义比构成它的两个语素的词义要窄,偏义复词的这种特点使得它对构成的词有限定作用,其狭义性也主要是通过偏义复词的陪衬语素的限定作用来体现的。构成偏义复词的两个单音节语素本身就表意模糊、灵活,而将两个单音节词放在一起后,由于词义的限制作用,表意反而比较明确了。但是也正是由于偏义复词这种只有一个语素表义,另一语素不表义的特殊用法,如不在具体的语言环境中,其表意也是不甚清楚的。
三、偏义复词的作用
1、作为一种修辞手段,古汉语偏义复词起到了凑足字数、协调音节、舒缓语气、整齐句式的作用,增强了行文的音乐美。
日出东南隅,照我秦氏楼。(《陌上桑》)
则祠蚩尤,衅鼓旗。(《史记・封禅书》)
上述例子中,“东南”偏指“东”,“南”只是用来协调音节;“鼓旗”偏指“鼓”,连及“旗”,只是为了和上下文相对应。偏义复词的陪衬语素在兼顾准确表义和形式、韵律和谐方面,起到了很好的平衡作用。
2、偏义复词可使表达含蓄、委婉。等级森严的封建社会,人们迫于种种原因,在表达自己意思的时候,忌讳直接说出来。文人们便常用隐晦、委婉、含蓄的方式来表达。
小结:总之,偏义复词形成和发展的过程纷繁复杂,作为语言的一种现象,它必然受文化的制约和影响。作为思维的工具,它一定在思维的作用下发挥作用。古代汉语的偏义复词至今受人青睐,又具有如此旺盛的生命力,正是因为它具有丰富、独特而重要的语言表达效果。
【关键词】文言文教学 鸡肋 语言文字 情感
《语文课程标准》明确指出:在语文学习过程中,要让学生逐步形成积极的人生态度和正确的价值观,提高文化品位和审美情趣。要让学生认识中华文化的丰厚博大,吸收民族文化智慧。
钱梦龙先生曾经感慨地说:“文言文教学是语文教学改革的一个‘死角’”。教材中所选的文言篇章是千古传诵、文质兼美的佳作,在新课改中我们应尽力从音韵、形式、情理角度去展示古汉语的美,让甘如醴酪的美文在学生心中绽放成璀璨之花。
一、音韵之美
朱熹说过:“大抵观书须先熟读,使其言皆若出于吾之口;继以精思,使其意皆若出于吾之心,然后可以有得也”。叶圣陶先生也说,吟诵能“传出文字的情趣,畅发读者的兴趣” 。读,可以突出形象思维,感悟课文内容;读,可以鉴赏再创造。文言文教学要做到每堂课都能听到读书声,或老师范读,或听名家范读,或学生朗读。 “读”并不仅是为了活跃课堂气氛,更是为了把握文言文的音韵神韵。
首先是要求读准字音,特别要求掌握通假字、古今字、异读与破读。例如“数”,在“范增数目项王”句中读“shuò”,意思是“多次、屡次”;而“数罟不入池”中读“cù”意为“密”。又如通假字,“天下云集响应,赢粮而景从”中“景”通“影”;“君子生非异也,善假于物也”的“生”通“性”。
其次是读准句读节奏。要求在语言层面上通读文言文,做到正确停顿,恰当理解。如《廉颇蔺相如传》“相如前进缶”一句,应是“相如/前/进缶”,而非“相如/前进/缶”;《师说》中的“师道之不传也久矣!欲人之无惑也难矣”,正确断句应是“师道之不传也/久矣,欲人之无惑也/难矣”。
再次是要读出语气和语势。这样有利于体会文言文的感情和气势,表现出抑扬顿挫、跌宕起伏的节奏感。如《赤壁赋》中“白露横江,水光接天。纵一苇之所如,凌万顷之茫然”,可以让学生边读想象:清风明月,水色一天;朦胧迷离,羽化登仙。读《陈情表》中的“但以刘日薄西山,气息奄奄,人命危浅,朝不虑夕”时体会李密的如泣如诉。
古人云:“松声、涧声、琴声、鹤声……皆声之至清者,而读书声为最。”在文言文教学过程中,只有对课文反复朗读,才能让文言文中的无声语言变成声情并茂的语言艺术。
二、形式之美
古人作文很重视文章的形式美,所谓“言而无文,行而不远”说的就是这个。在谋篇布局上或似《阿房宫赋》骈散错落的句式;或似《六国论》一般正反论述,深入浅出。
在遣词造句上或似“蜀山兀,阿房出”般高度凝练,6个字概括了无限深广的内容,而从“兀”到“出”的过程,更给读者留下了驰骋想象的广阔空间。 特殊句式更是文言文美的体现,对特殊句式的了解也有助于现代汉语的学习。如许多成语是从古文演变而来的,如:草木皆兵(判断句)、古为今用 (被动句)、沧海(之)一粟(省略句)、唯利是图(唯图利。宾语前置)、生于忧患,死于安乐(于忧患生,于安乐死。状语后置)……通过学习,学生对成语中的古文知识点有了全面的了解,对成语的掌握将更好。
在修辞手法上多用比喻、对仗、排比、对偶等让文章增色不少。如“明星荧荧,开妆镜也;绿云扰扰,梳晓鬟也;渭流涨腻,弃脂水也;烟斜雾横,焚椒兰也”,其中既有排比,又有对偶和比喻,间接写出宫中美人之多。
三、情理之美
高中语文课程标准把语文课程性质界定为“工具性与人文性的统一”,这是对语文课程性质的认识的历史性总结和升华。语文的工具性早已经得到了普遍的认可。语文的人文性,亦是由该学科的自身特点所决定。文言文大多是作者“披情入文”的呕心之作。其中有“苟利国家生死以,岂因祸福避趋之”的爱国热情,有“穷则独善其身,达则兼济天下”的仁爱之道,有“积善成德,而神明自得,圣心备焉”的善心德行。学习这些文言作品,就是聆听圣哲先贤的济世忠告,体会中国古代文人的超然、旷达、淡泊、宁静,领略集大成者的才华、品德、襟抱与睿智。
文言文经历了上千年的锤炼,载负着璀璨的华夏文明,是我们民族精神内涵的源头活水。它之所以能久传不衰,在于有着永恒的艺术魅力和无尽的美学价值。语文老师肩负着历史的责任和使命,要尽力去发掘文本中美的因素,让这些古代文化之精华在教学中大放异彩,让古汉语之花璀璨于历史星河中。
【参考文献】
1.杜草甬 《叶圣陶论语文教育》河南教育出版社,1986.
2.秦训刚 蒋红森《高中语文课程标准教师读本》华中师范大学出版社,2003.
3.刘永康 翟启明《中学语文教学论》天地出版社2001年.
我相信这种说法,因为这是专家靠资料统计得出的结论。但是如何将这100个常见的别字纠正过来?如何把这100个别字纠正了,再把现在出版物上别字总量的另一半也减少下来,或者说把别字减少到最低限度,恐怕仍然是个问题。我的看法是,我们的记者、编辑、校对倘若能够在繁忙的工作之余,抽空钻研点古汉语乃至古文字知识不失为减少错别字的一个途径。就拿这最常见的100个别字来说吧。
粗看这些别字,有不少错得很荒唐,比如说“大拇指”的“拇”字,稍有点古汉语常识的都会知道,这是个形声字,从“手”“母”声(《说文》:“拇,将指也。”我们姑且不去管它)。大拇指是长在手上的(脚上当然也有“拇指”),咋也不能写成“姆”。又如“一鼓作气”,把“鼓”写成“股”。稍读过些古书的人都该知道古文名篇《曹刿论战》吧,这篇古文讲了古代一个有名的战例,同志在他的著名的军事理论著作《中国革命战争的战略问题》一文中还引用过它,中学课本中也选用过它。“一鼓作气,再而衰,三而竭”是张口就来的,“鼓”是擂鼓,是名词用作动词,跟那个作“大腿”用的“股”字有什么关系?
荒唐归荒唐,错误还是照常发生了,该有什么办法?这就说明钻研点古汉语乃至古文字知识或者抽空读一点古文有多重要了。其实我们不必在理论上有很深的造诣,花很多时间去研究古人认定的汉字的六种造字方法或者古汉语语法知识什么的,粗知一些,相信也会减少一些差错的。比如“舶来品”的“舶”。“舶来品”就是从国外进口的物品,“舶”是大船,从国外进来得用船。而“泊”的本义该是“湖泽”、“沼泽”,没有外来的意思。“松弛”的“弛”,本来是指拉满的弓再松弛下来。把弓弦绷在弓上面叫“张”,由这个意义引申为把弓拉开,张弓时,弦被越拉越紧,所以“张”有了“紧”的意思,“弛”则与之相对,指“松”,《礼记》中说,“一张一弛,文武之道也”。而“驰”则是“车马疾行”,“松弛”写成“松驰”,意思不正好反了?再如“针砭”。“针”,本字作“钅咸”,是指缝纫用的工具,引申为“用针刺”,成为中医上的医疗用具。“砭”是一种石针,用石块制的尖石或石片,用以治痈疽、除脓血,为中医最古的医疗工具,有了金属后,就主要用“针”为医疗工具了。“针”、“砭”都是用来治病的,于是同义词连用,成为一个词“针砭”,后引申为“规劝”、“告诫”、“指出错误”的意思来,与那个作“损减”、“抑制”意思的“贬”字根本不是一回事。“出其不意”的“其”,古汉语中是个无指代词,意为“他的”,指对方,战争中用计谋必要出敌方意料之外方为好计,“其”写成“奇”就大错特错了。“精粹”、“震撼”、“迁徙”、“宣泄”都是同义词连用,把“粹”换成“萃”、“撼”换成“憾”、“徙”换成“徒”、“宣”换成“渲”就不是了,意思也大不对了。类似这些个字、词,不写错或者一时拿不准问个为什么,然后纠正过来,不需要高深的理论知识吧?
粗知古汉语常识能解决一些问题,但若能在闲暇之余往深处钻一钻,或者读点古代的文化典籍,也许是一件不错的事,没准还能有点“小发现”让人欣喜不已。比如:
“安装”。“安装”的“安”字常被错写成“按”,表面上看,“安装”不得用手吗?于是把“安装”写成“按装”似乎顺理成章了。“安装”不能写成“按装”,许多人会想,“安装”怎么就和“安定”、“安全”、“平安”的“安”连在一起了呢?其实,认真分析一下“安装”的“安”字,还真让人不得不佩服古人看问题看得远、看得深,办事认真,而且注重结果,讲求效果,不像“今人”那样短视,重形式,轻效果。“安装”是“安”的本义的引申。“安装”的本义是“安居”、“居处”。《说文》:“宀,交覆深屋也。象形,从女在宀中。”“宀”是一所房子,古时男子下地干活,女子在家操持家务,这才像个家,这才让人感到“安定”、“安宁”。由此引申,“安”有了“安全”、“安定”、“稳定”、“安逸”等意思。《汉语大辞典》把“安”字列了11个意思后,到第12个列出了个“安装、设置”。可以说,在古人看来,你“安装”一个什么东西,哪怕摆放一件家具或什物,你得给摆稳当了,不能摆不稳,那样不安全,给人不安定的感觉,我尽管注重工作的方式方法,但更看重结果、效果。从“安装”的“安”字不能写成“按”,足可以看出我们的古人办事的严肃劲、认真劲来。
词异读的成因。其中通用假借、古今字、外来语及古书注解相沿而致是主要原因,而“破读”所致也是重要
原因。本文还对古汉语异读字的异读音,进行了分类,并举例加以说明。
关键词古汉语异读字分类
***
古汉语中的某些字词要异读,原因是很多的。其中,由于通用假借、古今字、外来语以及古书注解相沿
所致则是一个重要原因。其现象有如下几种:
1.通假字的本义和假借义读音不用。在古汉语的书面语言里,常有这样的情形:本来有的字不用,却用
另一个字来代替,造成读者的不同。如“信”字,其本义是表示“诚实”、“信任”、“的确”、“任意”
、“使者”等意思,读xìn。
例信而见疑,忠而被谤,能不怨乎?(《史记·屈原贾生列传》)
自可断来信,徐徐更谓之。(《玉台新咏·古诗为焦仲卿妻作》)
但有时却假借为“伸展”、“伸张”的意思,即与“伸”同义,读为shēn。
例狼欣然从之,信足先生。(马中锡《中山狼传》)
是故不争天下之交,不养天下之权,信己之私,威加于敌,故其城可拔,其国可隳隳(《孙子·九地
》)
又如“归”字,其本义是表示“返回”、“归还”、“女子出嫁”、“归附”等意思,读guī。
例执讯获chǒu@①,薄言还归。(《诗经·小雅·出车》)
余既为此志,后五年,吾妻来归,时至轩中,从余问古事,或凭几学书。(归有光《项脊轩志》)
江表英豪咸归附之,已据有六郡,兵精粮多,足以立事。(《资治通鉴·赤壁之战》)
但又假借为“馈”,即赠送的意思,读kuì。
例阳货欲见孔子,孔子不见。归孔子豚。(《论语·阳货》)
2.古今字由于其分工不同,读音亦不尽相同。在上古时代,特别是先秦时代,汉字的数量比后世要少得
多,一个字往往要表示几个不同的含义,这就造成某些字“兼职”过多的现象。譬如“说”字,就兼任“解
说”、“讲”、“言论”、“劝说”、“喜悦”等义项。当其表达“解说”、“讲”、“言论”等意思时,
读shuō。
例请说之。吾从北方闻子为梯,将以攻宋。(《墨子·公输》)当其表达“劝说”的意思时,读shuì
。
例公子患之,数请魏王,及宾客辩士说王万端。(《史记·魏公子列传》)
而当其表达“喜悦”的意思时,通“悦”,读作yué。
例学而时习之,不亦说乎?(《论语·学而》)
为了避免一字兼职太多,后来才造了“悦”字,分担了“喜悦”的义项。
再如“责”字,本为“债”字,读zhài。
例公说,使有司宽政、毁关、去禁、薄敛、已责。(《左传·昭公二十年》)
谁习计会,能为文收责于薛者乎?(《战国策·冯谖客孟尝君》)
当其在兼任“索取”、“要求”、“谴责”、“处罚”等义项时,则读zè。
例里胥猾黠,假此科敛丁口,每责一头,辄倾数家之产。(《聊斋志异·促织》)
抑又闻之,古者重冠礼,将以责成人之道,是圣人所尤用心者也。(柳宗元《答韦中立论师道书》)
梁客辛垣衍安在?吾请为君责而归之!(《战国策·鲁仲连义不帝秦》)
后来,由于有了“债”字,就将该条义项区分出来。
又如“贾”字,兼有“买卖”、“商人”、“价钱”、贾姓等义项。表示“买卖”、“商人”等意思时
,读gǔ。
例商农工贾,不败其业。(《左传·宣公十二年》)
年长色衰,委身为贾人妇。(白居易《琵琶行》)
表示“价钱”之义,读jià。
例有美玉于斯,韫@②而藏诸?求善贾而沽诸?(《论语·子罕》)
表示姓氏,读jiǎ。
后来由于有了“价(jià@③)字,才分担了“价钱”这一义项。
3.许多人名、地名、物名保留了古代的读音,与今音异读。如“食”、“其”等,在用于人名时,“读yì,“其”读jī。
例信引兵东,未渡平原,闻汉王使郦食其已说下齐,韩信欲止。(《史记·淮阴侯列传》)
“射”在用于古代钟名时,读yì。
例噌@④者,周景王之无射也,kuǎn@⑤坎镗@⑥者,魏庄子之歌钟也。(苏轼《石钟山记》)
在用作草名时,读yè。
例西方有木焉,名曰射干,茎长四寸,生于高山之上,而临百仞之渊。(《荀子·劝学》)
“房”在作古宫名时,读páng。
例六王毕,四海一,蜀山兀,阿房出。(杜牧《阿房宫赋》)
4.有些来自外族语言的国名、人名、姓氏名等,读音也较为特殊。如“大宛”是古西域的国名,“宛”
则读作yuān。
例大宛闻汉之饶财,欲通不得,见骞,喜,问欲何之。(《汉书·张骞传》)
“可汗”,是对古鲜卑、突厥、回纥等少数民族的君长的称呼,读kèhán。
例可汗问所欲,木兰不用尚书郎;愿驰千里足,送儿还故乡。(《乐府诗集·木兰诗》)
“氏”,汉代西域有大月氏、小月氏。“氏”读zhī。
例(张)骞以郎应募,使月氏,与堂邑氏胡奴甘父,俱出陇西。(《史记·大宛列传》)
又如汉代对匈奴王后称“阏氏”,“氏”读zhī。
例及卫律所将降者,阴相与谋劫单于母阏氏归汉。(《汉书·李广苏建传》)
古汉语某些字词异读的另一个重要原因,是由于“破读”所致。所谓“破读”(亦称“读破”),就是
用改变一个字词的读音来表示不同的意义或者不同的词性。这实际上是词义引申发展的结果。语言中的某一
个字词,当其产生了新的意义或新的语法作用时,为了在读音上有所区别,并使之表达得更加明确,就把这
个字词读为另一种读音,以表示差异。这种现象,概括起来有如下两类:
1.有的字词的不同含义,是用不同的读音来加以区分的。如“殷”字,在表示“众多”、“富裕”、“
深厚”等意思时,读yīn。
例刘璋@⑩弱,张鲁在北,民殷国富而不知存恤。(陈寿《隆中对》)
书中情意甚殷,即长者之不忘老父,知老父之念长者深也。(宗臣《报刘一丈书》)
当其表示“震动”的意思时,读作yìn。
例熊咆龙吟殷岩泉,lì@⑦深林兮惊层巅。(李白《梦游天姥吟留别》)
当表示“赤黑色”时,则读Yān。
例自始合而矢贯余手及肘,余折以御,左轮朱殷,岂敢言病!(《左传·成公二年》)
再如“恶”字,在表示“罪过”、“凶恶”、“坏人”等意思时,读è。
例不幸吕师孟构恶于前,贾余庆献谄于后,予羁縻不得还,国事遂不可收拾。(文天祥《〈指南录〉
后序》)
失时不雨,民且狼顾,岁恶不入,请卖爵子,既闻耳矣,安有为天下阽危者若是而上不惊者?(贾谊
《论积贮疏》)
噫!渫恶吏忍于鬻狱,无责也。(方苞《狱中杂记》)
当表示“讨厌”、“憎恨”等意思时,读wù。
例好逸恶劳,亦犹夫人之情也。(黄宗羲《原君》)
死亦我所恶,所恶有甚于死者,故患有所不避也。(《孟子·告子上》)
而当表示“怎”、“如何”等意思时,则读wù。
例以小易大,彼恶知之?(《孟子·梁惠王上》)
2.有的字词的不同词性,也是靠不同的读音来予以区分的。这里有几种情况:其一是名词改换为动词时
所造成的不同读音。譬如:
“王”字在充当名词时,表示“帝王”、“诸侯王”的意思,就读wáng。
例上胡不法先王之法?(《吕氏春秋·察今》)
而当其充当动词、表示“成就王业”、“旺盛”等意思时,则读wàng。
例以力假仁者霸,霸必有大国;以德行仁者王,王不待大。(《孟子·公孙丑上》)
不蕲畜乎樊中——神虽王,不善也。(《庄子·养生主》)
又如“度”字,在作名词、并表示“计量长短的标准”、“限度”、“法制”、“气度”、“度过”等思时,读dù。
例已得履,乃曰:“吾忘持度。”反归取之。(《韩非子·外储说左上》)
生之有时而用之亡度,则物力必屈。(贾谊《论积贮疏》)
衡下车,治威严,整法度,阴知奸党名姓,一时收禽,上下肃然,称为政理。(《后汉书·张衡传
》)
在作动词、并表示“计量”、“揣测考虑”等意思时,读duó。
例试使山东之国与陈涉度长挈大,比权量力,则不可同年而语矣。(贾谊《过秦论》)
诗云:“他人有心,予忖度之。”——夫子之谓也。(《孟子·梁惠王上》)
其二是形容词改作动词、名词时造成的不同读音。如:
“好”字,在充当形容词、并表示“美好”、“友好”等意思时,读hǎo。
例不如叔也,洵美且好。(《诗经·郑风·叔于田》)
若备与彼协心,上下齐同,则宜抚安,与结盟好。(《资治通鉴·赤壁之战》)
在充作动词,表示“喜好”的意思时,读hào。
例王之好乐甚,则齐国其庶几乎?(《孟子·梁惠王上》)
再如“臭”字,在充当形容词,表示与“香”相对的意思时,读chòu。
例一薰@⑧,十年尚犹有臭。(《左传·僖公四年》)
在作名词,表示“气味”时,读xiù。
例所谓诚其意者,毋自欺也,如恶恶臭,如好好色。(《礼记·大学》)
其三是主动词改作被动词时造成的不同读音。如“见”字,在作主动词、且表示“看见”、“召见”等
意思时,读jiàn。
例一日不见,如三秋兮。(《诗经·王风·采葛》)
在表示被动、作“引见”义,或作“显现”时,读xiàn。
例初,齐豹见宗鲁于公孟,为骖乘马。(《左传·昭公二十年》)
膑至,庞涓恐其贤于己,疾之,则以法刑断其两足而黥之,欲隐无见。(《史记·孙子吴起列传》
)
关于古汉语异读字的异读音,大抵来讲,有四种不同类型。
一类是韵母相同,声母不相同。如“乘”字,在表示“驾”、“坐”、“趁”的意思时,读chéng。
例二子乘舟,汛汛其景。(《诗经·邶风·二子乘舟》)
而在代表“车辆”和作“四”的代称时,读shèng。
例于是为长安君约车百乘,质于齐,齐兵乃出。(《战国策·触龙说赵太后》)
郑商人弦高将市于周,遇之,以乘韦先牛十二犒师。(《左传·僖公三十二年》)
再如“亏”字,在表示“减少”、“毁坏”的意思时,读kuī。
例不亏不崩,不震不腾。(《诗经·鲁颂·bì@⑨宫》)
芳与泽其杂糅兮,唯昭质其犹未亏。(屈原《离骚》)
而当表示“差异”的意思时,同“诡”,读guǐ。
例其时已与先王之法亏矣,而曰此先王之法也,而法之。(《吕氏春秋·察今》)
第二类是声母相同,韵母不同。如“读”字,在表示“诵读”的意思时,读dú。
例又尚论古之人,颂其诗,读其书,不知其人可乎?(《孟子·万章下》)
而表示“句读”(即不足一句,读时须稍有停顿之处)的意思时,则读dòu。
例彼童子之师,授之书而习其句读者,非吾所谓传其道解其惑者也。(韩愈《师说》)
又如“泛”,在表示“漂浮”、“广泛”的意思时,读fàn。
例余感焉,以杜君之言泛讯之,众言同,于是乎书。(方苞《狱中杂记》)
而在表示“覆、翻”的意思时,读fěng。
例大命将泛,莫之振救。(贾谊《论积贮疏》)
第三类是声调不同。如“创”字,当表示“始造”、“首创”的意思时,读作chuàng。
例先帝创业未半,而中道崩殂。(诸葛亮《出师表》)
在表示“创伤”的意思时,读chuāng。
例夫身中大创十余,适有万金良药,故得无死。(《史记·魏其武安侯列传》)
第四类是声、韵母均不同。如“罢”字,在表示“停止”、“罢免”等意思时,读bà。
复请之,吾辈无生理,而主谳者亦各罢去。(方苞《狱中杂记》)
当表示“困疲”的意思,通“疲”,读作pí。
例庶民罢敝,而宫室滋侈。(《左传·昭公三年》)
又如“女”字,在表示女性的意思时,读nǚ。
例不闻爷娘唤女声,但闻燕山胡骑鸣啾啾。(《乐府诗集·木兰诗》)
在表示“以女嫁人”的意思时,读nü。
例尧之于舜也,使其子九男事之,二女女焉。)《孟子·万章下》)
而在作人称代词时,则通“汝”,读作rǔ。
例三岁贯女,莫我肯顾。(《诗经·魏风·伐檀》)
一些常见的异读字,因其流传的历史久远,而且有的已进入现代汉语的书面或口头语之中,有了较广泛
的群众基础;同时许多工具书和古书的注本中,也都注明了它的读音,因此应按传统的习惯去读。而那些较
为少见的、也未保留在现代汉语中的异读字,或者人民群众已改读为一般读音的字词,就应按照现在的习惯
去读。我们今天不必耗费精力去研讨它的旧读音,以免给学习者造成不必要的麻烦。如山东费县的“费”,
旧读为bì,现已改读为fèi;“叶公好龙”的叶,旧读为shè,今一般读为yè。再如“暴露”的暴,传统
的读音本应是pù,但现已约定俗成,读作bào,就不必固执旧读了。
(作者单位:兰州铁道学院社科部责任编辑:孟恩)
字库未存字注释:
@①原字为酉加鬼,为左右结构。
@②原字为匚加卖,为半包围结构。
@③原字为价的繁体字。
@④原字为口加肱的右半部,为左右结构。
@⑤原字为穴下加款,为上下结构。
@⑥原字为革加搭的右半部,为左右结构。
@⑦原字为忄加栗,为左右结构。
@⑧原字为艹加犭加酉,为上下结构。
关键词:语料库建设中古汉语语料标注语料检索
一、 前言
自20世纪80年代始,中古汉语研究取得了长足进展。然而遗憾的是,古汉语语料库的建设远远地落后于研究的进展。综观国内外研究现状,要么对中古的语料收录不多,要么没有进行精细加工。(董志翘2011)中古时期是汉语的质变期,中古汉语的研究对于理清汉语语音、词汇、语法等的发展脉络有着不可或缺的作用。现今语料库中收录的中古语料十分不足,而未做分词标注等深层加工又在很大程度上减弱了语料库的整体使用价值。为使中古汉语研究不断走向纵深,并有更加整体定性的研究方法和多层面的分析角度,建设深加工的研究型中古汉语语料库十分必要。
中古时期的语言面貌与现代很不相同,两者在语料库的构建上也必然存在差别。一方面,无论在语言学理论,还是语料库理论上,针对现代汉语的研究均更为成熟。特别是在分词标准、语法标注类别等方面,现代汉语成果颇多,不仅有权威的分词规范出版,句法分析、格语法、框架语法等多种语法研究也产生了大量研究成果。中古汉语及其语料库构建理论的相关研究则还很薄弱,尚有待进一步探索。另一方面,中古汉语语料库在构建技术上还比较落后,自动分词、自动标注的相关研究相对滞后,这不仅加大了人工操作的工作量,也不利于提高分词、标注的一致性,为语料库的构建质量埋下了隐患。除此之外,由于中古汉语只存留在文献中,并不会出现在日常交际中,这使得语料库在构建目的、加工方法、加工层级上与现代汉语语料库也有所不同。中古汉语语料库的构建目的较为单一,主要服务于汉语史研究和古汉语学习,这就要求在构建时更加注重传统句法、古代特殊语法、特殊语用现象的标注,以及疑难字的解析、与现代汉语的对译等。
中古汉语研究型语料库主要收录从东汉到隋的传世文献37本,除此之外还有汇集的诗歌杂帖及出土的中古文献。收录原始语料的库容约1000万字(化振红2014),加工后的库容将大大扩展,包括书籍库、句子库、词汇库、疑难字库、义项库、编码库六大不同层级的子库。语料库采用开源的MySQL数据库[1]对语料信息进行存取,本文拟就语料库构建的相关问题,进行较深入说明。
二、 语料库构建原则及方法
(一) 语料库构建目标及原则
中古汉语研究型语料库是基于中古汉语书面语的共时专语语料库,在建立语料库之初首先要明确的是语料库构建的目标和原则。
中古汉语语料库建设的主要目标有: 1) 提供经过校勘的中古文献已校注的电子版;2) 为中古各种词汇、语法、搭配等语言现象提供可进行统计的平台;3) 为中古文献提供可靠的释义,为机器翻译、语言学习领域提供基础材料;4) 为中古汉语语言研究提供大量好的语言实例。
中古汉语语料库设计遵循的总原则是: 1) 语料库的设计和建设在系统的理论语言学原则指导下进行;2) 语料库语料的构成有明确的语言学理论指导,按照一定比例收集语料,而不是中古文献的简单堆砌;3) 中古汉语研究型语料库作为中古时期语言运用的样本,须采用科学的方法确定各种语料的比例,使语料具有代表性;4) 语料加工时采用自动和人工相结合的方式;5) 语料库中语料以电子文本形式储存并且可以方便快捷地通过计算机对语料进行各种处理。
(二) 语料库模块划分
在明确构建目的和原则的基础上,初步确立了语料库构建所涉及的几个模块,具体如图1所示:
图1中“语料选取及整理”“语料加工”是针对具体语料进行的工作,是把选定、加工后的语料整合起来,以一定方式存储在数据库中。“语料库管理及使用”是提供管理和使用该数据库的平台,针对构建好的语料库设计管理、检索系统,以便为研究者提供共享服务。这三大模块在语料库构建中都至关重要,其中“语料选取及整理”是基础,“语料加工”是核心,这两者属语料库本体层,决定了语料库构建的质量。“语料库管理及使用”属语料库应用层,决定了语料库的功能和用户体验。这里先介绍本体层的两个环节。
(三) 语料选取及分类
语料是构成语料库的基础,语料的选取是影响语料库质量的重要因素。中古语料库所收录的绝大多数为东汉至隋朝时期的文I,在选取语料时要遵循代表性、平衡性、关联性与区别度、特色性四大原则,(化振红2014)以保证对中古时期语言事实的覆盖率。入库的语料如表1所示:
由于影响语言全貌的内在因素有很多,单纯从某一特征来界定语料库的代表性、平衡性是不够的,萨默斯主张采用一种“广泛的客观定义的文本类型”(Leech 1991),基于该理论,本文主张从多个角度采用多种特征突出语料的区别度,如成书时代、作者、作者地域、类型、出土/传世文献、语体等,这就使得对语料库平衡性的界定突破了简单的线性描述。中古语料库在收录语料时,在确保语料规模的基础上,尽量均衡语料所具备的各种特征,并保证各种特征的值在所有特征值中不是独一份的(除“作者”外),从而提高语料库的代表性和平衡性。
中古时期的文献虽然以文言为主,但古白话已经开始兴起,文献中的口语成分在数量上虽然比不上文言成分,其增量也十分可观。然而文献中的口语成分与书面语成分并不是截然分开的,而是相互混杂、难以剥离的,比如,不少汉译佛经的受众是广大劳动人民,为了便于传播,其口语化程度更深;农书、医书强调实用性,口语性也较为突出,等等。基于中古汉语的这一特点,再加上目前市面上已有的文献情况,中古语料库确定各种语料的大致收录比例如表1,其中官修正史和汉译佛典类语料现存最多,也最具代表性,因此收录数量也分别为最多、次多;其次分别是出土文献、笔记小说、诗歌等。
除此之外,对语料的加工方式及层次也进行了分类。标记型指对分词后的语料仅进行句法层面的标注,加工层级较浅;标注型指对分词后的语料进行句法、语义、语用等方面的标注,加工层级较深;而自动型指仅借助中古汉语分词软件对语料进行分词的粗加工。从表1可以看出,目前中古汉语语料库中绝大多数为深加工语料,标注型与标记型语料的比例将近1∶6。
(四) 语料加工
语料库作为一种研究资源,其价值不能仅仅通过规模来衡量,语料库更重要的价值在于通过加工给语料库带来的“附加”价值。这种“附加”价值就是对语料库进行多种有用语言信息的加工标注,以扩展语料库的语言信息含量,从而对语言研究做出更大贡献。生语料库[2](尤其是汉语)包含的词法和句法等信息非常少,因此其应用价值也就相对有限。分词是汉语语料库建设的基础性工作,也是进行语料标注的前提,而词是从句子中提取出来的。因此,中古语料库语料加工流程包括断句、分词、标注三个部分,具体如图2所示。
图2中,断句是把文本拆成长短合宜的句子,并对句子进行篇章、书籍页码等相关信息的标注;分词是把断句后的句子根据中古时期语言的实际使用情况拆分为词语;标注是对拆分后的词语进行词性、句法、义项、按语等相关信息的标注。中古语料库中的断句过程相对简单,不赘述,这里主要介绍分词和标注两大部分。
1. 分词
汉语的词没有形式上的标记,因而分词对于汉语来说是一件麻烦事。为了确保分词的正确性和一致性[3],首先需要确立分词规范。中古汉语分词的难点已有专文论述(化振红2014),分词规范的细则也将另文阐释。中古汉语语料库的分词采取人工分词和自动分词两种方法。人工分词是逐句手工录入,并参考上下文对句子结构以词为单位分析判断并逐条录入,非常耗费人力和物力。自动分词采用CRF分词模型(陈晴2005),在模版中加入古汉语音韵、构字等信息,以提高分词正确率,详情另有专文论述(石民,李斌,陈小荷2010)。需要指出的是该论文的实验对象是先秦文献,先秦文献与中古文献存在一定差异,再加上中古文献内部本身存在着很大的区别度(陈小荷,冯敏萱,徐润华等2013),自动分词的准确率不是很高,目前仅在80%~90%,但已成倍提高了人工分词的效率。现今仍需通过提高分词一致性、细化分词规范、调整训练数据等方法进一步提高分词的准确率。
2. 标注
为了能够从语料库中抽取出更多有用信息,必须对语料进行标注。语料库是供许多带着不同目的的用户使用的。数字化手段让研究者能从多角度对多层次带标注语料进行数据挖掘,大大拓展了语言研究的深度和广度,有些研究目的甚至连语料库设计者都不曾想到过。因此,语料库的多层次标注很重要。中古语料的标注应遵循两个基本原则:
一是语料加工分为篇、章、句、词四个层级,由大到小对这几个层级进行标注。
二是标注资源具有复用性。语料库的标注昂贵且耗时,如果能复用就物有所值了。为保证语料库的复用性,需使每本文献、每层标注信息有足够的独立性,改变某文献、某层的标注信息不会对其他语料产生影响。
黄昌宁等(2002)指出,目前语言各层面的标注发展很不平衡。发展较快的有词汇层、句法层、语音层和音位层等,今后应重点加强语义层和语用层的标注。(黄昌宁,李涓子2002)由于中古时期汉语的语音系统与今天相比有很大不同,语音标注困难很大且并没有很强的实用性。语料库的标注取决于语料库的整体设计及具体研究目的,同时也是一个重要的检索依据。(梁茂成,李文中,S家金2010)中古语料库的标注信息宜涵盖篇章、词汇、句法、语义、语用各层,并对文献中涉及的疑难字以图片格式进行收录标注。据此,中古语料库中的标注从大到小包括以下五个方面。
(1) 语篇标注。语篇标注包括文本来源、版本、朝代、作者等相关信息。如果语料源于书籍,该书籍的版本、页码信息等也会标注出来。篇章书籍信息是古文献、古汉语研究专家进行相关研究的基本信息。语篇标注和校勘后的文献构成中古语料库中独立的书籍库。
(2) 句子标注。句子标注是把语篇中的句子标记上文本自身的信息,以便管理者统一管理语料库中的语料。常用的文本信息包括行分割符、行数、章、节、段落等,中古语料库中选取“章节段句”这四层信息组成编码对句子进行标注,形成句子标记。该标注信息属于篇章层,但在词汇层会自动生成词汇所从属句子的句子标记,从而使词汇层可以独立于句子层。该标记不仅方便语料库管理者统一管理语料,而且是词汇和句子进行关联的中介,为检索词汇时可以查询到上下文信息提供了条件。句子标注连同句子形成了句子库。
(3) 词汇标注。词汇标注是指对词汇从语法地位、词性、释义、用法四个方面进行标注,分别称为“句法标注”“词性标注”“义项标注”“用法标注”。其中词的句法、词性、用法标注信息均为封闭类,如表2所示:
由表2可知,句法标注、词性标注属于句法层;用法标注的层次比较复杂,大部分属于语用层,其中“古今字”“通假字”“假借字”属于汉字层面;义项标注属于语义层。义项标注后的词条汇总形成了义项库,句法、词性、用法标注信息与词汇共同形成了词库。
词汇标注中,尤其值得一提的是语义层的义项标注,它在中古语料库的构建中是一项十分重要的基础性工作。如果把古汉语中每个词的现代意义搞清楚,基本语义也就理解了。义项标注信息和中古文献信息形成了古今平行对比语料,因此,义项标注在中古语料库中是重中之重。为了提高义项标注的速度,避免把时间过多地花费在查阅相关资料上,中古语料库中设立了通用义项库,义项库的构成如图3所示:
中古语料库中的义项库目前共包括不重复的541456条义项,随着语料库构建过程中自拟义项的增加和其他相关研究成果的录入,义项库的库容仍会进一步增加。
(4) 按语标注。传世文献在流传过程中不可避免地会产生一些讹误,甚至会出现不同的文本;再加上时代的限制和编纂者认识上的局限,词典对古代文献的释义、对最早文献的引例也难免会有所疏漏。这种在对文本标注时需要特别说明的信息可放在按语中。按语信息可以避免研究者重复前人已进行过的工作,对研究工作会起到一定辅助作用。
(5) 疑难字标注。中古文献中存在着一些现代字库中不支持的字,还有一些出土文献中的字尚未能完全辨识。针对这些疑难字,语料库专门设置疑难字库,以图片的形式存储,并对该疑难字进行编号,通过编号可定位到该疑难字的上下文信息及语义信息。
使用Access进行标注的主界面设计图如图4所示:
综上可知,中古研究型语料库由其所包含文本的书籍、句子、词汇、义项、疑难字信息(分别对应于上图中的“shuji、juzi、cihui、yixiang、quezi”五张表)组成,包含书籍库、句子库、词汇库、义项库、疑难字库五大子库。此外,为了方便语料库的管理和使用,语料库中还设有用户信息库。
三、 检索管理系统研发
语料库不仅是文本的集合,它还应该具有良好的存储、扩展、检索、反馈、修正等性能,以便各种研究人员都能从中得到自己所需要的信息。为方便语料库的管理和使用,我们针对中古语料库研发了检索管理系统,其功能如图5所示。
(一) 管理系统
管理系统是提供给语料库内部成员使用以便操作和管理语料库的页面管理系统。它主要提供了书籍和疑难字的增加、删除、查询功能。书籍的管理功能是以已加工的语料作为对象按书籍为单位进行的,包括书籍库、句子库、词汇库、义项库。对疑难字的管理直接以疑难字库为单位,每个疑难字的记录中又有它所对应的语料及篇章段信息。如果需要对单个语料中的标注信息进行更改维护,无须直接操作语料库中的数据,只要在未导入的语料版本中直接通过Access数据库进行修改,确认无误后再次导入数据库即可。
(二) 检索系统
语料库建立之后将提供给研究者使用,使他们能够访问语料库内容,对相关语言现象进行分析研究。检索系统是实现语料库共享的必要条件,也是语料库应该向用户提供的基本工具。基于检索系统在语料库研发中的重要地位,中古语料库检索系统满足以下几个条件。
1. 检索条件多样化
检索条件设置得是否适宜、专业,这直接决定了语料库的用户功能适用性,也影响着使用者对整个检索系统的使用体验。由图5可知,中古语料库具有五种主要的查询方式:
(1) 标记型查询。检索条件是同一词的词形、词性、句法三种信息的组合。
(2) 标注型查询。检索条件是同一词的词形、句法、义项三种信息的组合。
(3) 组合查询。检索条件是两个不同词的逻辑关系组合,包括相邻、同句、或、非四种逻辑关系。其中“相邻”指这两个选定的词处于同一句子语料中的相邻位置;“同句”指它们处于同一句语料,但不是相邻位置;“或”指检索结果中包含这两个选定词中任何一个;“非”指检索结果中包含前一个选定词但不包含后一个选定词。
(4) 对比查询。检索条件是同一或不同的两个词的词形、句法、书籍信息的组合。用于对同一词的不同句法地位或所在文献(或者不同词的不同句法地位或所在文献)进行对比检索。
(5) 疑难字查询。检索条件为书籍、疑难字编号两种信息的组合。
除了这五种基本检索功能外,中古语料库还实现了检索结果是否附加上下文信息的可选项。还可以针对词的不同特征选择不同的查询范围,如高频词可以选择某本专书查询来减小用例的查询范围,低频词可以选择全语料库查询来扩大用例的查询范围。
2. 结果出方便快捷,且易于保存
中古语料库检索系统的输出结果以网页形式呈现,可直接保存为文本。
3. 解读清晰易懂
检索系统页面上不存在语料库设计时所使用的内部编码(如用法码“RM01”代表用法“姓加名”),内部编码均以转码形式转换为自然词汇,符合使用者的操作习惯,不需要研究者再去过多学习语料库操作规范,且转码后整个检索系统的页面显得更加清晰易懂。
4. 具有开放性和可维护性
整个语料库通过检索系统实现开放性,通过数据库维护或管理系统实现可维护性。用户在使用检索系统时如需交流意见,可在页面上直接进行反馈,反馈信息会以邮件的形式发送给语料库管理员,由管理员收集整理后提交给语料库维护专业人员进行讨论和回复。
四、 中古语料库的应用
(一) 汉语史研究
中古语料库最基本的服务对象是汉语史研究人员。由于在语篇、句子、词汇等多个层面对文献进行了标注,它可以支持多种检索方式,汉语史研究人员利用这些检索结果可以进行特定的语言学研究,例如以下四个方面的应用:
第一,使用中古语料库中最基本的句法、义项、特定句式、词性、疑难字查询、统计功能,以辅助相关的语言学研究及语文教学。
第二,根据不同的研究目的,可对句法、义项、词性三个条件变换各种组合进行查询、统计,可用以辅助对中古时期特定词汇、句法的研究。
第三,根据字词的使用频率统计结果,大致确定中古时期常用词的范围,然后结合句法、义项、语用查询来研究常用词在句法成分、语义等方面的应用、变化情况。
第四,检索同一词汇、句法结构在各个文献中的使用情况,以对不同类别、时期、作者的文献语言风格进行对比研究。
(二) 中古汉语词典编纂
中古汉语语料库收录了大批中古时期的文献,为词典编纂提供了大量可供筛选的例证。此外,语料库中对每个词进行了词性、句法、义项等方面的标注,标注时主要采用人工方法,在参考各种权威中古汉语词典的基础上,对各个词的义项、用法及例证进行考证、补充、修正,此外还对人名、地名、称号、离合式词等进行了语用标注。这些标注信息可以提供中古时期每个词汇各个层面的统计信息,为中古汉语断代词典的编纂提供了直接依据,专家只需根据分词情况对检索到的例证进行筛选,不仅为词项赋义提供了客观标准,也保证了词典可以真实反映中古时期的语言面貌,同时也大大减少了词典编纂人员的工作强度、缩短了编纂周期。
(三) 语言教学及文化研究
中古汉语语料库可以直接或间接用于中古文献的教学。不仅老师可以利用语料库向学生展示某些特定语法范畴、词汇在中古时期的使用情况,学生也可以自己利用语料库来检索词的用法、搭配、词义间的细微差别等,也就是所谓的数据驱动学习。这种学习方法不仅能为学生营造一个真实的语境,而且能提供一种探索语言的手段,对教学的意义是显而易见的。
除此之外,中古汉语语料库收录了中古时期多个领域(如历史、宗教、医学、农业等)的多本专书,并对这些书做了校勘、分词、标注,这就为相关领域的文化研究提供了可靠的电子检索资源。
五、 结语
中古汉语研究型语料库是我国第一个针对中古时期文献的断代专语语料库,目前在该语料库建设中仍不可避免地存在一些问题,随着分词规范进一步细化、分词一致性的提高、对中古词汇特点的深入了解、自动分词正确率的提升,这些问题也将逐步得到解决。该语料库目前已应用于中古时期专书、词汇、语法等方面的研究,并产生了一些成果。随着语料库的构建完成并实现共享,词典编纂、归纳性语法、语义搭配等相关应用研究不难预见,而更深层次的语言研究及其他专项应用研究也等待诸位同仁共同来发掘。
附注
[1]MySQL是一N开放源代码的关系型数据库管理系统,具有速度快、可靠性高和适应性强等优点。在不需要事务化处理的情况下,MySQL是管理内容最好的选择。
[2]生语料指收集以后未经加工的语料,生语料库指收录生语料的数据库;与此相对,熟语料指经过加工的语料。
[3]在保持语义同一性的前提下,结构体在语料库中的分合是否始终一致,如“猪肉”是否始终保持为一个整体,或者始终分开。(孙茂松1999: 90―93)
参考文献
1. 陈晴.基于条件随机场的自动分词技术的研究.东北大学硕士学位论文.2005.
2. 陈小荷,冯敏萱,徐润华等.先秦文献信息处理.北京: 世界图书出版公司,2013.
3. 董志翘.为中古汉语研究夯实基础――“中古汉语研究型语料库”建设琐议.燕山大学学报,2011(1).
4. 国家技术监督局.信息处理用现代汉语分词规范.北京: 中国标准出版社,1993.
5. 化振红.深加工中古汉语语料库建设的若干问题.西南大学学报,2014(3).
6. 黄昌宁,李涓子.语料库语言学.北京: 商务印书馆,2002.
7. 梁茂成,李文中,许家金.语料库应用教程.北京: 外语教学与研究出版社,2010.
8. 石民,李斌,陈小荷.基于CRF的先秦汉语分词标注一体化研究.中文信息学报,2010(2).
9. 孙茂松.谈谈汉语分词语料库的一致性问题.语言文字应用,1999(2).