汉字的起源一、关于汉字起源的传说和研究请注意下面几个方面:仓颉造字的传说新石器时代遗物上的各种符号判定文字的标准:文字是记录语言的符号文字形成的社会条件文字体系的形成需要一个过程汉字和古埃及的圣书字、两河流域的楔形文字、古印度的印章文字以及中美洲的玛雅文,是世界上为数不多的几种独立形成的古老文字,关于它们的起源问题,一直是人类未解之谜之一。目前世界上正在使用的文字有很多种,而汉字是最为古老的。比起其他几种早已不用的古老文字,汉字的历史是延续不断的,其发展脉络清晰可见。人们越是感到汉字的生命力如此强大,就越想了解它是如何形成和发展的。探讨汉字的起源不仅是探寻中华文明源头的一项有意义的工作,而且也可以给人们探讨其他文字的起源及其形成过程提供参考,对于了解整个世界文明的发生和发展也是很有意义的。古代中国人对汉字的起源也非常关注。如今几乎家喻户晓的“仓颉造字”古书里“仓颉”又常常写作“苍颉”。的传说,早在战国晚期就流行开了。这一时期的传世文献里有这样的记载:奚仲作车,仓颉作书,后稷作稼,皋陶作刑,昆吾作陶,夏鲧作城,此六人者,所作当矣。(《吕氏春秋·君守》)苍颉造文字。苍颉,黄帝之史。(《周礼·外史》疏引《世本·作》)仓颉之作书也,自环者谓之私,背私者谓之公。(《韩非子·五蠹》)这种传说无疑在较早的时候就已经出现了。但是,在传世的战国晚期的古籍中却没有关于仓颉的时代以及他在造字之外的事迹的任何记载。现存的早于战国晚期的古籍中也从来没有关于仓颉的记载。仓颉是什么时候的人?他是做什么的呢?汉代人多认为仓颉是黄帝的史官,魏晋以后人则说仓颉是早于黄帝的远古帝王。有关仓颉传说的文献材料,周澍《仓颉传说汇考》(《文学年报》第7期,1941年)收集较多,可以参看。《尚书正义》孔颖达疏说:司马迁、班固、韦诞、宋忠、傅玄皆云:苍颉,黄帝之史官也。……崔瑗、曹植、蔡邕、索靖皆直云:古之王也。15
汉代人把仓颉跟史官联系起来,大概并没有多大的根据,很可能是因为人们认为史官在平时跟文字接触最多,所以才有此说。魏晋人说仓颉是远古的帝王,过去大都认为荒诞无稽。唐兰《中国文字学》第53-54页对此说进行过批判,上海古籍出版社1979年据开明书店1949年版重印。其实,这个说法大概也不是魏晋人创造的,而有很早的根据。最近出版的《上海博物馆藏战国楚竹书(二)》上海古籍出版社,2002年12月。有一篇《容成氏》,第一简有这样的文字:[……尊]膚(盧)是(氏)、茖(赫)疋(胥)是(氏)、乔结是(氏)、仓颉是(氏)、轩缓(辕)是(氏)、(神)戎(农)是(氏)、椲是(氏)、是(氏)之又(有)天下也,皆不受(授)亓(其)子而受(授)臤(贤)。……这里就出现了“仓颉”的名字,并把他放在“轩辕”前面。由此可见,在战国晚期,就传说“仓颉”是远古的帝王。虽然这样,这一篇简文并没有讲到“仓颉造字”的事情,我们还不知道《容成氏》的作者是否已经把“仓颉”跟造字联系起来了。不过值得思考的是,“仓颉”为远古帝王这么一个重要的事情,居然在传世的战国晚期文献中没有保留下来,以至于汉代人就不清楚他曾是传说中的“帝王”了。这或许有一些我们还不知道的原因。很可能由于“仓颉造字”在战国晚期是比较流行的一个说法,而战国晚期的人一般认为远古时候没有文字,因而在记载关于远古的传说时,把“仓颉”删掉或改成别的名字了。李零先生认为《汉书·古今人表》中的“卷须氏”可能是“仓颉氏”之误,见上引书第250页。战国时代的人有没有这样的做法,也是值得考虑的。下面我们要引到的《庄子》里的话,在“轩辕”之前是“驪畜”而不是“仓颉”,这是不是已经被改掉的情况,有待进一步研究。《庄子·胠箧》有一段话,跟上引简文有密切关系,整理《容成氏》的李零先生已经引用:昔者容成氏、大庭氏、伯皇氏、中央氏、栗陆氏、骊畜氏、轩辕氏、赫胥氏、尊卢氏、祝融氏、伏牺氏、神农氏,当是时也,民结绳而用之。依照此说,在容成氏等时代,还没有出现文字。这也许是战国晚期比较有代表性的看法。《周易·系辞》说:“上古结绳而治,后世圣人易之以书契。”可见战国时代的人并没有把文字的发明看得很早。在战国晚期的传世文献中,也有跟“仓颉造字”不完全相同的说法。例如《荀子·解蔽》说:“好书者众矣,而仓颉独传者,壹也。”认为仓颉只是众多“好书者”之一,由于用心专一而把文字传下来了。这就没有把仓颉当成“造字”的人。看来,在战国晚期,“仓颉”其人其事的传说就不是很清楚了,或者在当时就已经不止一种传说了。至于仓颉造字的方法和过程,史书记载就更有限了。从仅有的一些记载看,古代中国人对于创造汉字的仓颉充满了神秘感。例如下面两种说法:《淮南子·本经》:昔者仓颉作书而天雨粟,鬼夜哭。《论衡·骨相》:仓颉四目。这跟世界其他民族一样,往往把文字的发明及其发明者看得非常神秘。东汉学者许慎在《说文解字·叙》中比较详细地阐明了仓颉造字的方法和作用,代表的应当是当时学者的意见:古者庖牺氏之王天下也,仰则观象於天,俯则观法於地,视鸟兽之文与地之宜,近取诸身,远取诸物;於是始作易八卦,以垂宪象。及神农氏,结绳为治,而统其事。庶业其緐,饰伪萌生。黄帝之史仓颉,见鸟兽蹄迒之迹,知分理之可相别异也,初造书契。百工以乂,万品以察。这一段话说到文字是在“饰伪萌生”15
的情况下产生,实际上指出了文字是应社会需要而产生;仓颉根据符号相互别异的原理来造字,是受到狩猎劳动实践中观察鸟兽不同之迹的启发,不仅说明文字的发明与生产劳动有关,而且揭示了创造文字所需要的知识基础和心理基础;文字产生以后,‘百工以乂,万品以察’,则认识了文字的巨大社会作用。此段分析参考了李万福、杨海明《图说文字起源》第84页的说法,重庆出版社,2002年。这里面虽然有不少合理的意见,但是把汉字的创造归功于个人,现代学者大都认为不可信。实际情况很可能是,在汉字形成的过程里,尤其在最后阶段,很可能有个别人曾起过极其重要的作用。仓颉大概就是这样的人。关于汉字起源的传说,古书中还有一些,由于都缺乏比较科学的根据,这里就不多作介绍了。参看唐兰《中国文字学》第54-56页;裘锡圭《汉字的起源和演变》第126-128页,载《中国古代文化史》(一),北京大学出版社,1989年。19世纪末,殷墟甲骨文发现以后,对于探索汉字的起源来说,有了一个可靠的基础。人们普遍认为,汉字的起源应当在商代晚期之前。但是,究竟汉字的源头可以追溯到什么时候呢?比起传世文献的各种记载,人们自然更加关注考古发现的新资料,希望能从出土文物中找到答案。中国的考古学是在20世纪以后发展起来的。20世纪初,西方现代考古学的观念和方法被引进到中国,从此,中国的考古学家开始了自己独立的考古实践。近80年来,特别是在新中国成立以后,在我国新石器时代的遗址和墓葬里,发现了不少刻有或绘有符号的陶器和陶片,还有少量刻有符号的龟甲、骨片和石器等物。每一次考古挖掘,如果发现了跟汉字起源有关的材料,都会在学术界和社会上引起不小的反响。文字学家很早就注意利用考古新材料来推测汉字起源的年代。1933年,唐兰作《殷契佚存·序》(金陵大学中国文化研究所影印本),指出安特生《甘肃考古记》书中收集的辛店期陶瓮上有文字,与商周文字同一本源而较古拙,年代约在四千余年以前。这一观点,他还在《古文字学导论》一书中加以重申(第27页)。后来,大家发现辛店文化遗址的年代并不很早。近年经过碳14测定,得知它大约在公元前1000前后。这样,唐兰先生的结论就失去了根据。但是,这并不妨碍人们寻求更早的跟汉字有关的材料。直到现在,还没有人对所有已发现的新石器时代的各种符号加以汇集和整理,因而对其数量和种类很难有一个精确的统计。根据初步观察,新石器时代主要的文化遗址里都曾发现过这些符号。时代最早的是河南舞阳县贾湖村裴李岗文化遗址出土的符号,距今大约有8000年左右。河南省文物研究所《河南舞阳贾湖新石器时代遗址第二至六次发掘简报》,第12页,《文物》1989年第1期。观察新石器时代各种符号的分布范围,可以发现它们几乎遍及全国,从陕西、青海到东南沿海,从黄河流域到长江流域,都有发现。对新石器时代各种符号综述性的论著,可以参看陈昭容《从陶文探索汉字起源问题的总检讨》,《中央研究院历史语言研究所集刊》第57本第4分,1986年;陈全方《周原出土陶文研究》“我国出土的西周以前的陶文简表”,第72-75页,《文物》1985年第3期;王蕴智《史前陶器符号的发现与汉字起源的探索》,《华夏考古》1994年第3期;李万福、杨海明《图说文字起源》,第162-170页,重庆出版社,2002年。有人根据符号的外形,把它们分成下面甲乙两类。见裘锡圭《文字学概要》,商务印书馆,1988年版。甲类以几何形符号为主,可以把西安半坡、临潼姜寨等地发现的仰韶文化早期的符号当作代表(见下图一、二)图一选自《西安半坡》第103图,西安半坡博物馆编,文物出版社,1982年。图二选自《姜寨》。。(图二)(图一)15
在已发现的新石器时代的符号里,甲类占绝大多数。乙类以象形符号为主,如莒县陵阳河、大朱村等地发现的大汶口文化晚期陶尊上的符号(图三)。在传世的一些良渚文化的玉器上,也刻有跟大汶口文化相似的乙类符号。(图四)转引自裘锡圭《究竟是不是文字——谈谈我国新石器时代使用的符号》,《文物天地》1993年第2期。有些器物上同时出现多个符号,大多数是甲类符号的排列,还有一些或以甲类符号为主,夹杂着乙类符号;有或以乙类符号为主,夹杂着甲类符号。下面我们还会谈到。西安半坡遗址发现于60年代,遗址中发现的刻划符号不久就引起了讨论,很多人把它们跟汉字起源联系起来。不少文字学家都发表意见,认为这些符号就是最早的汉字。1969年,李孝定发表《从几种史前及有史早期陶文的观察蠡测中国文字的起源》一文,最先提出“半坡陶文是已知的最早的中国文字,与甲骨文同一系统”观点的论文。1979年,李孝定又发表《再论陶文和汉字起源的发展》一文载《中央研究院历史语言研究所集刊》第50本,1979年。,重申前一篇文章的主张。1972年,郭沫若发表《古代文字和汉字起源问题》一文(载《考古学报》1972年第期)。1973年,于省吾发表《关于古文字研究的若干问题》(载《文物》1973年第2期),还专门对半坡陶文作了考释,并肯定地指出“这种陶器上的简单文字,考古工作者以为是符号,我认为这是文字起源阶段所产生的一些简单文字。”大汶口文化陶器上的符号,是乙类符号的代表。同样有不少学者认为是文字。70年代末大家对这些符号的性质曾经进行过激烈的讨论。参看《大汶口文化讨论文集》中所收的唐兰、于省吾、高明等人的文章,齐鲁书社,1979年。但是,无论是甲类符号还是乙类符号,都有不少学者认为全都不是文字。大多数学者的意见都是游移不定的,具体对于哪些符号是文字,哪些符号不是文字,彼此往往还有很显著的差异。直到现在,学者们还没有达成统一的意见。看来,这方面的争论还要持续下去。不过,以往的讨论已经把汉字起源的研究推进了一大步,过去许多错误的观念得到了纠正,大家至少在某些问题上已经达成了共识,关于文字起源的理论也逐步完善,汉字形成的过程也大致有了一个比较清晰的轮廓。下面我们就来介绍一些情况。首先,大家在讨论中逐渐认识到,要判定一种符号是否为文字,必须看它是否记录了语言。裘锡圭先生在1978年首先提出在讨论有关文字形成过程的问题时要区分“记号”与“文字”。裘锡圭《汉字形成问题的初步探索》,《中国语文》1978年第3期。后来,汪宁生、姚孝遂、高明都提出了跟裘锡圭相似的观点汪宁生《从原始记事到文字发明》,《考古学报》1981年第1期;姚孝遂《古文字的符号化问题》,《古文字学论集初编》,香港中文大学出版社,1983年;高明《论陶文兼谈汉字的起源》,《北京大学学报》1984年第6期。。在讨论汉字起源问题的早期阶段,大家往往通过简单的形体比附来认定符号就是汉字。例如对于甲类符号,于省吾先生就把15
分别释作五、七、十、二十、示、玉、矛、艸、阜等。随着讨论的深入,这种简单的形体比较的做法就被抛弃了。大家发现,不同地域、不同时间、不同文化都可能出现这些同样的符号。例如符号×,古汉字用来表示“五”,纳西族的东巴文和海南黎族的刻竹用来表示“十”,云南的哈尼族曾用来表示“五十元”,傈僳族曾用来表示相会的意思,古代巴比伦曾用作所有权的标记,汪宁生《从原始记事到文字发明》,《考古学报》1981年1期,参看12页、15页、23页的相关介绍。古埃及的圣书字用来表示“划分”。现代人则用“×”来表示“否定”之类的意思。裘锡圭《究竟是不是文字——谈谈我国新石器时代使用的符号》,第28页,《文物天地》1993年第2期。可见同样使用“×”这个符号,有的是当作文字来使用的,有的则根本不是文字。如果只是通过简单的形体比较,就认定某一些符号是古汉字,那么,就无法解释不同时间或不同地区甚至根本没有文字的人也使用这种符号。因此,简单的形体比较的方法比较有随意性,正像人们对于西安半坡的刻画符号一样,虽然有人把它当作汉字,但是也有人却认为它们是古彝文。李乔《再次证明半坡陶文是古彝文始祖》,《贵州民族学院学报》1992年第1期。有人认为这些符号在不同地域出现,很可能表明它们是作为文字传播到各处的。这也是没有根据的猜测。我们却很难想象,在原始人那样的生活环境之下,相隔很远的地区之间能够互相交流,并且能够相互学习文字。可见这种看法也是似是而非的。要避免随意比附的做法以及由此而带来的各种错误的看法,就必须坚持文字是记录语言的符号这个原则。裘锡圭先生指出:新石器时代刻划符号跟古汉字是两种不同系统的符号。古汉字是古人记录当时语言的符号。我们不能因为前一种符号跟古汉字里形体比较简单的例子或某些经过简化的形式偶然同形,就断定它们之间有传承关系。对于前一种符号,迄今为止还没有人能提供坚实的证据能证明它们记录了语言。而且,我们对新石器时代种族的情况了解得很少,对语言的情况几乎完全不了解。把使用者的种族和语言情况都还不清楚的那些符号看作古汉字或其前身这件事,本身就是不妥当的。裘锡圭《究竟是不是文字——谈谈我国新石器时代使用的符号》。由此可见,我们同样不能根据商代前期、西周时代陶器上可以出现的单个陶文,就反推新石器时代的刻划符号就是文字,因为这是两个不同的系统。有人看到甲类符号多出现在中国的西部,乙类符号多出现于中国的东部,因而提出汉字起源的“二元说”。杨建芳《汉字起源二元说》,《中国语文研究》第3期,1981年10月。这种观点也没有道理。在文字体系的形成过程中,为了使文字具有可接受性,一般要求字形跟所代表的词有某种内在联系。几何形符号跟语言中的大部分词语不可能有内在联系。所以基本上使用甲类符号的原始文字是不可能存在的,除非是在周围先进民族成熟的文字的影响下产生的原始文字。我们新石器时代的甲类符号显然不会是这样的原始文字。跟新石器时代的甲类符号同类的符号,在汉字形成之后的很长一段时期内,还在我国有些地区作为非文字的符号而继续使用着。这是这类符号不是原始文字的一个旁证(参看高明《中国古文字学通论》35-36页)。裘锡圭《究竟是不是文字——谈谈我国新石器时代使用的符号》。对于乙类符号,由于外形很象具体的事物,人们很容易把它跟文字联系起来。其实这也是一种不太正确的做法。人类从很早的时候就有了比较高超的绘画技术。就在法国和西班牙发现的原始壁画来看,至少在2万多年前,人类已经能够非常概括地表现动物的形象、生动地表现狩猎活动,并且创造了几何形符号。李万福、杨海明《图说文字起源》第54页。有时候,我们即便看到了原始人所画的乙类符号跟古汉字在外形上是一样的,也无法断定这些符号就是更早的汉字。因为我们仍然找不到它们有记录语言的任何证据。因此,现在就说大汶口文化、良渚文化的乙类符号是文字,恐怕还为时过早。15
总之,单个出现在器物上的甲类和乙类符号都还没有用作记录语言的证据,很难把它们看成文字。就目前的研究情况来看,这应当是一种比较正确的态度。有人曾对判断符号是否文字的标准提出过异议。他们认为,陶器不是文字书写材料,在上面写东西也不是为了传播。当时必定有通行文字书于竹木之上,只不过早已腐朽,现在看不到了。陶器上的记号多半是一器一字,很少有词组和句子,这是陶器记号的特质,这跟能否记录语言或当时有没有记录语言的文字无关。因此,以是否记录语言作为标准,而把陶器上的符号排除在文字范围以外,是不合理的。上引李孝定《再论》一文,第461页;又见上引陈昭容文第700-70页。葛英会《筹策、八卦、结绳与文字起源》也持类似的观点,文载北京大学古代文明研究中心《古代文明研究通讯》第13期,2002年6月。这实在也是一个无法证明的推测。我们无法理解,为什么已经出土的那么多的陶器、陶片或其他物品,大多数都刻划或绘写的都是甲类符号,而且它们一般也是单个出现的?由于单个符号很难鉴别其是否记录了语言,有的学者就比较注意一些排列成行的符号。1975年江西清江吴城商代遗址第一次到第三次挖掘出土的陶片上的符号(包括石刻的符号)以及1978年发表的第四次发掘出土的陶片上的符号,数量多,有的是以排列成行的形式出现的。汪宁生认为吴城陶片上这些符号“能记录语言的文字”,有别于个别出现的陶器刻划记号。见上引汪文《从原始记事到文字发明》。这给鉴别符号是否文字提供了一个新的角度。截至目前,新石器时代排列成行的符号已经发现了好几批。参看裘锡圭《究竟是不是文字——谈谈我国新石器时代使用的符号》、李万福《汉文字学新论》(重庆出版社,1998年)、魏晓明、汪清《汉字产生时代的历史考察》,《安徽史学》2000年第4期;饶宗颐《符号、初文与字母——汉字树》(上海书店出版社,2000年)第44页、48页、56页对这些排列成行的符号都进行了列举,可以参看。大部分的例子多见于良渚文化(年代约为公元前3300至公元前2200年)的陶器上。比较有代表性的如70年代在江苏吴县澄湖古井群中发现的一件鱼篓形贯耳黑衣陶罐,腹部刻有四个符号。80年代在余杭南湖发现的一件黑陶罐,“烧成后在肩至上腹部位按顺时针方向连续刻出八个图案”。(图五)据余杭县文管会《余杭县出土的良渚文化和马桥文化的陶器刻划符号》第184页图五,《东南文化》1991年5期。此外,龙山文化遗址也曾出土过这一类符号。例如1991年至1992年山东大学考古实习队在邹平丁公1235号龙山文化晚期灰坑中发现一块陶盘底部残片,上面刻有排列成五行的十一个符号(图六)见《中国文物报》1993年1月3日3版。。1993年在江苏省高邮市龙虬庄遗址发掘时,在河边采集到一片磨光泥质黑陶盆口沿的残片,其上有排列成行的八个符号。(图七)见《中国文物报》1993年9月5日。据称该陶片“属南荡文化遗存,即王油坊类型龙山文化迁徙到江淮东部的文化遗留,其年代约为龙山时代末至夏初,比丁公陶文略晚。”张敏《从史前陶文谈中国文字的起源与发展》,《东南文化》1998年第1期,第47页。学者们对这些排列成行的符号都很重视。李学勤先生认为,反对新石器时代符号是原始文字的学者“所持主要理由之一就是符号单个孤立,无法知道是否具备音、义等文字的基本性质”。他认为“良渚文化陶器上多个成行符号的出现,有可能祛除这样的疑难”。《考古发现与中国文字起源》,《中国文化研究集刊》2辑108页,复旦大学出版社,1985年。裘锡圭先生认为李学勤先生的意见很值得注意,同时指出,良渚文化多个成行的符号,尤其是余杭南湖黑陶罐上八、九个符号排列成行的一例,可能确实反映了用符号记录语句的认真尝试。也就是说,它们非常可能已经是原始文字了。但是,裘先生也指出:遗憾的是由于材料太少,并由于我们对良渚文化主人的种族和语言情况缺乏了解,正确辨释这种原始文字的可能性恐怕很小。裘锡圭《究竟是不是文字——谈谈我国新石器时代使用的符号》。图五 余杭南湖黑陶罐上排列成行的符号15
图六 丁公遗址陶片上的符号图七 龙虬庄约5000-5000年前的符号不过,也有学者认为,排列成行的符号也完全可能不是文字。李万福和杨海明认为,民族学材料告诉我们,许多线式符号根本算不上文字。我们在探索文字起源的时候,一刻也不应忘记这一点。《图说文字起源》第142-143页。他们列举了好几例排列成行的符号,但都可以肯定不是文字。其中一例摘自格罗塞的《艺术的起源》一书(红旗出版社,1997年,第137页):这是一幅挂在阿拉斯加猎人门上的画,猎人要告诉人们这样的意思:我坐船照这个方向到岛上去,我要在岛上睡一晚,又到另一岛上,睡两晚。我希望杀死一头海狮才回家。阿拉斯加人根本没有文字,但是也用排列成行的符号来表意。看来,对于上面所提到的新石器时代的排列成行的符号,要确定他们就是文字,还需要别的证据。上面我们简单介绍了在探讨汉字起源的过程中,人们逐渐对判定符号是否为文字的标准有了比较清醒的认识,这应当就是一种进步。与此同时,大家基本上也都认识到,文字的形成需要一个过程。这个过程的终点就是完整的文字体系的形成。在完整的文字体系形成之前,已经产生的文字通常只能记录语句中的部分词语,并且往往跟图画式的表意手法夹杂使用。有人把这种不成熟的文字称为原始文字。裘锡圭《文字学概要》第1页。15
从仅仅用符号来表示一定的意义到用符号来记录语言,这是一种质的飞跃。我们前面谈到甲类和乙类符号,认为它们很难看成文字。但是,这并不是说它们没有意义。仅从这些符号出现的位置来说,就很值得注意。例如仰韶时期陶器刻划符号的习惯非常固定,多施于钵形器外口缘黑色宽带纹上,一器一个符号,多数在陶坯入窑前刻划,烧成后再刻者较少。陈昭容《从陶文探索汉字起源问题的总检讨》对符号出现的位置有较多的总结,可以参看。这无疑说明这些符号有一定的意义。有人已经指出,新石器时代的甲类符号里至少应该包含用来区别器物的使用者或制造者的符号和记数的符号。刻在大汶口文化文化陶尊上的乙类符号可能有两种用途。有的用作性质接近后世的族氏或人名的标记,有的用作器主或其所属之族的职务或地位的标记。在同一个陶尊上出现的两个符号也许是分属这两类的。裘锡圭《究竟是不是文字——谈谈我国新石器时代使用的符号》。虽然这样,还应该指出,有一定意义的符号却不一定是文字,即使在较早的时候,这种方式的使用很可能促使人们学会了用符号来记录语言。当人们认真地用符号尝试着记录语言时,原始文字才会产生。可以设想,在古代中国偌大的范围之内,原始文字很可能并不止一种。各地区不同的人群完全有可能分别创造出多种的原始文字来记录自己的语言。李学勤先生曾把南湖黑陶罐上的符号当作原始文字加以考释,并“倾向于这种符号是汉字先行形态的假说”。但是他同时又指出,这件陶罐上的符号“虽然多个成行,仍有属于文字画的可能”,并说:“我们还必须承认,中国境内存在的古代文字,绝非都是汉字,或与汉字直接有关。……良渚文化的刻划符号也可能是文字,但又同商周文字无关。”李学勤《考古发现与中国文字起源》,《中国文化研究集刊》2辑第109页,复旦大学出版社,1985年。这些意见非常重要。裘锡圭先生也曾指出:“1936年发现的良渚豆盘上的符号,作风跟南湖黑陶罐等器上的符号显然不同,但也是多个成行的。这会不会是良渚文化的另一种原始文字呢?”裘锡圭《究竟是不是文字——谈谈我国新石器时代使用的符号》。原始文字的发展前途应当是多种多样的,并不见得原始文字都一定会发展成为完整的文字体系。有的原始文字可能还没有发育成熟就死亡了。有的原始文字很可能会在某一范围或某一行业中使用而变得非常特别,最终的命运也是推出历史舞台。参看裘锡圭《究竟是不是文字——谈谈我国新石器时代使用的符号》对丁公陶文的分析。有的原始文字虽然被使用很长时间,但始终没有形成完整的文字,例如我国云南省的纳西文字,其使用的时间相当长,但是长期一直处于原始文字的阶段而没有成为完整的文字体系。此外,从理论上讲,最后所形成的完整的文字体系,可以是从以前的某一种原始文字直接发展而来,也可以是以某一种原始文字为主,综合其他一些原始文字而来的。具体对于汉字来说,也存在两种可能,一种是我们可以找到它所从来的原始汉字,另一种则很难找到这个直接的源头,因为它很可能是“综合”而来的。因此,我们在为寻找原始汉字时,似乎应该把眼光放宽一些,不必仅仅从形体上来给古汉字找到更早的源头,而应该充分考虑到原始文字的复杂情况。从原始文字到完整的文字体系,又是一次质的飞跃。促使这种飞跃的条件到底是什么呢?近年来人们越来越清楚地认识到,必要的社会条件是形成完整的文字体系的主要因素。社会条件其实包括两个方面,一方面指社会对文字的需求程度,一方面指社会发展的程度。这两个方面是密切相关的。一个社会的发展程度越高,它对文字的需求就越高。当一个社会发展到有强大的国家机器和人口密集的城市,这个社会的统治者势必就要求有一套完整的文字体系来加强统治。参看卢丁《汉字的起源及早期发展》,《四川大学学报》1991年第3期;李万福《汉字起源问题览要》,《重庆教育学院学报》1992年第4期;李万福《汉文字学新论》第85-86页;李立新《“河图洛书”与汉字起源》,《周易研究》1995年第3期;李先登《试论中国文字之起源》,《天津师范大学学报》1985年第4期。15
回过头来看,原始文字的产生所要求的社会条件应当要比完整的文字体系的形成所要求的社会条件少。某一个氏族甚至某一个人在一定的时候都可能尝试着用符号记录语言。一旦这些记录语言的符号得到一定范围的使用者的同意,就应当具备了文字的条件。但是,这种原始文字可以都跟后来已形成完整的文字体系有直接的渊源关系,也可以没有这种关系。因此,重新检验前面所举的新石器时代的各种符号,结合这些符号出现的社会条件,我们会发现:在各类新石器时代的符号中,从外形上看,大汶口文化乙类符号虽然还不能断定为原始文字,但却是我国已发现的最像古代象形文字的一种符号。从有些符号在并非出于一地的遗物上并且不止一次地出现的情况来看,这种符号的稳定性显然也是相当强的。它们无疑可以看作原始文字的先驱。在大汶口文化晚期,生产相当发达,社会的贫富分化也已经相当显著,原始文字开始出现的可能性并非完全不存在。如果汉字形成的过程接着开始的话,那些乙类符号的大多数应该是会转化成文字的。大汶口文化分布的地域接近古代中国的中心地区。有些大汶口文化乙类符号的作风,跟古汉字确实很相似。看来这种符号虽然不见得是原始汉字的前身,但是很可能曾对原始汉字的产生起过某种影响。再从符号排列的方式看,上面所举的排列成行的新石器时代的符号,也跟后来的汉字在形式上最为接近,虽然难以肯定它们就是原始汉字,但其中也许就包含着当时人用这种符号来记录语言的认真尝试。其出现的时间都跟大汶口文化的时代相差不多,当时文字起源的社会条件已经具备。因此,虽然它们不一定就是汉字的前身,但应当承认它们对汉字的形成也有过影响。大汶口文化晚期的年代约为前2800至前2500。这样看来,也许我们可以推测,汉字形成过程开始的时间就在公元前第三千年的中期。参看裘锡圭《汉字的起源和演变》第138页相关的论述。最后,我们还应该指出,一定的社会条件确实是文字形成的必要条件,但是要使已经发明的原始文字发展成为完整的文字体系,仅仅有这样的社会条件还是不够的,至少还必须有另外两个条件。其一,要在这个社会上有一群独立的、脱离体力劳动的知识分子;其二,在这个社会中使用的语言应当比较容易用符号记录下来。只有这些条件都具备了,完整的文字体系才会形成。具体情况请参看李万福、杨海明《图说文字起源》第五章。二、殷墟甲骨文在汉字发展中的重要地位此节的撰写主要参考了裘锡圭先生的几种论著:《文字学概要》,商务印书馆,1988年;《汉字的起源和演变》,载《中国古代文化史(一)》,北京大学出版社,1989年;《殷墟甲骨文在文字学上的重要性》,《古文字学论集》,东文选(韩国),1996年;《从文字学角度看殷墟甲骨文的复杂性》,载《中国学研究》第十辑,淑明女子大学中国学研究所,1996年。请注意以下几个方面的问题:殷墟甲骨文是探讨汉字起源最有根据的材料完整的记录语言文字的结构文字的排列方式保留原始文字的痕迹夏商之际汉字体系的形成在第一节中,我们介绍了新石器时代的刻划或绘写的符号,由于目前大家对这些符号的性质还存在比较大的分歧,因而很难肯定这些符号就是汉字的前身。除此之外,还有一些学者认为有为数不太多的属于夏代的“文字”,但是,其性质也很难肯定。商代前期的文字,目前发现的也很少,还不足以形成有价值的研究资料。商代晚期的铜器铭文大都比较简单,多数只有一至五六个字,最长的也不过四十余字。见于陶、石、玉、骨、角等物品上的文字也很少。因此,在能反映当时文字面貌的可靠的古汉字资料里,商代后期的殷墟甲骨文仍然是时代最早的成系统的资料。有的学者甚至认为:“我们只能从甲骨文字的本身去推求它究竟已经有了多少年的发展历史。”陈梦家《殷虚卜辞综述》第75页,中华书局,1986年。由此可见殷墟甲骨文不仅可以反映汉字体系较早的情况,而且也是我们探讨汉字起源最有根据的材料。15
自1899年甲骨文发现以来,出土的有字甲骨拓片约有六万片左右。如以平均每片十字计,总字数已达六十万左右。其他各种先秦古汉字资料,在数量上都比不上甲骨文,由于殷墟甲骨文的时代既早,数量又多,它在汉字史上的重要性非常突出。从殷墟甲骨文来看,当时的汉字无疑已经形成完整的文字体系了。甲骨文所反映的内容大多数是商王及其贵族进行占卜的记录,只有很少一部分是一般的记事刻辞。由于商代统治者非常相信占卜,很多事情都要通过占卜来了解吉凶。因此,当时社会生活的很多方面在甲骨文中都有所表现。例如战争、祭祀、农业、天气、未来十天的吉凶,乃至生育、疾病、做梦等等事情都在甲骨文中有不少记录。殷墟甲骨文的单字数量已达四千左右。甲骨文单字的统计,据李宗焜《甲骨文字表》,北京大学博士学位论文,1995;沈建华、曹锦炎《新编甲骨文字形总表》,香港中文大学出版社,2001年。有人推测当时人也应当有简册之类的书写材料,一般也应当是用毛笔在简册上面写字的。甲骨文中的“册”字就象把简册编连起来的样子(看《甲骨文编》电子版87—88页),有人还认为某些甲骨上的卜辞是从简册上面抄写来的。张世超文。估计当时人平时所使用的字的总量跟甲骨文不会有太大的出入,当在4000至5000这个范围之内。商代以后,各个时代一般使用的汉字字数大概也在这个范围之内。见裘锡圭《文字学概要》。由此可见,当时人利用四五千个文字是完全可以把自己的语言记录下来的。在商代,有一个庞大的“贞人”集团为其统治者服务。这些人往往代替商王或大贵族主持占卜。甲骨学者认为,贞人不一定就是在甲骨上刻字的人。但是,可以推想,这些贞人也一定精通文字,他们所书写的文字一定在其他材料上面,可惜没有被保留下来。这也说明,当时掌握文字的人一定也不在少数。甲骨文的刻写,不同时期、不同类别都显示出娴熟的技巧和多样的风格。这反映出刻字者一定受过比较严格的训练,并经过长期的锻炼而形成了各自不同的风格。有的甲骨上面,在熟练的字迹旁边,还有稚嫩的“习刻”文字,可以想见当时老师言传身教的情形。从文字构造来看,甲骨文中既有大量的象形字和会意字,也有大量的假借字,还有不少的形声字。甲骨文里的象形字,有些已经很不象形了。有很多动物字,已经跟动物的原样有了一定的距离,不容易一下子看出是什么动物了。例如就是“犬”(电子版405页),就是“豕”(388页),就是“牛”(32页),就是“羊”(181页)。“犬”和“豕”的区别主要在身体和尾巴,“犬”的身体较“豕”瘦,“犬”的尾巴是上翘的,“豕”的尾巴是下垂的。“牛”和“羊”则只画出头部来代表,而且,头部的形状也很简略。其他如(刀)就不像一把刀(199页),(示,5页)也跟“神主”有相当大的距离,如果不经过古文字学家的考证,一般人是不可能知道的。现存的甲骨片上的字,大多数是用刻出来的。据分析,当时人平常也应当用毛笔书写文字。“筆”字本从“聿”,甲骨文写作(128页),正象手持毛笔写字的样子。在坚硬的龟甲或兽骨上面刻字比较吃力,为了提高效率,刻字的人就不得不改变毛笔字的写法。这也使得很多字更不象形了。甲骨文中假借的方法也使用得非常普遍,例如本是一种竹编盛物之名“箕”的象形字,却常被借用来表示音近的语气词“其”。象高冠美羽的鳳鸟,却被借来表示“风雨”的“风”。本是当鸟虫翅膀讲的“翼”的象形字,却被借来表示“翌日”的“翌”。这些字记录的都是极为常用的词。对于很多不容易为它们造表意字的词,商代人通常就用假借的方法来为它们配备文字。15
甲骨文里还有不少形声字。形声字既有指示字义的偏旁,也有表示字音的偏旁。在使用意符、音符的文字里,尤其是对于记录以单音节语素占优势的汉语来说,这是一种最适用的文字结构。甲骨文中的形声字在整个文字体系中还不占优势,但是后来形声字产生的方式都已经出现。一种是在假借字上加意符。这是为了克服假借所引起的字义混淆的问题,因为一个字既用来表示本义所代表的词,又用来表示跟它音同或音近的词,在具体的环境下有时就难以辨别它到底表示哪一个词。商代人把有些表意字或表意符号用作指示字义的符号,加注在假借字上。例如在上加注“日”造出字,专门表示“翌日”的“翌”。另一种是在表意字上加注表示读音的偏旁,使它们跟所代表的词的联系更为明确。例如在上加注(凡)而成为,因为古音“凤”和“凡”音近,“凡”可以表示“凤”的读音。有时候,甲骨文里还能发现“省声字”。例如甲骨文中的“”字,裘锡圭先生指出它“是一个从‘犬’从‘’省声的字。”“‘’是‘埶’的本来写法,后来繁化为‘蓺’,古书多写作‘艺’。”裘锡圭《释殷墟甲骨文里的“远”“”(迩)及有关诸字》,《古文字论集》第1-10页,中华书局,1992年。又如甲骨文里有一个字,有的学者指出,这个字就是“膏”字,本从(高)声,但在此字中“高”字已经被省去了“口”旁。甲骨文里这个字还有不省的形体,写作。参看黄天树《略论甲骨文中的“省形”和“省声”》,待刊稿,2002年。一般来说,“省声字”一般都是由不省的形声字变来的,“省声字”的出现,意味着当时人使用形声字已经有了一段时间了。商代文字的排列形式也有比较严格的规律,已经基本上形成了自上到下、自右到左的布局了,这肯定也不是短时间就能够形成了。这种形式在中国古代长期沿用,一直到20世纪一二十年代才被自左向右的横行文字取代。甲骨文中有些字为了适应直行排列的需要,已经改变了字形迎来应有的方向,如上面所举的犬、豕等字都变成脚腾空尾着地了。除了直行排列要求这些字不能在横向占用太多的位置以外,有人推测形成这种样子也许是受了当时一般是在简上书写的做法的影响。游顺钊、李学勤《亚文》文章。不仅表示动物的字是这样,有些比较复杂的表意字也都采用了这种方式。例如宿、疾、梦等字,甲骨文分别写成、、,其实“宿”本象人睡在屋里的簟席之上,“疾”表示人躺在床上因生病而痛苦流汗,“梦”表示人躺在床上手舞足蹈做梦的样子。甲骨文把它们都写得竖立起来,看不出人躺着的样子了。董作宾《从么些文字看甲骨文》,第585页,载《中国现代学术经典·董作宾卷》,河北教育出版社,1996.10.殷墟甲骨文在记录语言方面是很忠实的。这从使用否定词的情况就可以看出来。见于殷墟甲骨卜辞的否定词,有“不”,“弗”,“勿”,“毋”等好几个。它们大致可以分为“不”和“弗”以及“毋”和“勿”两组,这两组在意义上的区别一般人还能分辨出来,但是这两组内部各自的区别连现在的语法学家都说不清楚。如果甲骨文记录语言不是很重视的话,就不会有这种情况。又如下面一条卜辞:辛卯卜,彡酒其又(侑)于四方。《合集》30394命辞中的“其”刻在“酒”和“又”之间,位置和大小跟全版其他字都很不协调,显然是补进去的。“其”字一个虚词,在古汉语以及卜辞中,一句话的主要动词前面,往往可以加“其”,也可以不加“其”,二者在语义上的区别,现代人不容易感受到。但是,这一版卜辞却特地把“其”补刻进去,不仅说明了“其”在语义表达方面一定有它的作用,也说明了记录卜辞的人对于文字记录语言的作用有比较认真的态度。从以上各种情况来看,甲骨文所代表的汉字,不仅能够完整地把汉语记录下来的,而且在某些方面已经相当成熟,这说明汉字发展到商代晚期应该已经有了一段时间了。但是另一方面,在殷墟甲骨文里也还保留着一些比较明显的原始文字的痕迹。首先,从整个文字体系来说,形声字的数量还不像后代那样占多数。有人统计,甲骨文中的形声字大概只占整个文字的20%多。李孝定文。这跟甲骨文中还存在着比较多的表意字是相关的。虽然甲骨文中有不少字已经变得不太象形,但是表意字的构成仍然带有比较原始的“图画”15
性质。例如,表意字构成成分经常使用一些象形符号,有的象形符号从来不能单独成字。例如(射)字有手形和弓箭形构成,其中箭形不能单独成字,又如(立)字中象人所站立在地上之形,上面即正面的人形,下面表示地面。正面的人形单独成字就是“大”字,但在这个字里面却只能理解成一个人的形状,而不能当“大”来理解。表示地面的“一”形则从来不能单独成字。另外,合体字构成成分的相对位置具有较强的表意作用。构成成分相同,但位置不同,就可能是两个不同的字。例如“伐”和“戍”分别写作、,它们所用的构成成分都是“人”和“戈”,但是“戈”加之于人脖子上就是“伐”,表示的是“砍头”的意思;戈架于人之肩上就是“戍”,表示的是“扛着戈去戍守”的意思。这两个字到了小篆已经变成伐和戍,就不容易看出它们区别了。又如“妇”、“乳”、“毓”三个字都跟女人有关,但甲骨文中“妇”作,所从的“女”作,跟单独写的“女”字一样;而“乳”作写成,其中的既跟不一样,也跟不一样。其中的“子”作形,跟一般的“子”作形的写法也不一样。至于“毓”字则写作,所从的跟“妇”、“乳”等所从的“女”都不一样。“子”也写成倒形,表示生孩子时头是先出来的。此段文字参考了林澐《关于甲骨文“字素”和“字缀”的一些问题》,《中国古文字研究》第一辑,吉林大学出版社,1999.6。这些构成成分之所以写得不一样,都跟甲骨文表意字比较原始的特点有关。因为足以表现母亲哺乳孩子的样子,则表明女人生孩子跟平时跪坐的样子(即所象的样子)不同,至于“妇”的“女”旁大概只是一般的形旁,表示这个字的意思跟女人有关,并无特殊的含义,所以就写得跟单独成字的“女”字一样了。“毓”和“乳”中的两个“子”形写得不同,也都是为了更加象形。汉字发展到后代,“已基本上成为由数量不太多的基本造字单位以一定的结构方式组合的符号体系了”引自上引林沄文。,甲骨文中那些象形性原则就被抛弃了。其次,甲骨文中有些表意字的字形有时随语言环境的变化而变化。有的学者指出,通过观察一些尚未形成完整体系的原始文字,可以推测这是比较原始的现象。例如:中国云南省纳西族(即么些族)使用过的一种原始文字,把“吼”字写作,在牛头的嘴前方加象征吼声的线条以示意。在这种原始文字里,如果要表示“马吼”的意思,不必在“吼”字上加“马”字,只要把“吼”字中的牛头改为马头就可以了。甲骨文里也有类似现象。例如:甲骨卜辞里时常提到对祖先举行进献事物的()祭。“”在古书里多作“登”。《礼记·月令》说“农乃登麦”,“农乃登黍”,郑玄注:“登,进也。”甲骨文“”字象两手捧着一种称为“豆”的盛食物的器皿,有时还加上“示”旁写作“”,表示向祖先的神主进献食物。如果登祭所用的食物是鬯(一种香酒),“”字就可以改写为“”,两手所捧的“豆”为“鬯”所取代。卜辞里既有“鬯”,“新鬯”,也有“鬯”,“新[鬯]”,看来“”仅仅是“”字有特殊用途的一个异体。但是在汉字发展的较早阶段,“”应该是直接用来表示“(登)鬯”的,就跟纳西文“吼”字的牛头改为马头以后可以用来表示“马吼”一样。到了甲骨文时代,这种比较原始的用字习惯基本上已被抛弃,但是“”则作为“”的一种异体而保存了下来。卜辞里偶尔可以看到后面没有“鬯”字的“”字,也许仍然是用来表示“登鬯”的。此外如象畜牛羊于栏的“牢”字,卜辞里用来指太牢的时候通常写作“牢”,指少牢的时候通常写作“”(古代以牛为太牢,羊为少牢),也是同类的现象。在晚于殷墟甲骨文的汉字里,这类现象基本上就看不到了。裘锡圭《文字学概要》。第三,甲骨文中还有一些现象跟原始文字的特点是相同的。裘锡圭15
先生最早指出,在埃及圣书字、楔形文字、纳西文、古汉字等古老文字中有一个相同的现象,语音并不相近的两个或几个不同的词,可以用同样的字形作为它们的表意字。例如在纳西原始文字里,象空气流动的“”字,既代表“风”这个词,又代表“春季”这个词,因为春天常常刮风。这其实会影响文字表达语言的准确性,是一种比较原始的现象。我们在殷墟甲骨文也可以看到一些例子。例如在相当多的甲骨卜辞里,“月”和“夕”的字形并无区别,“”也可以代表‘夕”,“”也可以代表“月”。在後来的古汉字里,“月”和“夕”作为表意偏旁有时可以通用;作为单字时不加区分的情况虽未绝迹,但已极为少见,跟殷墟甲骨卜辞的情况显然有别。更多的例子参看裘锡圭《古代文史研究初探》263-264页,江苏古籍出版社,1992年。第四,甲骨文中还存在着文字记录的顺序跟语序不一致的现象。这也是原始文字所遗留的痕迹。例如有一条卜辞说:“甲申卜,御妇鼠妣已二”(《合集》19987),卜问用“二”作为牺牲祭祀妣己以祓除妇鼠的灾殃是否可行。“”显然是“牝”、“牡”二字的合文。对于“二”可以有两种理解,一种是“二牝二牡”,一种是“二牛,一牝一牡”。无论是哪一种情况,在这句话里都有必不可少的字没有写出来。也可能写卜辞的人是直接以“二”来代替“一牝一牡”的。那就跟文字与语言相对应的原则离得更远了。此外,不管怎样解释,在这句话里,“牝”、“牡”这两个词都不是直接相连的,但是写卜辞的人却把它们合写成一个“”字。从这个角度来看,“二”也是文字排列不合语序的一个例子。在甲骨文里,卜辞行款比较紊乱的现象也相当常见。在少数商代后期的铜器上,还可以看到铭文排列得很乱的现象,例如在一个大“亚”字里杂乱地填塞着一些族名、祖先名和其他文字,或是把有的字填写在别的字的空隙里。这些现象大概也跟原始文字排列方式的影响有关。从上述这些迹象看来,商代后期距离汉字基本形成完整文字体系的时代似乎也不会很远。现在学者对于形成的时间还没有统一的意见。有的学者主张汉字形成于夏初。孟维智《汉字起源问题浅议》,《语文研究》180年1期106-108页。有的学者认为“中国象形文字出于商代后期(盘庚、武丁以后)的卜人集团”。徐中舒、唐嘉弘《关于夏代文字的问题》,中国先秦史学会编《夏史论丛》127、140页。认为汉字形成于商代的,还有卢丁《汉字的起源及早期发展》,《四川大学学报》1991年第3期;姜可瑜《殷墟文字形成假说》,《文史哲》1992年第2期;孙华《关于汉文字形成的几个问题》,油印稿,中国古文字研究会第五届年会论文;李万福、杨海明《图说文字起源》,重庆出版社,2002年。但他们都没有提出比较可靠的根据。有的学者指出,《尚书·多士》记载西周初年周公对商朝遗民的训话说:“惟尔知,惟殷先人有册有典:殷革夏命。”周公特别强调殷的先人有典册记载“殷革夏命”之事,也许我国就是从夏商之际才开始有比较完备的记事典册的。汉字形成完整的文字体系,很可能也就在夏商之际。我们在第一节说过,原始汉字可能开始出现于公元前第三千年的中期。大约到这一千年的末期,夏王朝建立了起来,我国进入了阶级社会时期。统治阶级为了有效地进行统治,必然迫切需要比较完善的文字。因此原始汉字改进的速度一定会大大加快。夏王朝有完整的世系流传下来这件事,就是原始汉字有了巨大改进的反映,汉字大概就是在这样的基础上,在夏商之际(约在前17世纪)形成完整的文字体系的。裘锡圭《汉字形成问题的初步探索》,已收入《古代文史研究新探》,江苏古籍出版社,1992年。15