再论汉字规范的科学性与社会性——关于制订规范汉字表的思考与建议
发布时间: 2009-09-08   浏览次数:

一、制订规范汉字表的重要性与迫切性
    为了进一步贯彻通用语言文字法,适应高科技社会信息传播的需要,新的规范汉字表正在制订。我在《论汉字规范的社会性与科学性》(注1)一文中这样说过:“先辈们将近100年的苦苦思索和奋力拼搏,许多人为之付出巨大的代价,并没有把汉字问题处理得十分恰当。现在,在一个崭新时代更为复杂的现实面前,要求又这样紧迫,我们能正确把握汉字的现在和未来吗?鉴于语言文字在多方面的重要作用,国家已经颁布了通用语言文字法,“规范汉字”成为法律规定的使用文字,但是,规范汉字具体指的是什么,还没有一个十分明确的范围。规范是一个一旦提出便一泻千里的大冲击波,一管就是几十年。在我们用国家法律职能规定全国人能写什么字不能写什么字的时候,一旦有了失误,不但会影响全国甚至是全世界人在汉语领域的语文生活,还会影响中国文化发展的速度和质量,这难道不令我们有所忧惧吗?”在现时代,怀有这种忧惧的人各阶层都有,这正意味着关心汉字的人越来越多,汉字问题过去是、现在是、将来也永远是汉语世界不能忽视的社会命题。
    回顾汉字规范的历史,自1955年12月文化部和中国文字改革委员会联合公布的《第一批异体字整理表》(注2)开始,汉字已经进入规范阶段。1964年公布《简化汉字总表》(注3)实际上已经规定简化字为中国大陆使用的正字,这是汉字规范跨出的非常关键的一步;接着,在1965年1月公布的《印刷通用汉字字形表》,过细的规定了印刷宋体字的字形。文化大革命使一切有关文化的正常工作停滞下来,直至1988年3月25日,国家语委和国家出版总署联合公布《现代汉语通用字表》,综合了前三项字表的内容,算是对80年代以前关于汉字规范的一个重新认定和总结。这就是说,我们这个社会已经有了半个世纪的汉字规范历史,不能说我们从来没有大家可以遵循的“规范汉字”。但是,这几项规范经过数十年的实践,也发现一些不尽然合理或不够完善的地方。更应当看到的是,语言文字处于社会不断使用的状态中,是随着社会的发展而发展的,语言文字不是一成不变,规范也就不可能一成不变,半个世纪修订一次,为时已经过长。从这个意义来说,新的规范汉字表不是从零开始的,而是对已经施行了半个世纪的汉字规范进行与时俱进的修订、调整和补充。
    如果说,20世纪50-60年代的汉字规范,主要是为了适应文化发展和教育普及的需要,那么,21世纪的汉字规范,除了原有的目的以外,还有一个更为重要的目的,那就是为了适应高科技社会信息传播的需要。在我们国家,印刷早已经告别了“铅与火的时代”,激光照排成为出版的主要手段。户籍、邮政、信贷、金融等行业的信息贮存和检索已经数字化,人名与地名不再依靠手动填写,已经全部进入计算机。过去,普通人名、一般地名用字的范围非常小,取名字采用生僻字的影响离不开自己的生活圈;现在,如果采用了一个计算机字库里没有的字,报名、取钱、发报、贷款……都难以办成。过去,自然科学和社会科学专有名词术语只被科学家和专业人员使用,现在,由于科技知识的普及,技术应用的扩展,大量人才的培养要通过远程教育来实现,科技用字再也不能仅仅由某个行业中的少数人来确定。古籍整理、辞书编纂等用字量极大的工作,都运用计算机技术来进行,缺字和错字直接影响成品的质量和社会效应。众多信息是利用互联网传播的,汉字问题会直接影响汉语信息向全世界传播的速度与信度。总的说,计算机成为人与人交流的重要工具,汉字不但不能有一个两个的差异,连一笔两笔的差异,都会给信息传播带来阻塞,甚至酿成大小不等的事故。除了规范的重要性与日俱增以外,由于姓名、地名、科技用字的规范不容忽视,已经作为规范字的7000通用字的数量也远远不够用了。在这种形势下,不论人们是否意识到,汉字的规范已经是有关国计民生的大事,原有的规范已经不能满足信息传播与高科技传播手段的需要,尽快出台新的规范汉字表已经是迫在眉睫,不作不行了。

二、汉字规范必须遵循科学性
    汉字规范具有两个重要的特点,一个是它的人为规定性,另一个是它在某些社会应用领域不同程度的强制性。先说汉字规范人为规定性的特点。
    汉字是记录汉语的符号,一般情况下,它的产生、发展都是自然进行的。在汉字自然发展的过程中,内在的矛盾不断产生。例如,书写要求构形的简化,释读却要求构形有更多的区别信息,也就是要求繁化,因而构成了简与繁的矛盾,只有简繁适度的造型,才是对这个矛盾的调节。再如,汉字的书法追求变化,使同一字种的不同形体每每产生,而基础教育却需要规整,要求抑制异体字的增多,因而构成了多与省的矛盾,惟有一方面尊重书法的美化,另一方面对教育领域却在变化中求规整,才能调节这个矛盾。又如,汉字的书写是个人行为,个人的习惯带来用字的纷杂,而汉字的流通却是社会性的,社会要求每个字别无二致,因而构成了乱与整的矛盾,只有在社会用字时对个人的习惯加以适当限制,才能调节这个矛盾。汉字在为全民所应用的长期过程中,受到各种内在关系和外在力量的相互制约而产生自组织现象,调节着简与繁、多与省、乱与整的诸多矛盾,适应着社会的需要。汉字内在的结构规律、演变规律、互相关联的规律和自成系统的规律,都是凭借这种自组织力量而存在的,这些规律带有客观性,不是人为的力量能够改变的。但是,尽管有客观规律操纵着汉字的存在与发展,处在某一具体阶段的汉字,从总体看,矛盾的存在是绝对的,平衡则是相对的,自发调节这些矛盾达到平衡的状态需要经过相当长的时间。因此,在一定时期,为了需要必须进行人为的规范时,目的是使汉字内部矛盾的调节在短期内奏效,所以,它必须符合汉字发展的客观的规律,一旦违背了汉字发展和使用的规律,那就必然使文字符号更难使用,更不切合社会的需要,与规范的初衷背道而驰。这就是汉字规范必须遵循科学性的原因。
    实际上,要作到规范的科学性,分寸很难掌握。比如,汉字作为一种记录汉语的符号系统,要受到区别率与简约率的制约,而区别与简约恰恰是一对矛盾,需要在二者之间调适。过去的简化汉字,注意到减少字数,采用了较多的同音替代进行简化,但比较忽略保持区别,减少使用的歧义,因而使新的异词同字情况由于简化而形成,在大规模文本中歧义大量增加。由于简体字与对应的繁体字有不少是“一对多”的关系,在采用计算机简繁自动转换时,产生了因歧义而转错的现象。例如:
①有表(表格)——有表(手表)
②生发——生发(头发)
③下面——下面(面条)
④外面糊纸——面(面粉)糊糊
⑤二十余(多)家——对面余(姓)家
⑥大斗(升斗)进,小斗出——大斗(斗争)特斗
⑦干(gan1)休——干(gan4)休所
⑧六出祁山——六出(齣)戏
……
有人认为,现代汉语以双音词为主,单字组合后,歧义会自然消除,在双音词里消除不了,也可以在具体的语言环境里通过上下文来辨别。持有这种意见的人还认为:古代文言文就有很多因为假借而产生的异词同字现象,发展到今天,也没有产生什么问题,他们认为同音借用完全可以大量应用。同音替代可以使用到什么程度?我们通过实际语料测查的结果,在500万字的语料中,虽然有470多组同音替代字完全可以通过语境来分辨,但是也有将近160组歧义产生。这是因为,产生歧义的单位非常复杂——有短语对短语的,如例①;有多音词对短语的,如例③;还有属上与属下难分的,如例④;更有单音词没有适当语境可以分辨,或即使可以分辨,但借以分辨的词语距离很远的,如例⑤、例⑥、例⑧;即使双音词,也有环境无从分辨的,如例②。如果扩大测查语料,能够分辨的组会增加,但产生歧义的组也还会增加。很多事实表明,同音替代不是不可以用以减少总的用字量,但需要非常慎重。至于用古代文献中的假借字来与今天的同音替代类比,也不可以简单化。
    首先,汉语词汇意义的数量是随着人类的认识发展而无限增加的,但记录词汇的汉字的字数却不能无限增多;因此,在汉字造字时,就有了增字之法与节字之法互相调节的现象。章太炎先生在谈到“转注假借说”时指出:
“转注者,繁而不杀,恣文字之孳乳者也。假借者,志而如晦,节文字之孳乳者也。二者消息相殊,正负相待,造字者以为繁省大例。” (注4)
对章太炎的说法,陆宗达先生有一个浅显的说明:
“(文字)的发展变化有两种法则:一种是由于社会制度改变,或者由于生产、文化、科学等等的发展,需要创造新词来表达新的词义……从造字来讲,也就要循其声义,各为制字,这就是‘转注’造字的法则。另一种是由于文字孳乳日繁,必须加以节制。新的词义产生了……可以利用旧有的词和字而赋予新的词义,不再制造新字……这就是‘假借’的法则。” 
    可见,汉字发展中字数的调节是通过自组织的渠道自然进行的。有些异词同字现象使用至今也没有改变。例如:
“容纳”与“容貌”共用“容”字;
“花卉”与“花钱”共用“花”字;
“举国上下”与“举起”共用“举”字
……
古往今来,汉字的同音借用产生的异词同字现象,可以经过调节通过语境、频率、读音等因素加以区别,很多是不会妨碍书面表达的。认为同音借用完全违反科学性,是不符合汉字应用的事实的。但是,假借现象虽然存在,也是不能违背区别率而无限增加的。在古籍里,很多同音借用字又用增加偏旁的方法产生借义分化,就是对异词同字现象的一种限制。例如:
    “舍”本义为“房舍”字,借为“舍弃”字,后来产生“捨“字;
    “开辟”、“逃辟”、“偏辟”原来共用“辟”字,后来分化出“闢”、“避”、“僻”三形;
    “商贾”与“贾值”共用“贾”字,后来分化出“價(价)”字;
     ……
这些后出本字,就是在区别率的制约下,对汉字假借的控制。所以,即使在古代,同音借用也不是一律无碍,也要在发展中自动调节。汉字在文言文里的异词同字现象,经过两千多年的语言文字自组织调节,已经逐渐从多方面找到出路:有些产生了后出本字而分化,有些另造了新字而分化,有些因为形成了双音词而分化,留下来的经过协调,不会造成严重歧义了。而简化汉字是用人为的手段在极短的时间来代替这种历史长河中的自然协调,而且带有强制使用的性质,如果不遵循科学性,就会造成汉字使用中的极大不便。使用同音借用来求得笔画和字数的减少,首先要作到研究和实验,可以采用但必须慎重,对增加异词同字可能产生的歧义事先应当测算统计,这样才不会为了减少笔画和字数在表达上产生新的负面效果。
    正是由于上述情况,主张对同音替代的汉字恢复一部分繁体字的呼声,一直非常高,这些呼声是对规范科学性的合理要求,是完全应当听取的。但是,前面说过,同音替代并不是全都不合理,不是绝对不能使用,而且对减少总字量又有积极的作用,即使恢复繁体字,恢复多少、恢复哪些,也要经过科学测查。汉字是一个整体,牵一发而动全身,在全民已经使用简化字半个世纪以后,感想式的任意恢复一部分繁体字,也是违背科学性的。
    总之,规范的初衷就是使汉字更好用,更符合社会的需要,科学性才能保证这个目标的实现。

三、充分重视汉字规范不同领域的社会应用性
    汉字规范的第二个特点,是它在某些社会应用领域具有强制性。汉字规范一旦公布,就要对一些领域产生强制性,特别是基础教育、出版印刷、信息处理这三个领域,虽然属于专业领域,但同时也涉及国内和海外学习汉语汉字的所有人群,如何使这些受众使用方便,这不能不是一个出发点。汉字规范需要顾及的社会性,主要表现在这里。
    中国历史上的汉字规范有两种情况:一种是权威的学术规范,它是由一些影响较大的学者通过他们的著作来实现的。另一种是权力的强制规范,它是通过政治力量来对汉字的应用规则作出硬性规定的。前者靠合理性来说服用字者采纳,仍然属于对汉字的自然调节。许慎所作的《说文解字》,因为全面地反映了汉字的形义系统,客观地解释了经典用字,在汉代以后为学界所推崇,所起的作用大致属于这一类。后者则一旦发布,就进入人为的管理,在某些领域具有强制性。例如唐代的《干禄字书》等字样书,就规定了正字必须使用的范围——公文、科举、颂状等用字,是被控制而带有强制性的。这种规范一旦实行,就会成为社会用字的现实,使用者从不习惯到慢慢习惯,即使其中人为的规定从理论上看有不尽然合理之处,习惯成自然,也就具有了社会性。
    我国50年代以来发布的规范,是属于专家和权力相结合的规范,在方法上是最理想的。半个世纪以来,它不但为广大群众所使用,也被高知识阶层的专门家所使用,已经带有了社会的约定性。如何看待此前的规范?用什么精神来指导这次的修订,存在着三种绝然不同的看法:
    第一种看法认为,以汉字简化为核心的汉字规范,已经施行了将近50年,全社会都已经习惯成自然,计算机的字库也已经基本固定,就不要再改了。他们还举出“象”和“像”中途区分引起的一系列问题,证明一个改动造成社会多少震动,由此认为修改方案会引起社会的不稳定。
    第二种看法认为,汉字简化的政策是为劳动人民着想的,1979年以来提出的问题,例如认为符号替代、简化部件等简化方式没有照顾到汉字的系统,认为同音替代造成的“一对多”现象对汉字的区别率有所违背等,都是那些专门使用汉字的领域与汉字专门家的意见,13亿人中多数人是不会对这些问题有同感的。因此,他们认为不但已有的简化汉字不能更改,还要再进行新的简化。他们说:已经被废止的“第二批简化汉字”还有100多字是好的,应当继续简化。
    第三种意见认为,过去的简化汉字是在半个世纪之前酝酿制订的,在这漫长的岁月里,中国社会发生了极大的变化,制订这些规范的理念本来是适应当时情况的,现在,有些已经不适应了,继续简化显然没有必要。经过如此长时间、大规模的实践,其中不够完善的地方也都显现出来。近20年来,语言文字学术界对这些规范的科学性提出过许多中肯的意见,广大使用者则对这些规定的实用性提出过许多疑问和改进的要求,这些年来,每制订一个新的规范或标准,都会面临上述那些文件不完善的地方。如果我们不尽快调整这些已有的字表,本来为数不多的小疵随着新规范的不断出台累积增厚,就会越来越干扰使用。所以,在新形势面前,重新来审视既往的工作,该改的都改一改,这是对国家和人民都有利的、刻不容缓的事。
    仔细分析这三种意见,可以看到,它们都有一定的合理性;实际上,彼此的分歧仍然是如何处理科学性与社会性的问题,而分歧反映的是社会不同领域对汉字规范的要求。
    仅仅从汉字的内在规律看,科学性与社会性应当没有矛盾。规范越具科学性,就越合理,越好用。但是,在应用过程中,问题并非如此简单。社会性指的是汉字在使用时受社会制约的人文性,语言文字是符号,但不是单纯的数理符号,它是在人文社会中被全民使用着也改变着的符号。汉字的通行度是这种人文性的最主要表现。一种符号系统是否好用,在广大普及领域是以习惯为前提的,对于一般的使用者来说,汉字的需要量并不很多,掌握2500-3500字就可以得到几乎全部的社会信息,也完全可以传达现代人复杂的思想感情。对于这个领域,“习惯成自然”是最现实的原则。但是,汉字还有一个专业领域,这个领域属于大量运用汉字、以运用汉字为主要职业手段的阶层,他们面对各种文本的起草,操作印刷过程,进行汉字教育,从事古籍整理和古文字解读、考据,编写汉字辞书,管理信息系统,建设计算机字库词库,设计汉字的国际编码……这些人为数仅仅是一般汉字使用者的千万分之一,但他们面对大规模文本储存,往往要面对海量的汉字。这些运用汉字的专门领域,对汉字规范的科学性,有着极大的敏锐和要求,因为违背汉字规律带来的不便,只有在大规模汉字的整理和运用时,才会暴露无遗。其实,在普及领域,违背汉字内在规律,也会产生问题,只是因为用字量的有限,处于潜在状态罢了。
    就社会性而言,普及层面与专业层面在使用汉字的根本利益上是没有矛盾的,但他们从自己使用汉字的需要出发,的确有着不同的要求。汉字规范的两种受众——专业的、主导的操纵汉字成品的阶层与普及领域在生活中使用汉字的阶层,都是不容忽视的。科学性应当如何把握,才能同时符合这两个阶层不同的要求,这就是汉字规范的难点所在。

四、协调好科学性与社会性的关系
    重视科学性,依照汉字的内在规律进行规范,是符合汉字发展长远利益的;但是,汉字的内在规律又是在多数人的使用中才能显现的,汉字是一种社会运用的符号,它的人文性决定了完全符合数理逻辑的理想汉字实际上并不存在。在广大的使用领域,在计算机高超的贮存技术面前,理论有时显得非常“低能”——这“低能”有些是因为理论缺乏实践的考验,还不够完善;还有一些是因为应用领域瞬息万变的形势,是滞后的理论研究无法反映的。在这种情况下,科学性与社会性一致的地方,应当大胆处理;科学性与社会性产生矛盾的地方,从应用出发应当比从理论出发更具有现实性;面对大众和专业领域,分开层次解决问题更能切合需要。
这里分别举例说明协调科学性与社会性的必要。
    (1)规范汉字表的适用范围问题:
    中国从20世纪初期结束了言文脱节的时代,在教育领域和文学领域推行白话文。简化汉字是白话文推行后的第一次汉字规范,很显然,他是为书写现代汉语文本而进行的规范,他的适应范围只能是记录现代汉语的使用领域,如果再扩大一点,对普及领域浅显的文言文也大致适用。但是,从1979年开始,中国进入了改革开放的新时代,我们要发挥传统文化的优势,增强民族凝聚力,文言文阅读成为一种新的关注,用简化汉字去书写文言文,以下这些简繁对应的字,足以引起表达上的混乱:
发—髪    征—徵    丑—醜    斗—鬬    范—範
后—後    了—瞭    沈—瀋    松—鬆    叶—葉
几—幾    犹—猶    干—幹    干—亁    ……
解决这个问题,需要首先明确,文言与白话是不同时代的汉语,由于他们构成词汇的要素虽然有着大量的相互包容,但词汇系统已经发生了较大的变化。两千多年的文言受经书的影响,在书写用字上又有了一些既成事实的规则,与现代汉语不可能完全相同。还有一个基本事实也是需要注意的,那就是现代人阅读文言文的人会越来越多,阅读能力也会不断加强,但绝大多数人不会再用文言文来写文章,不会再用文言文来表达现代思想;所以,文言文在很大程度上只是属于专业领域的问题。生硬的把现代汉语与古代汉语拉在一起,让历史语言与现行语言用同一套汉字来书写,只会互相牵扯,使现代汉语的用字因为照顾文言而生出很多枝节,或使古籍用字迁就现代规范产生整理、印刷上的诸多难题。所以,只要明确规定新的规范汉字表的适用范围主要是书写现代汉语文本,但不限制普及领域浅显的文言文使用,专业领域的古籍用字仍可采用原形原字,上述简化字带来的问题就可以消除。这样,在普及层面上,不会因为大量恢复繁体字造成过多的不便,而在古籍整理、印刷等专业层面上,也可以不因为字形归并产生表述上的诸多矛盾,这是各个领域都可以接受的。
    (2)异体字问题:
    与简化字同时,为了减少字数,1955年12月22日,由文化部和文改会联合发布了《第一批异体字整理表》。整理异体字,提出“正字”的概念,这是中国历史上很多统一和繁荣时期文化建设的好经验。例如,唐代的正字字书《干禄字书》、《五经文字》对一些纷繁的用字划分了正字、俗字、通字,并明确了这三种字适用的文本范围。将职能完全相同的重复汉字认同后,留下一个作规范字,其余不在正式场合使用,这对社会用字特别是基础教学和成人普及教育都是有利的。问题在于,《第一批异体字整理表》所谓的异体字概念是不严格的:
1.意义上有包含关系的。它们不是异体字关系,而是源字与分化字的关系。如:
“背—揹”、“布—佈”、“欲—慾”等
2.意义上有交叉关系的。它们不是异体字关系,而是同源字分化后又通用的同源通用字关系。如:
  “玩—翫”、“游—逰”、“志—誌”等
3.仅在一部分义项上有通用关系的。它们不是异体字关系,而是个别义项通用的通假字关系,一般在词的异写时表现为局部的同一用途。如:
“雕—鵰”、“哄—閧”、“斤—觔”等
4.声音相同意义毫无关联的。它们不是异体字关系,而是通假字中典型的同音借用字关系。如:
  “昆—崑、崐”、“侖(仑)—崘、崙”、“修—脩”等
这些不严格的所谓“异体字”,一旦进入了正字法的范畴,有一个就要被取消,但是在实际上他们记录语言的职能并没有完全被保留下来的字取代,取消了他们,势必影响表达的准确,造成使用上的很多不便。如果再加上简化字中的同音替代字,表达中的歧义现象更为增多,简繁对应中的一对多和交叉对应的现象也相应增多,带给计算机简繁转换的麻烦当然也就更多了。
    数十年来,王力、裘锡圭等文字学专家都提出了“严格异体字”的定义,明确了异体字“必须音义全同,任何语境下都能互相替换”的科学概念;而且,异体字只有在共时层面上使用才有分辨的价值也才能分辨得清楚,不论它形成的时代如何,共时同用是它必要的条件。这些,在学术界对于多数学者已成定论。不过,这样严格的异体字虽然为数不是太多,但在现代使用领域完全确定下来一时半会儿也是有困难的。此前,跨时代的大型综合辞书整理“异体字”,由于定义不严、加上面对字料的泛时性,实际操作相当困难,确有越整理越乱的弊病。新的规范汉字表如果沿袭过去的做法,实在难以给应用领域带来方便。所以,一方面,对待真正严格的异体字,“正字”的概念是必须坚持的,只要从正面规定规范字形,在现代文本的印刷和书写上就可以有据可依;另一方面,不强调“取消”这个概念,就可以避免“错杀无辜”,专业层面上又不会感到不便。在普及层面上,哪些字属于严格异体字,不能与正字同时使用,也许会有些分辨不清,可以通过《现代汉语词典》这种权威的规范性辞书作为知识来引导,也可以通过专家的研究来影响大众,这样宽松的处理,造成的负面效应可以避免,暂时执行后,对异体字的整理可以有时间进行,成熟一批宣布一批,对各个领域都是有利的。
    (3)“类推”问题:
    在简化汉字推行的过程中,实行了一个“类推”的原则,就是对某些简化的部件,类推到未简化的字上。这个原则在有限的范围内施行,似乎对保持汉字构形的体系有一定的作用。但是,由于类推本来就是汉字书写者容易使用的一种社会用字心理,近十年来,类推已经在无限扩大,对汉字产生了极大的扰乱作用。不限部位、不限层次、不限功能的无限类推,在汉字本来数量繁多的情况下,又人为的造出大量历史上从来没有使用过的“人造字”,给使用领域带来更大的不便。更荒谬的是,在辞书编纂时,有些辞书对贮存领域的字成批类推,改造了历史汉字的原形,违背了辞书存储汉字的历史真实性原则,这是既违背汉字的科学性,又违背汉字的社会性的。更有甚者,类推原则又被使用到所谓的“新旧字形”上。新字形是对旧有的宋体字书写属性的改造,如果把新字形与所谓的“旧字形”对照起来,它们之间是异写字的关系;而且,这些新字形大多数也是从历史字形中选出的,也是符合真实存在的原则的。其实,过去的新字形属于字样的规范,只是对个体字形的一种优选,而且只不过涉及7000个字形,对整个汉字规范的影响是积极的。但是,现在由一些辞书列出的新旧字形对照大部分是部首或部件,而它所涉及的范围又绝不只是那7000个通用字,在辞书处理字形时,对一些7000字以外的没有进入通用字表的字大量类推。这样就改出了一大批完全没有被使用过的字形,增加了毫无用处的异写字字样,实际上使汉字的总体系统繁化甚至混乱。类推原则由于违背科学性,给汉字的贮存与使用带来了大量的弊病,新的规范汉字表无论如何不能再无原则地使用了。但是,已经类推的常用字已经成为普及层面使用的习惯,不便大量修改。因此,在常用字、通用字范围仍然不得不继续遵循,而在专用字集里,应当受到限制,以免造成不必要的混乱。
    (4)扩大规范字量的问题: 
过去的规范字只限于通用字范围,现在,国际通用的GB13000字符集已经扩充到20902个字样,原有的7000通用字已经不够用了。新的规范汉字表应当增设专用字集。根据社会的需要,专用字集包括人名用字专集、地名用字专集、科技用字专集。其中人名用字专集收集通用字以外的人名专用字,是大家最为关心的。
    人名专用字集不是现在人名已经使用的汉字的描写,而是要收入切合取名字的汉字,以为今后取名字的使用范围。在现在用做名字的汉字中,首先要排除生僻字,也叫疑难字,包括以下四类字(注5):
第一类,是音义不全的字,字典上面有形,但有音无义或有义无音,这些字多半是在字典收字时横向合并或历史传承时整理不彻底以及转抄错讹造成的。有的字可能在哪个碑石或手抄书上偶然出现了一次,也有些可能从来就没有用过。这种字害得一些文字学家和文献学家花很大的功夫一个字一个字去考证,其实,考出来也不会有太大用处,不过是一堆“死字”。这些字不是不能念就是没讲头,你怎么用来取名字啊?“名”底下从“口”是要人叫的,没有音怎么叫?起名字希望它有文化内涵、合乎一定的理据,没有意义,怎么实现这些要求?
    第二类是指已经被现代楷书取代了的隶古定字字形或者过渡字形。隶定字形是为了在称说古文字原形时对它进行描写的,这些字在隶变以后还有一个通行的传承字,例如:“叜”是“叟”的隶古定字,既然有“叟”,何必用“叜”!过渡字形是一些字书为了讲解其他的字而设的,比如:“圥”可以构成“坴”,“坴”又可以构成“陸(陆)”、“睦”,《说文解字》就保留了“圥”。又如,过去,有人喜欢用三个字垒起来的字,还有四个字垒到一起的,例如有人叫章zhǎn(四个“工”字),这个字在《说文解字》里有,就是小篆“展”的声符,当“工整”讲。在20世纪初期,这个字还有人认识,取名字到也无妨;到了现代,楷书的“展”已经不使用它做部件了,这个字在使用领域就作废了,除了专门研究文字的人,谁都弄不清楚它们的音和义,现代用它取名有什么意义呢? 
    第三类是不通行的异构字和异写字。和规范字音义全同只是写法不同的字叫异写字,音义全同而结构和它不一样的字叫异构字。这些字已经有了一个既通行又与它音义全同的字被大家认可,取名字何必非要用那些不流通的怪字呢?
    第四种就是适应某一种方言的方音制造的方言字。香港的某些报纸充满了这种字。比如,“卡片”的“卡”,在香港写作一个“口”加一个“吉”。“吉”古音是见纽开口三等字,声母的确读[K],粤语保留的是古音,但是到了别的方言区,大部分“吉”和“卡”不同音了,它只适应广东话,所以很难认。这种字要用来取名字,就是成心不让别人叫,或者一辈子只在自己的方言区,不要到外地求学、工作或经商。
这四类字合在一起量非常大,应当属于随着时代发展被流通领域淘汰的字,建设适应当代的先进文化,不应当再用它。如果非要用这些字取名字,不光给社会带来很多麻烦,对自己也没有好处。比如你给小孩起一个名字,老师拿着点名册叫不出来。去看病,你的名字谁都不认识,大家都乱念。不是也带来许多烦恼吗?
这里要说明的是姓氏字的问题。姓和名不同,它不但是称谓的符号,还涉及婚姻、血统、祖籍,包括继承权等等复杂的社会问题,它不是任意选用的,是传承的,其中有些怪字,如果考不清楚来龙去脉,那就应当有一个算一个,估计也不会太多。
    人们最担心的是规范汉字表的字用来取名字是否够用?是否会给人带来限制?新的规范汉字表的人名用字字集,要特别解放一些人民喜欢使用做名字的异体字,作为取名专用(人名之外仍然限用),例如“喆”、“堃”等。新的规范汉字表的总字量要达到12000—13000个不重复的字,从数量看,取名字基本够用了。这么说的根据,可以从中国古代典籍的用字量来看:古代童蒙识字的课本《三字经》、《百家姓》、《千字文》,不重复的字种数是1462个,宋代通行的四书《大学》、《中庸》、《论语》、《孟子》,总字数56764个,不重复的字种数也只有2320个。宋诗18000多首,字种4520个。字量很大的《十三经》,字种数也超不过6000个。楷书从魏晋开始成为主用字,魏晋至清代的手写文本(文学、杂记)抽样5744000多字,也只得到适用字种12760个。从这些数字大致衡量,12000—13000字用来取名字,应当够用了。
    简繁不对应的问题:
简繁不对应,也就是所谓的“一对多”的问题。由于同音借用简化字的通行,也由于不严格异体字不恰当的合并,产生了较多的异词同字现象,的确给使用带来不便,但是,大量改动异词同字情况,恢复繁体字,必然给普及领域带来麻烦,引起社会学习和使用上新的不方便。而完全无视这种现象,却会对专门领域造成很多误差,影响效率和质量。这种情况要求我们,在修订规范汉字表时,要慎而又慎。可以这样设想,我们是否可以定出一些原则,来控制改动的数量,尽量少改一些?但是,汉字的分布是一个完整的体系,牵一发而动全身,例如“干”字在简化字里承担了“干犯”、“枝干”、“干事”、“干燥”等义项及其相关的引申义,产生了一对四的情况,歧义过于严重,而且,“干”所对应的四个繁体字都能单用,无法借助双音词分开。加之四组意义都是高频词,意义负荷过重。有人主张将繁体字“亁”恢复。但是,一旦以“亁”的恢复为样板,与“亁—干”情况相同的“一对多”字组,大约有9组之多。恢复9组繁体字,专业领域会不会认为是一种修修补补,没有解决根本问题,而在我国教育的普及还没有完全到位,人民的汉字素质还不很理想的情况下,会在普及层面上引起什么波动,却是很难预料的。还有一个教训应当吸取,那就是在处理一些问题,对某些已经规定的事情做个别调整时,最忌在没有全面研究的基础上,灵机一动,想到什么改动什么,结果常常是改了这里,那里的矛盾又显露出来,人们把这种缺乏总体规划的个别改动称为“添乱”。为了避免“添乱”,我们是否应当首先考虑到全民的需要,暂时维持原状,等待时机成熟,经过研究深入,再统一改动。这样做,并不是对群众的意见置若罔闻,也不是有意违背汉字的科学性,而是避免在条件不成熟的情况下产生新的矛盾,从另一个角度违背科学规律,造成社会的波动,反而在以后合理处理这一问题时,产生更大的阻力。至于计算机简繁字自动转换产生的问题,还不都是简化字本身的问题,很多是可以通过扩充和修改词库、设计更多的自动转换技术来解决的,并不会过多地影响海峡两岸的沟通。
    总之,理想的汉字规范应当认真协调汉字的科学性和社会性。从上面所举出的例子看,有些问题的确是社会的不同领域由于文化水平的差异和使用汉字专业程度的差异要求不同所造成的矛盾。汉字的使用必须切合全民利益,不能忽略普及领域的要求——这一领域人数众多,分布很广,影响很大,他们要求保持旧有习惯更多些;也不能忽略专业领域的要求——这一领域虽然人数较少,但他们是大规模汉字的使用者,又是社会用字和文化传承的主导者,在某种意义上,他们通过政治、经济、文化、教育、出版事业,能够产生的社会影响更大。他们从自己的工作和经验出发,对科学性的要求是十分迫切的,忽略了他们的要求,也是会产生社会问题的。要想完全顾及各个领域是难以作到的,但只要我们具有这两个不同领域的意识,尽量兼顾大家的要求,很多问题的调节是可以相对作得好一些的。
    在考虑到不同社会领域的要求后,科学性与社会性二者应当互相制约、并不矛盾——汉字客观规律的形成与它的社会背景有密切的关系;而社会对汉字的人为调节,无论如何不能违背它自身的规律。我们应当用这个标准来衡量一个世纪以来汉字规范的实践,并且作好新的规范汉字表的研制工作。
    本文初稿经曹先擢、李宇明、王铁琨先生阅读后提出了有价值的修改意见,在此一并致谢。


                                              2006,9修定


    (注1):《论汉字规范的社会性与科学性》一文,发表在《中国社会科学》2004年第三期。这次发表的《再论》,是《论汉字规范的社会性与科学性》一文的延续,其中个别地方由于全面论证的需要,重申了《论汉字规范的社会性与科学性》一文的说法,但这些说法都有新的发展,为行文简洁,不再注明。
    (注2):这个字表1956年2月1日正式实施。
    (注3):1986年国家语委重新发表《简化汉字总表》时,对1964年的字表作了某些调整。
    (注4):见章炳麟《国故论衡•转注假借说》。
    (注5):关于生僻字的解释,我在2003年6月11日接受中国语言文字网站关于人名用字规范的采访时已经说过,采访录在《中国教育报》上也已经发表,这里的意见是对采访录的复述。