政策法規
當前位置:首頁 > 學報 > 政策法規 > 正文

通用規範漢字表

目錄

一、《通用規範漢字表》简介

二、《通用規範漢字表》背景知识

三、《通用規範漢字表》的研制情况

四、《通用規範漢字表》制定的意义

五、制定《通用規範漢字表》遵循的原则

六、《通用規範漢字表》的性质

七、《通用規範漢字表》发布后如何实施

八、《通用規範漢字表》解决了哪些重大问题

九、表內字分級的理據及一、二級字表的收字

十、三級字表設立的原因及其性質

十一、三級字表的收字原則、範圍

十二、《通用規範漢字表》对异体字的处理

十三、《字表》對類推簡化問題的處理

十四、《字表》對宋體字形調整的原則與結果

十五、《字表》中微調的44個漢字字型

一、《通用規範漢字表》简介

《通用規範漢字表》是《中华人民共和国国家通用语言文字法》的配套规范,是现代记录汉语的通用规范字集,体现着现代通用汉字在字量、字级和字形等方面的规范。

圖解44個被“整形”的漢字

字表收字8300個。根據字的通用程度劃分爲三級:

一級字表收字3500個,是使用頻度最高的常用字,主要滿足基礎教育和文化普及層面的用字需要。

二級字表收字3000個,使用頻度低于一級字。二級字與一級字合起來共6500字,主要滿足現代漢語文本印刷出版用字需要。

三級字表收字1800個,是一些專門領域(姓氏人名、地名、科學技術術語、中小學語文教材文言文)使用的未進入一、二級字表的較通用的字,主要滿足與大衆生活和文化普及密切相關的專門領域的用字需要。

二、《通用規範漢字表》背景知识

撰者按:這裏所做的詞語解釋,不是嚴格意義上的學術定義,而是爲了便于非文字學專業的人更好的理解字表。所列舉的詞語有的未必只限于表述漢字,其他文字也應涵括,但這裏皆把它當作漢字的專有術語來解釋。

1.字集:按照一定原則選出的一定數量漢字的集合。比如1988年1月,國家語委和國家教委聯合發布的《現代漢語常用字表》就是一個一般社會領域最常用漢字的字集。

2.字量:文字的数量,一般指某一特定范围使用到的汉字的数量。比如1988年3月,国家语委和新闻出版署联合发布的《现代汉语通用字表》的字量是7000个。《通用規範漢字表》(征求意见稿)的总字量为8300个。

3.字形:漢字的外形,即單個漢字在空間展現出來的形貌。比如“王”由三橫一豎組成。

4.字级:一定数量的汉字集合内部,依据某原则而分出的若干具有层级性关系的汉字集合。比如,1988年1月,国家语委和国家教委联合发布的《现代汉语常用字表》收字 3500个,其中又分为两个字级:前面2500个是常用字,后面1000个是次常用字。《通用規範漢字表》(征求意见稿)分为一级字、二级字、三级字3个字级。

5.字用:漢字在書面作品中使用的情況。確定字用依據的是漢字具體的使用職能。記錄同一個詞的不同字形可算同一個字(比如說“淚”和“涙”是同一個字);記錄不同詞的相同字形則可算不同的字(比如“體”,古代讀bèn,表示愚笨;現代讀tǐ,表示身體,二者雖然形體相同但可算兩個字)。

6.字样:《通用規範漢字表》(征求意见稿)的相关文件中所使用的“字样”是指汉字的外部样态。凡是汉字中的线条、图素、笔画在数量、交接方式、位相或体式等方面具有差异,也就是不能同比例重合的字,都属于不同的字样。比如说“泪”和“涙”是两个字样,因为它们的外在形态不同,但字用没有区别,因为它们的职能相同,都是记录汉语中“眼泪”这个词。再比如,“户-户-户-户-户”五个形体也是5个不同的字样,只是其间的差别主要由于字体风格形成。总之,“字样”描述的是每个字的外形。

7.字频:汉字的出现频率,即某个汉字在一定语料中使用(出现)的次数与样本总字数的比率。比如在一个一万字的文本中, “的”字一共出现过415次,那么“的”字在该文本中的字频便是4.15%(415÷10000×100%=4.15%)。

8.字序:汉字在辞书和各种索引中的排列顺序。汉字的字序主要有音序和形序。比如“天、地、人”三字,按形序(笔画序)排列应该是“人(2画)、天(4画)、地(6 画)”,按音序排列应该是“地(di)、人(ren)、天(tian)”。几个字笔画相同时,则依照笔顺的先后顺序排列(笔顺的先后顺序是横1、竖2、撇 3、点4、折5),如“文、王、队、日、午”五个字全是四画,起笔分别为点、横、折、竖、撇,依照笔顺则应排列为“王、日、午、文、队”。

9.类推简化:某个字形简化了,当这个字作为其他字的构件时如果也可以跟着简化,就形成类推简化。《简化字总表》规定其第二表中的132个简化字和12个简化偏旁,可以类推简化。比如“严、龙”简作“严、龙”,“俨、垄”可以类推简化作“俨、垄”;“车”简作“车”,则以“车”为偏旁的“轨、军、库、载”可以类推简化为 “轨、军、库、载”。

10.有限类推:类推简化限定在一定范围内。《通用規範漢字表》(征求意见稿)实行的就是有限类推,即凡收进字表的字如其字形是繁体,都依据《简化字总表》规定的原则而类推简化。而字表以外的字,不管其形体是否含有已经简化了的繁体字形,都不再类推简化。比如“驦、驌、鸘、鷫”四字收进了字表,依据类推简化原则,将们分别简化为“骦、骕、鹴、鹔”。与其相对的说法是“无限类推”,也就是某个字不管其现在是否使用,只要其形体含有已经简化了的繁体字形,都类推简化。比如 “驡”现在基本不用,但因为“龙”简化作“龙”、“马”简作“马”,于是把“驡”类推简作“龙+马”。无限类推学术界不赞成,主管部门也已明确否定。

11.异体字: “异体字”是与“正体字”相对的概念。音义和使用功能相同而字形不同于正体字的汉字。例如,“峰-峯”、“凳-櫈”、“朵-朶”、“泪-涙”等字组中,后者皆为前者的异体字。严格意义上的异体字,其职能不由正体字承担,是汉字的冗余,给记忆带来负担,所以有必要限制其使用。

12.宋體字形:宋代刻版印書通行的字體。結構方正勻稱,橫細直粗,便于刻版,閱讀醒目,是16世紀以來漢字的主要印刷體。當前出版物上的常用字體,除宋體外(如:小),還有仿宋體(小)、楷體(小)、黑體(小)等。

13.《第一批异体字整理表》:1955 年12月22日,文化部和中国文字改革委员会联合发布的新中国第一个汉字规范,1956年2月1日起在全国实施。该表内列810组字,每组最少2个字,最多6个字,共1865字。根据从简从俗的原则,从中选出810个作为正体,淘汰了1055个异体字。比如“橹—艪艣樐”为一组具有正字与异体字关系的字,该表将“橹”定为正字,“艪艣樐”是淘汰的异体字。该表发布后,不仅精简了汉字的字数,而且有效地遏制了汉字使用中的字体混乱现象。

14.《印刷通用汉字字形表》:1955 年,中国文字改革委员会提出进行汉字字模标准化工作,以统一印刷字体和手写正楷体的笔画结构,精简偏旁部件的种类,确定汉字的标准字形,并把它作为书写的规范和设计印刷、打字字模的标准,以利学习和使用。1956年9月,标准字形研究组编成了《标准字形方案(草案)》,1957年对该草案进行修改并更名为《汉字字形整理方案(草案)》,1959年初步定稿;1960年5月,在前表的基础上又编成《通用汉字字形表草案》;1962年3月,文化部决定把整理字形的工作确定在印刷通用汉字的范围内,并改名为《印刷通用汉字字形表》。

整理字形的原则是:①宋体楷化;②字形结构和笔势尽量服从横写的需要;③折笔尽量改为直笔;④连结个别笔画结构;⑤精简偏旁的数量;⑥按读音分化原有部件。 1964年5月,字形整理组拟出《印刷通用汉字字形表》,1965年发布实施。收印刷通用汉字6196个,并给每个汉字规定了笔画数、结构和笔顺。经过对字形的调整和美化,进一步取得了宋体字笔形的一致,使字形更趋于规律性、系统性。

15.《简化字总表》:1956 年1月,国务院公布《汉字简化方案》;1964年3月,中国文字改革委员会、文化部、教育部联合发布《关于简化字的联合通知》,《总表》分成三个表。第一表所收的是352个不作偏旁用的简化字。这些字的繁体一般都不用作别的字的偏旁。个别能作别的字的偏旁,也不依简化字简化。如“习”简化作“习”,但 “褶”不简化作“衤+习”。第二表所收的是132个可作偏旁用的简化字和14个简化偏旁。第三表所收的是应用第二表的简化字和简化偏旁作为偏旁得出来的简化字。1986年10月,国家语委经国务院批准重新发布了《简化字总表》,并作了个别调整。调整后的《总表》,实收简化字2235个。

16.《现代汉语常用字表》:1988 年1月26日,国家语委、国家教委联合发布,目的是为了适应语文教学及其他方面的需要。字表分常用字(2500字)和次常用字(1000字)两个部分。选字原则是:①根据汉字的使用频率,选取使用频率高的字;②在使用频率相同的情况下,选取学科分布广、使用度高的字;③根据汉字的构字能力和构词能力,选取构字能力和构词能力强的字;④根据汉字的实际使用(语义功能)情况斟酌取舍。其后,国家教委颁布的基础教育教學大纲规定基础教育阶段的识字量为3500 字,完全等同于本字表。

17.《現代漢語通用字表》:國家語委、新聞出版署1988年3月25日發布。共收7000字,包括《現代漢語常用字表》的3500字。本表的制訂,主要依據1965年頒布的《印刷通用漢字字形表》。根據實際需要,刪去《印刷通用漢字字形表》中的50字,增收854字。同時,本表依據《印刷通用漢字字形表》確定的字形標准,規定了漢字的字形結構、筆畫數和筆順。其後,印刷通用漢字字形即以此表爲准。

18.語料庫:應用計算機技術存儲語言材料的總彙。語料範圍可以是綜合的,也可以是專項的,如國家語委“現代漢語平衡語料庫”(收1919-2002年的語料9100萬漢字)。語料庫的容量大小和編制體例可根據需要設計,內容也可以及時更新補充。

19.《GB13000.1字符集汉字字序(笔画序)规范》:GB13000.1 字符集是指国家标准汉字编码字符集,共20902个汉字。《GB13000.1字符集汉字字序(笔画序)规范》由国家语委1999年10月1日发布、 2000年1月1日实施,编号为GF3003-1999。它是按笔画排序的汉字字序规范,主要用于汉字的信息处理、排序检索、辞书编纂等方面。

20.历史通用字形:即在历史上已经通行的汉字。一般指《康熙字典》之后、特别是《中华大字典》(1915年)之后的字形。使用历史通用字形的原则:字形要有历史上使用过的依据;有多个字形可以采用时,要尽量选取通行度高、易于识别的字形。这个概念主要针对这种情况:如果文章中需要使用非常生僻的字,要使用历史上已经通行的字形,不要生造新字或乱改字形(包括类推简化),以免增加汉字的繁复程度。比如“壣”“蘹”未收入字表,如果写作时确需使用,则不能将其简化为“土+联” “艹+怀”,也不能写成其他新造形体,而要使用古书中所使用的原字形。

三、《通用規範漢字表》的研制情况

漢字是中華民族的驕傲。它曆史悠久,使用人口衆多,使用狀況也相當複雜;漢字之學源遠流長,淵深如海。研制一個適用當前語言生活的字表,工程龐大,問題龐雜。字表正式立項研制始于2001年4月,曆時8年有余,先後召開學術會、審議會、征求意見會等大型會議80余次,參與討論的海內外專家學者3000多人次,前後修改90余稿。可以說,字表是所有參與者的集體産品。

字表的研制有很多特點,限于時間我主要講四點:

第一,充分利用语料库资源和计算机统计技术。使用的主要语料库有:国家语委“现代汉语平衡语料库”(9 100万字符)。北京语言大学“现代新闻媒体动态流通语料库”(3.5亿字符)。字表研制过程中建立的“教育科普综合语料库”(404万字符)、“儿童文学语料库”(570万字符)、“中小学语文教材文言文语料库”(560万字符)。同时还参考了国家语言资源监测与研究中心2005-2008年建立的平面媒体、网络媒体、有声媒体、教育教材等海量语料库的数据,参考了海内外几十个语料库的数据。这些语料库提供了现代用字的统计数据,为字表研制奠定了科学基础。

第二,全面繼承已有成果,充分發揚學術民主。課題組的工作是從學術調研和社會調研開始的。在調研中,系統地收集與字表研制相關的文獻資料,梳理出字表必須面對的若幹學術問題和社會問題,然後有針對性地召開學術座談會,廣泛深入地聽取各領域的意見,並就一些重要問題的處理召開學術審議會,做出學術決策。這爲字表研制提供了學術基礎。

第三,广泛征集用字,认真听取相关部门的建议。向教育、文化、科技、民政、公安、军事、测绘、新闻出版、文物图书、广播影视、信息处理、辞书编纂、医疗卫生、民族宗教等领域,了解用字需求,征集需补入字表的汉字,得到了各部门的大力支持。就字表及其实施等问题,多次听取了工业和信息化部、国家民委、公安部、民政部、人力资源和社会保障部、文化部、工商总局、质检总局、广电总局、新闻出版总署、解放军有关单位、中科院、社科院、国家测绘局、共青團中央、中华全国总工会、全国妇联等部门的意见。为字表的研制及以后的实施提供了社会基础。

第四,以方便人民語言生活爲目的,兼顧穩定與創新。建國以來的語言文字工作,爲文字規範化奠定了良好基礎,有效滿足了文化教育等各項事業的發展。信息時代的來臨,對漢字的規範化、標准化提出了新要求:一方面需提高標准化程度,方便信息儲存、信息管理和信息交換;另一方面,某些專門領域的用字較快進入大衆生活,社會用字量有所擴大。字表重視與已有規範標准銜接,同時根據語言生活的新情況對已有規範進行整合優化,拓寬了通用領域用字的範圍,慎重處理了類推簡化、異體字等有關問題。

四、《通用規範漢字表》制定的意义

我國現代漢字規範工作醞釀于20世紀上半葉。新中國成立後,在國務院直接領導下,這一工作開創了全新的局面。20世紀50年代以來,國務院語言文字工作主管部門和其他有關部門陸續發布了多項漢字規範,初步實現了社會用字標准化,推動了我國教育、文化和科技事業的發展。近20年來,隨著國家現代化、信息化事業的快速推進,我國語言生活發生了巨大變化。語言文字規範同社會發展和人民生活聯系的廣度和深度是前所未有的。在新時代、新形勢下,過去的規範已經不能完全適應現代語言生活的需要,因此,對此前的漢字規範工作重新審視、制定新的可行性規範是非常必要的。

制定《通用規範漢字表》,是为了适应国家信息化发展的需要。世纪之交,我国实施创新型国家战略,信息化成为实现这一目标的重要支撑。语言文字规范化是国家信息化的基础,只有有了汉字这种传播载体的标准化,才能保证信息传播的速度和信度。

制定《通用規範漢字表》,是为了适应当代语言生活的需要。科学技术的发展,教育水平的提高,使科技术语用字范围扩大,并且快速进入日常生活。印刷业告别了“铅与火的时代”,激光照排成为出版的主要手段。古籍整理、辞书编纂广泛使用计算机,计算机字库的缺字和错字直接影响印刷出版与信息传播的质量和社会效益。在社会生活中,户籍、邮政、金融、保险等政府部门和服务行业的信息存贮和检索已经实行数字化,姓氏人名、地名中的不规范字和生僻字影响多个行业信息系统的建设和政府的社会管理,也给某些相关人员的日常生活带来极大的不便。制定适应现代语言生活的汉字规范,已经成为关涉人民生活的大事,成为广大人民群众的需求。

制定《通用規範漢字表》,是为了贯彻国家语言文字法的需要。2000年10月颁布的《中华人民共和国国家通用语言文字法》规定:“国家推广普通话,推行规范汉字”,并进一步明确了“国家机关以普通话和规范汉字为公务用语用字”,“学校及其他教育机构通过汉语文课程教授普通话和规范汉字。使用的汉语文教材,应当符合国家通用语言文字的规范和标准”,“公共服务行业以规范汉字为基本的服务用字”。这一法律的颁行,使汉字规范进入了法律层面,需要为社会一般应用提供明确的“规范汉字”范本。制定字表,对已有的汉字规范进行整合和优化,消除不同规范字表之间相互矛盾之处,集分散的规范于一体,明确“规范”的政策指向和法律效力,确定“规范汉字”这一法律概念在通用层面上的外延,使国家通用语言文字法所指称的“规范汉字”在一般社会通用层面落到实处,是保证该法顺利施行的重大措施。

五、制定《通用規範漢字表》遵循的原则

《通用規範漢字表》的制定,遵循了如下四项原则:

(一)注重與原有規範的銜接,維護漢字系統的基本穩定。字表的制定,堅持了漢字簡化的基本方針,同時也遵循了國務院1986年批轉國家語委《關于廢止〈第二次漢字簡化方案(草案)〉和糾正社會用字混亂現象的請示的通知》中所指出的“今後,對漢字的簡化應持謹慎態度,使漢字的形體在一個時期內保持相對穩定”的原則。《第一批異體字整理表》、《簡化字總表》、《印刷通用漢字字形表》、《現代漢語常用字表》、《現代漢語通用字表》等已有的漢字規範,經過數十年實踐的考驗,很多精神和大量成果值得承襲和吸取。字表繼承了這些規範的原則和主要內容,對其中錯誤、疏漏、相互矛盾及不能滿足當今社會需要之處,則在詳細調查和認真分析的基礎上,充分考慮到曆史形成的全民習慣和社會的可接受程度,遵照便民利國的原則,進行必要的修訂。

(二)堅持實事求是的科學精神,遵循漢字構造和演變的規律。字表制定過程中,邀請了我國多位資深的語言文字學家主持和參與工作,又反複聽取了很多其他語言文字學家和相關領域專業人員的意見,注意吸收漢字學與漢字史研究的最新成果,采用科學的統計方法獲取可靠的數據;同時也廣泛吸取基礎教育、古籍整理、辭書編纂、印刷出版、計算機信息處理等部門的實踐經驗,遵循漢字構造和演變的規律,充分考慮漢字應用的實際,盡可能提高漢字規範的科學性與可行性。

(三)廣泛聽取各界意見,照顧不同領域漢字應用的需要。字表的制定,堅持了群衆路線,通過各種方式聽取廣大人民群衆的意見,尤其是基礎教育和文化普及領域所反映的意見,盡量滿足不同領域、不同文化程度的人群對漢字使用的不同要求。

(四)適當考慮漢字在台灣、香港、澳門的使用情況和國際化的需求。漢字通行于兩岸四地,而且還跨越國界,傳播到世界各地。字表的制定,正視使用漢字的不同國家、地區簡繁字形並存並用的客觀實際,兼顧漢字使用的現狀及國際化的各種需求,盡量避免擴大不同國家或地區之間漢字使用的差異,以利于相互之間的溝通和交流。

六、《通用規範漢字表》的性质

汉字规范一直是我国新文化建设中一项重要的基础工作。《通用規範漢字表》是《国家通用语言文字法》的配套规范,是体现国家文字政策的重大规范,将经国务院批准、由教育部和国家语言文字工作委员会发布。

《通用規範漢字表》说明第二条指出:“《通用規範漢字表》是现代记录汉语的通用规范字集,体现现代通用汉字的字量、字级和宋体字形的规范。”这个定义式的说明可以从以下三个方面来理解:

規範性是字表的首要特點,也是字表的本質屬性。字表給出了確定的字量、字級,實現了字形與用字的標准化。表中規定了三個等級的字集,各級字集所收的字,字頭都經過嚴格選取,並根據規則進行了字形整理,完全可以成爲我國社會通用領域漢字的正字,在字形上具有唯一標准的作用。

現代性是字表的第二個特點。字表的分級、收字都是從現代應用出發的,充分考慮到現代語言文字生活的需要,所收的字也主要從現代漢語語料庫中選出。現代文本中的文言文引文和中小學語文教材中的文言文,是當今文化傳承和文化學習所必需的,而且需要用簡化字印刷,其用字屬于現代用字的範疇,這些字也已納入了字表。

通用性是字表的第三個特點。在現代一般社會用字領域,沒有必要對一些罕用字或生僻字進行標准化處理,經過規範整理的8300字,都是現代社會需要的通用字。字表按通用程度分級:一級字表的通用性最高,二級次之,三級字表雖然取自專業領域,但這些字都與國計民生的信息傳播息息相關,在計算機存儲和閱讀上也有通用性。

七、《通用規範漢字表》发布后如何实施

《通用規範漢字表》的制定,是为了方便群众和各界更好地使用汉字。各领域在使用时,可根据其用字特点和实际需求,采取既遵循规范、又有一定宽松度的实施办法:

(1)專業性的古籍印刷,書法和牌匾等手寫字,可以用繁體字與傳承字。爲了社會釋讀的方便,也爲了印刷編輯部門有據可依,古籍印刷使用的繁體字也要適時進行整理。在沒有制定相關標准之前,建議采用曆史上曾經通行的漢字,即:字形要有曆史上使用過的依據;有多個字形可以采用時,要盡量選取通行度高、易于識別的;不要生造新字或亂改字形。

(2)基础教育语文新课标规定,小学阶段识读汉字的数量为3500个。这3500字应采用《通用規範漢字表》的一级字表。但根据教学需要,尚需在3500常用字范围内再划分应用子集时,比如第一、二、三学段分别应该学其中的多少字、学哪些字,教育管理部门可按照儿童不同年龄段的认知特点,以汉字必要的属性做参数,经过科学研究,生成适用的应用字表。需要强调的是:《通用規範漢字表》给出的仅仅是宋体字的规范字形,而我国小学语文课本1-3年级的课文和各年级的生字都是以楷体字印刷的,两种字体在笔形上略有差异,在楷体字字形没有新的规范之前,仍沿用原有楷体字形。

(3)根據需要可以使用表外字。所使用的表外字如果有繁體部件,根據規定,不得類推簡化。若爲了保持系統的一致性而確需類推簡化,例如新化學元素用字等,可報國家語言文字工作主管部門審批。

(4)字表發布後,如有當用的姓氏用字尚未收入,可報國家語言文字工作主管部門,經專家審定和相關部門確認後,適時補充進字表。

(5)使用漢字的工業産品,特別是信息産品,要遵守漢字規範的原則,不應違背字表。由于産品更新需要一定的周期,字表公布後,與字表規定不一致的産品用字的更改,可以有個過渡期,在此期限內應積極采取措施,以盡快與國家規範切合。

八、《通用規範漢字表》解决了哪些重大问题

字表涉及問題衆多,具有很強的學術性和社會性,研制難度很大。解決的重大問題主要有五個:

第一,關于漢字簡繁問題。字表研制過程中,對繁體字恢複和類推簡化問題,曾進行過反複的研討。研制組最終得出的結論是:爲了維護社會用字的穩定,字表原則上不恢複繁體字;將類推簡化的範圍嚴格限定在字表以內,以保持通用層面用字的系統性和穩定性;允許字表以外的字有條件使用,但不類推簡化。

第二,關于異體字問題。爲尊重社會習慣,方便人們用字需要,字表將《第一批異體字整理表》中的51個異體字收入表中,主要用作人名地名,如“喆”“淼”“堃”“升”等。對異體字不再簡單地提“淘汰、廢除”,但在使用上有明確要求。

第三,關于字形問題。字表對宋體字形進行了規範,依據《印刷通用漢字字形表》總結和制定了字形規則,對一些不符合字形規則的字的字形作了微調。字形調整的原則是:尊重漢字結構,遵循統一規則,嚴格控制特例。字形調整的原則和字形規則,不僅使表內字的字形保持了系統性,也使今後大批量漢字的字形整理有章可循,避免出現新的字形不統一現象。

第四,關于字表的屬性。字表的研制,是以大量的統計數據爲基礎,以滿足現代語言生活的用字需要爲目的,具有通用性、現代性和規範性。規範性是字表的本質屬性。

第五,關于字表的效力。字表的研制,充分考慮了社會各領域的用字需要。字表發布後,社會各領域的現代通用漢字,應使用表內字。個別情況下需要使用表外字的,仍可以使用,但要選用曆史上確曾通用過的字形,不要任意類推簡化、造字或改字。爲確保字表的有效性,今後字表會根據語言生活的變化,適時進行修訂。

九、表內字分級的理據及一、二級字表的收字

作爲國家規範,字表將要面對的是全體使用者,全體使用者的文化水平不同,交際範圍不同,行業需求不同,對漢字的使用要求也必然會有差異。而且,漢字本身的使用頻率存在著很大的差別,通用的程度是不一樣的。因此,字表只有對所收字進行合理的分級,才能反映漢字的實際使用狀況,照顧不同人群的需求差異,從而提高字表的實用性。

字表收字8300個,根據它們的通用程度,劃分爲三級,各級字表的收字數量、每個字的標准字形以及某些字的使用範圍,都有明確規定。一級字表共收3500字,是一般社會領域使用頻度最高的常用字集,主要滿足基礎教育和文化普及層面的用字需要。二級字表共收3000字,一般社會領域也會經常使用,但其使用頻度明顯低于一級字;一、二級字表一共6500字,主要滿足現代漢語文本印刷出版用字的需要。三級字表共收1800字,是姓氏人名、地名、科技術語和中小學語文教材文言文用字中未進入一、二級字表的較通用的字,主要滿足與大衆生活密切相關的專門領域用字的需要。

常用字是使用频率最高的字,这批字覆盖了绝大部分通用的语料,人们阅读和书写时常常使用它。常用字必须够用,但也不是越多越好,准确确定常用字的数量,并把应当收入的常用字收入,对汉字信息的传递,以及识字教学、字书编纂等应用,都具有重要意义。制定《通用規範漢字表》,在理论上根据的是“汉字效用递减率”这一重要的原理。频率反映的是汉字的具体使用情况,个体字符的使用频率不是平均分布的,随着字频的下降,汉字使用的覆盖率呈递减趋势。当字频降到一定程度,覆盖率基本不再上升。因此,掌握以下数据,就可以大致统计出常用汉字的数量:(1)从一定通用语料中测查出的汉字使用频率的降次排列表;(2)每个频次段落语料中所含的不重复的汉字数的递增量;(3)每个频次段落中覆盖率的增长数。

要想得到这些数据,选取什么样的语言材料和多少字数的语言材料进行统计,直接影响统计结果的代表性、客观性和准确性。制定《通用規範漢字表》,选定国家语委的“现代汉语平衡语料库”为基础语料库。该语料库按照时代与领域平衡的原则,收录1919年至2002年的语料9100万汉字,不重复汉字8181个。同时,采用北京语言大学“现代新闻媒体动态流通语料库”(收集2001-2002年15种报刊语料共3.5亿汉字)和《通用規範漢字表》课题组建立的“教育科普综合语料库”(收集1951-2003年的中小学通用教材及科普读物语料404万汉字),作为核查、验证的辅助语料。同时还参考了国家语言资源监测与研究中心2005-2008年建立的平面媒体、网络媒体、有声媒体、教育教材等海量语料库及海内外几十个其他语料库。利用这些语料库进行统计与分析,得到了《通用規範漢字表》一、二级字表的分级、字量和收字的基本结果。

在確定一、二級的字量與收字時,始終以客觀的統計數據作爲主要判斷依據。但由于漢字自身和漢字使用都具有很強的人文性,漢字字集的界限並不是截然分明的,而是存在一定數量的“臨界字”,對于這些“臨界字”,只有進行人工的調整,才能更加科學地反映漢字使用的實際狀況。在確定一級字表時,作了如下人工幹預:(1)補全了10個大寫數目字、22個幹支字、31個省(直轄市)簡稱用字和一部分常用聯綿詞的缺字;(2)增加“兒童文學語料庫”(收1949年後出版的適合基礎教育閱讀的各種體裁兒童文學語料570萬漢字)的口語高頻字;(3)提出頻次位于3201至3500的300字,向中小學教師進行問卷調查,將其中通用度相對小的字與所增加的字置換,並將被置換的字降到二級字表。經人工幹預調整的字量約占3%。在確定二級字表時,主要是對備選字表的字逐一進行核查、甄別,排除備選字表中意義離現代較遠、形體上與其他字有糾葛的字,用三級字表中頻度相對較高的字補足。

此次确定的一级字表的3500字与原《现代汉语常用字表》的3500字比较,有103字的出入,但在不同语料库中的覆盖率比原来的常用字高出0.09%~0.22%。一、二级字表的6500字,与原《现代汉语通用字表》的7000字比较,减少了500字,但在不同语料库中的覆盖率基本不变。字数减少而覆盖率保持不变的原因,首先是我国几十年来汉字规范工作取得了成效,适用性较差的字被自然淘汰,社会用字相对集中。同时也可看出,《通用規範漢字表》选字和定量的资料是优化的,方法是科学的,程序是合理的。

十、三級字表設立的原因及其性質

《通用規範漢字表》三级字表的设立,主要是为了满足专门领域的用字在通用层面上的需要。由于信息化带来的用字量扩大,《通用規範漢字表》如果只局限在基本通用字的范围,虽然可以满足日常生活用字的需要,却无法解决计算机存储和专门领域的用字问题。因此,有必要补充一些与大众生活密切相关的专门领域用字。《通用規範漢字表》在基本通用字之外,增设三级字表,适当增加姓氏人名用字、地名用字、科技术语用字以及中小学教材文言文用字,以便有效地解决这四个领域中信息处理的缺字问题。 虽然三级字不能在平衡语料库里依照字频和覆盖率收集到,但仍旧属于通用层面上的用字。这个问题需要从两个方面解释:

第一,需要全面理解“通用”這個概念。“通用”包括兩個層面:一個是印刷的層面,一個是閱讀的層面。能夠進入平衡語料庫的漢字,兼有這兩個方面的通行度。但是也有一些漢字,印刷的頻度並不高,閱讀的頻度卻很高。例如醫藥名稱、飲食營養學中的專業用字,雖然僅僅專業領域用來打印,但閱讀人群卻可以達到千家萬戶。再如,基礎教育語文教材的文言用字,也有少部分不屬于社會通用字,但是每年的教材印刷必須使用,曆屆教師、學生、家長必須面對,閱讀人群幾乎也達到千家萬戶。這些字也是需要統一字形而進入規範的。

第二,在信息時代,“通用”的概念發生了實質性的變化。除了人的使用外,還必須考慮到計算機的存儲與使用。在漢字主要是手寫的時代,這些特定領域的用字即使不定標准也不會有太大的問題,而在計算機和互聯網時代,那些在一般語料庫裏憑借字頻難以找到的字,在人民的日常生活中卻不失其通用性。以漢字爲載體的信息,一部分是在流通領域通行的,還有一部分是儲備領域必需的。例如姓名,除了知名人士,一般的姓名在社會通用層面上使用度不會太高;地名,除了大城市、著名景點,一般的地名在社會通用層面上使用度也比較有限,根據字頻和使用度不能將它們收集到。但是,無所不往的郵政、金融、交通等事業,無人不用的身份證、學曆證書、醫療保險、産權證明等證件,必須儲備可能用到的漢字。如果在信息處理上不對這些字進行規範,也會引起社會信息儲備和使用的混亂。完全依據使用頻率和語料覆蓋率來確定字表的收字,這些特定領域的用字就難以收集到,所以要從專門領域提供的專用字中收集。專業領域通用字是對一般社會通用字的必不可少的補充。

十一、三級字表的收字原則、範圍

在确定《通用規範漢字表》三级字表的收字时,坚持以下三条原则:(1)从汉字应用的具体事实出发,必须字字有来历,或有文献出处,或由相关职能部门提供用例和出处;(2)必须音义俱全,人名用字应适合于起名;(3)必须保证其通用的性质,不收用处不大的生僻字。收字范围具体包括:姓氏人名用字、地名用字、科技术语用字、中小学教材文言文用字。

(1)姓氏人名用字。中国是一个多民族的国家,姓氏不但稽留着民族和血缘的传承关系,还成为每个公民的称谓符号,其用字不能随便更改。字表对当用的姓氏用字要尽可能收集齐全,以保证信息传播的信度。至于名字所用的汉字,现在已经相当混乱,有些名字的用字甚至在已经扩充到7万余字的计算机国际编码字符集中都难以找到,致使第二代身份证由于字库用字不全而无法制作,给一些人的生活带来极大不便。《通用規範漢字表》无法改变已有人名用字的混乱状况和使用上的麻烦,但可以对今后的命名(主要是新生儿起名)和更名提供一些便于使用的字,可以引导人们减少使用生僻字、避免使用错讹字起名。这就需要尽量将姓氏用字收全,并在已有的人名用字中选择足够的、适合于起名的汉字进行规范,以保证个人姓名有效地在社会上流通。

(2)地名用字。地名用字往往不是在全國範圍內普遍通行,但對當地居民來說卻屬于常用字,在省級區劃範圍內,鄉以上地名用字是不可缺少的。由于方言的關系,經常會産生各種各樣的“方言字”或自造字,造成用字的混亂。當今,戶籍、郵政、金融等行業的信息貯存和檢索已經全面數字化,地球衛星定位系統廣泛應用,地名用字的混亂,會給有關行業帶來信息阻塞的後果,這是不言自明的。

(3)科技術語用字。由于科學技術的發展、教育水平的提高和科學知識的普及,很多科學技術的用語快速進入人民的日常生活。僅僅拿記錄化學元素的漢字來說,它們很多要用在藥品名上,當藥方不再手寫而用計算機輸錄時,這些字就成爲醫生、藥師、病人、家屬交流的載體。農藥、化肥、室內裝修材料也有不少是要用它們的學名來宣傳、普及的。至于化妝品、清潔劑的使用,飲食健康的講解,氣象的采集和預報等,一旦進入科學普及領域,都會受到普遍關注。特別是各專業的教科書的編寫和印刷,更會用到這些字。

(4)中小學教材文言文用字。規範漢字主要是書寫現代漢語文本的,但是,傳統、曆史與現代不是絕緣的,現代文本中會引用文言作品,中小學語文教材中也都會收一部分優秀的文言作品。前者可以在一般的平衡語料庫中收集到,而爲了保證教材印刷的規範,需要在語文教材中專門收集文言文的用字。

這四個方面,既是信息時代用字的重要領域,又是信息傳播容易缺字的領域。具體收字數量如下:

姓氏人名用字930字,主要來源于1982年18省市抽樣人口普查資料和公安部提供的姓氏用字及部分人名用字,並適當補收一些古代姓氏用字和有影響的古代人名用字。

地名用字465字,主要來源于民政部提供的鄉鎮以上地名用字、國家測繪局提供的部分村級地名和部分自然實體名稱的用字、常用漢語工具書中標明爲“地名”的用字。

科技術語用字276字,主要來源于全國科學技術名詞審定委員會提供的中醫藥學、植物學、遺傳學、冶金學、微生物學、土壤學等56個門類的術語用字,以及中國社會科學院語言研究所提供的天文、氣象、地理、動物、植物、工業、農業、政治、經濟、文化、曆史等33個門類的科學技術與人文社會科學的術語用字。

中小学教材的文言文用字362字,主要从字表研制工作组建立的“中小学语文教材文言文语料库”(收1949-2007年中小学语文及普及文言文语料,560万汉字)中提取。 以上四个方面的用字合并去重后,去除已经进入一、二级字表的字,再去除疑难字、错讹字和异体字等,共为1800字。由于三级字是四个方面的用字合并去重后得出的,所以,三级字的属性并不都是单一的,有些字可能兼有多个领域的不同属性。

十二、《通用規範漢字表》对异体字的处理

嚴格異體字的定義應當是:音義全同、記詞職能完全一樣、僅僅字形不同,它們在任何語境下都能互相替代而不影響表達的意義的一組字。可以看出,從功能來看,異體字是漢字的冗余,徒增記憶的負擔,需要加以規範。1955年12月22日發布的《第一批異體字整理表》的說明中指出:“從實施日起,全國出版的報紙、雜志、圖書一律停止使用表中括號內的異體字。但翻印古書須用原文原字的,可作例外。”這個說明明確了異體字屬于“不規範的字”的範圍,異體字在通用層面上書寫現代漢語文本時,不能使用。但是,在該異體字整理表中確定的“異體字”,有些並不是嚴格意義上的異體字。把這些字都列入“不規範的字”的範圍而取消,有時不利于意義的精確表達。

《通用規範漢字表》对《第一批异体字整理表》进行整理时,采用了科学的原则、稳定的原则和求实的原则,形音义并重,对各组字的关系进行了重新认定,并规定今后对这类字,不再采用简单的“取消”“废除”而要采取“认同”和“辨析”的处理方法。

《第一批异体字整理表》在1955年12月发布后,有些相关的文件曾对其进行过改动,主要是:(1)1956年3月发布的《修正〈第一批异体字整理表〉内“阪”“挫”二字的通知》;(2)《简化字总表》(1986年10月10日重新发表)和《关于发布〈现代汉语通用字表〉的联合通知》(1988年3月25日发布)中重新认定了26个字;(3)1993年《关于“镕”字使用问题的批复》。上述3个文件总共恢复了29字,分别是:阪、挫、、、晔、詟、诃、、、刬、鲙、诓、雠、翦、邱、於、澹、骼、彷、菰、溷、徼、熏、黏、桉、愣、晖、凋、镕。此次制定《新订异体字整理表》时,根据现有原则对这29个字重新审核,审核后的处理结果为:“ 、、、刬”4字仍按异体字处理,其余25字收入《通用規範漢字表》。此外,根据群众的意见,《通用規範漢字表》还将51个异体字恢复为规范字,并在各级字表中相应的字下增加注释,说明这些字恢复为规范字后的使用范围:

恢複到二級字表中共6字,其中只恢複其部分音項的1字,即“袷”;完全恢複不再作爲異體字的5字,分別是“噘、栗、蹚、皙、瞋”。

恢複到三級字表中共45字,其中只恢複其部分音項的5字,分別是氾、、叚、絜、釐;恢複其部分義項的36字,分別是仝、邨、扞、吒、飏、升、並、迳、乃、钜、秘、升、、桠、赀、、脩、砦、堃、喆、蒐、椀、蘇、淼、犇、肴、、甯、缐、劄、、麹、溪、瓌、、龢;完全恢複不再作爲異體字的4字,分別是凓、勠、菉、曏。

十三、《字表》對類推簡化問題的處理

1964年5月,中国文字改革委员会根据当年3月文改会、文化部、教育部联合发布的《关于简化字的联合通知》而编印出版了《简化字总表》,在《〈简化字总表〉说明》中有这样的表述:“本表收录1956年国务院公布的《汉字简化方案》中的全部简化字。关于简化偏旁的应用范围,本表遵照1956年方案中的规定以及1964年3月7日中国文字改革委员会、文化部、教育部《关于简化字的联合通知》的规定,用简化字和简化偏旁作为偏旁得出来的简化字,也收录本表内。”“用简化字和简化偏旁作为偏旁得出来的简化字”就是类推简化,比如“严”“龙”简化为“严”“龙”,“俨”“垄”可以类推简化为“俨”“垄”;“车”简化为“车”,则以“车”为偏旁的“轨、军、库、载”可以类推简化为“轨、军、库、载”,等等。《〈简化字总表〉说明》还列出了132个可作偏旁用的简化字和14个简化偏旁,作为类推简化的依据。这132个简化字和14个不能独用的偏旁,可以用在当时《新华字典》所收8000多个汉字的范围内没有简化的字上,这些字形成了《简化字总表》的第三表,一共收字1753个, 它们都是类推简化来的简化字。虽然文件中没有明确规定这种类推简化的范围,但实际上只应用于当时最常见的汉语工具书《新华字典》的收字范围内,所以被称作“有限类推”。

實行類推的初衷是爲了保持簡化漢字的系統,易于識別;總體減少筆畫,書寫方便。這個原則在有限的範圍內進行,對保持漢字構形的體系不能說沒有積極的作用。但是,由于類推簡化沒有明確限制範圍,當一系列大中型字詞書相繼問世、大型計算機字庫相繼建立、簡體版的古籍紛紛出版時,類推簡化的範圍便無限擴大,遠遠超出了原來的《新華字典》8000個字的範圍,問題也就逐漸顯露:字數大量增多後,産生了一批同形字;有些繁體字類推簡化後,原字的結構被破壞,影響了構字的理據,也破壞了字形的美觀;類推出了一大批完全沒有使用過的字形,實際上使漢字的總體系統繁化甚至混亂;有些辭書對貯存領域的漢字不限部位、不限層次、不限功能地無限類推,在漢字本來數量繁多的情況下,又人爲地造出大量曆史上從來沒有使用過的“人造字”,違背了辭書存儲漢字的曆史真實性原則;造成了一個新的“簡化系統”,拉大了漢字應用的古今距離和兩岸距離。

《通用規範漢字表》对类推简化采用了尊重现实和严格限制的原则。所谓尊重现实,是对在《现代汉语通用字表》范围内已经有限类推的字仍然保留。由于姓氏人名、科技用字和用简化字印刷的语文课本中的文言文用字多数也已经类推,因此,三级字表也采用有限类推的办法,实行类推简化,与一、二级字表保持一致。其具体细则是:(1)按《简化字总表》第二表规定的132字与14个偏旁的范围类推,不扩大范围。(2)尽量只在第一层次构字时类推,以保持原字的结构不受影响。(3)采用以上原则产生难以识别的怪异字或产生同形字时,为保持字与字的区别,作个别变通处理。不予类推简化。

《通用規範漢字表》以外的字,根据国务院1986年“今后,对汉字的简化应持谨慎态度,使汉字的形体在一个时期内保持相对稳定”的指示精神,不再类推简化;个别领域确需类推简化的,需报国家语言文字工作主管部门批准。

十四、《字表》對宋體字形調整的原則與結果

《通用規範漢字表》对宋体字的字形进行了微调,主要是取得宋体字笔形变异上的一致。其他主用字体(仿宋体、黑体、楷体)与非主用字体,以后再逐步进行调整。

1965年发布的《印刷通用汉字字形表》,对宋体字的字形进行了有规则的处理,1988年发布的《现代汉语通用字表》继承了其字形规定。但其中还有少部分字,在同样条件下笔形变异处理不一致。这次制定《通用規範漢字表》,根据群众和专家意见,按照字形处理原则,对所收《印刷通用汉字字形表》的字进行了微调,也对新收的字进行了统一处理。

字形調整需要制定一些統一的規則,這樣,借此次字形調整,檢驗、總結和完善過去已經建立的規則,以便在今後擴大字量時仍然有章可循,不再出現新的字形不統一現象。這次字形調整的總原則是:

①尊重漢字結構:字形調整雖是筆形層面的問題,但筆形的變異也會影響漢字的結構;在規定筆形變異規則時,必須尊重漢字結構,不因筆形調整使字的結構模式發生錯亂或因調整筆形産生同形字、易混字等。

②考虑宋体风格:宋体字来源于雕版印刷字体,经过工艺美术处理,其笔形及笔画交接有自身的特点,总体风格讲求平直方正、对称均衡。新的《通用規範漢字表》的宋体字字形,应尽量符合宋体字的风格特点。

③遵循統一規則:調整字體,必須遵循統一規則。一切規則是在條件的控制下確立的,爲了減少隨意性,條件相同的字應按統一規則處理,條件有變化時規則才能變化。印刷字形的美化屬于工藝美術層面,也應考慮規則的一致性。

④嚴格控制特例:在按規則處理字形時,會出現一些特殊情況,完全不允許對個別字進行特殊處理是很難做到的;但在處理特例時應闡明充分的理由,盡量減少規則之外的特殊處理字形。

在總的原則控制下,宋體字的筆畫變異需要有進一步的理性規定。在這次字形調整中,制定了橫變提,豎變撇,捺變點,豎彎鈎變豎提,豎鈎、橫折鈎去鈎等五類筆形規則,這些規則是從原有字形規範中總結出來的,同時用來複查新的規範字是否符合這些規則。經過對字形的調整和美化,進一步取得了宋體字筆形的一致,使字形更趨于規律性、系統性。

《通用規範漢字表》以笔形变异规则为标准,对所收的8300字全部进行了复查,在统一笔形规则的前提下,生成了《通用規範漢字表》的宋体字形表,其中包括对《印刷通用汉字字形表》中与规则不一致的44个字的字形进行了调整,约占《印刷通用汉字字形表》总字数的0.57%。具体是:

①“琴、瑟、琵、琶”的上左和“徵”的中下部件“王”最後一筆橫變提

②“魅”的右部件和“籴、汆、褰、衾”的下部件的末筆捺變點

③“巽(撰、馔、噀同)”的上左部件“巳”的最後一筆豎彎鈎變豎提

④“親(榇同)、殺(刹、脎、铩、弑同)、條(滌、縧、鲦同)、茶(搽同)、新(薪同)、雜、寨”下部件“木”的豎鈎變豎

⑤“恿”的上部件和“瞥(弊、憋同)”的上左部件中橫折鈎變橫折

⑥“蓐、溽、缛、褥、耨、薅”中的部件“”以及“唇、蜃”由半包圍結構改爲上下結構

⑦“毂”的左下部件“車”上添加一短橫,與從“”諸字的字形取得一致。

十五、《字表》中微調的44個漢字字型

44個微調的漢字字形

《字表》發布後公衆的反應情況:

《通用規範漢字表(征求意见稿)》发布之后引起了较大的反应,据《字表》公开征求意见工作领导小组2009年9月2日公告,从8月12日到8月31日的二十天公开征求意见期间中,《字表》意见收集组共收到社会各界人士发来的电子邮件2688件、信函157件、传真67件,总计2912件。另外还有许多人士通过报纸、广播、电视、网络等媒体提出了大量的意见和建议。从公开征求意见情况来看,一是对字表公开征求意见的方式予以充分肯定;二是肯定字表的意义和作用;三是从不同角度提出了许多针对性强、富有建设性的主要集中在字形、补充用字和异体字三个方面的问题的意见和建议: 1,关于字形问题,44个汉字字形微调引起了社会广泛关注。大多数意见认为字形微调会改变长期以来形成的使用习惯,将给大众用字造成麻烦,担心影响学生学习、考试和增加社会成本,认为不宜轻易改动。

2,關于補充用字問題,要求補充用字的意見和建議占有很大比例,要求補充的字主要是姓氏、人名、地名、科技術語等方面的用字,大都是在語料庫和許多渠道中難以收集到的社會用字。比如“外‘門’內‘合'、上‘亠’下‘思’、上‘比’下‘幹’”等字。

3,關于異體字問題,多數意見贊成字表恢複51個異體字,認爲這符合社會用字實際需要,比如“喆、淼、仝”等字。

另據報道,教育部語言文字應用研究所所長姚喜雙在接受采訪時透露:“據我們統計的數字,絕大多數公衆是反對44個漢字微調的,這和網上的調查數據吻合。”對于此前有媒體所報道的教育部稱67%的公衆支持漢字微調與網上的八九成的不支持形成了鮮明的反差所引發了網友的質疑,姚喜雙指出:“說67%的公衆支持44個字的微調,是誤傳誤報。據我們統計的數字,絕大多數公衆是反對44個漢字微調的。這和網上的調查數據吻合。我們會把這個數據反映給專家組,請大家放心。”

雖然公衆主要是對44個漢字字形微調的反對意見比較強烈,但大多是即興式的情緒型呼籲,這在網絡和報紙中是很明顯的,而極少從理性上進行的認真研究討論。我認爲這主要有以下幾個原因:

一是給公衆征求意見的時間太短(從發布會到截止之日實際上不到二十天)、刊載的報紙普及面太窄(僅在發布次日即2009年8月13日的《中國教育報》上刊登),公衆中的語言文字研究和愛好者根本來不及細致地潛心分析研究,且這些人大都是中老年人,都習慣于使用傳統的紙質文本(如筆者,得知該消息後只有在網絡上閱讀《字表》及其說明等,得用好幾天的時間,其後的分析思考中就來不及再仔細查閱核對相關紙質資料,而快捷方便的網絡資料是不具有准確性的);

二是沒有把微調的具體理由和有待討論解決的問題向公衆說明白;

三是專家等的意見似乎沒有達成完全的一致(這在不少媒體采訪的消息中是可以看出來的),有的專家等解釋得十分勉強,特別是對公衆的即興質疑的答複使人感覺似乎是回避式的托詞;

四是發布之前沒先行向地方各級語言文字主管部門和媒體下發通知,各地方必須做的宣傳引導工作阙如;

五是一些媒體特別是網站從自身人氣的考慮而致使應有的公衆智慧資源沒能得以充分發掘采納;

六是《字表》本身還存有一些問題,甚至出現了自相矛盾之處。

七是近些年中社會用字的不規範現象、“複繁”爭議等問題使公衆對漢字改動十分敏感甚至心存芥蒂。

版权所有:武汉信息传播职业技术学院 COPYRIGHT 2012 ALL RIGHTS RESERVER

地址:湖北省武汉市江夏庙山经济开发区 邮编:430223 联系电话:81801042

鄂ICP備14001726號-1  鄂公網安備42011502000404號