“偏旁” vs “部首”
来自《现代汉语词典》(第7版)的定义:
偏旁:(名)在汉字形体中常常出现的某些组成部分,如……
部首:(名)具有字形归类作用的偏旁,是字书中各部的首字。
来自《汉字部首表》(GF0011-2009)中的“术语和定义”一节以及《GB 13000.1 字符集汉字部首归部规范》(GF0012-2009)中的“术语和定义”一节,同时给出了建议的英文名称:
偏旁(radical):合体字的构字单位。旧称合体字左为偏右为旁,今不论左、右或上、下统称为偏旁。
部首(indexing component):可以成批构字的一部分部件。凡含有某一部件构成的字,在字集中均排列在一起,该部件作为领头单位排在开头,成为查字的依据。
两种定义基本上一致,都认为“偏旁”泛指一般的汉字部件,而“部首”是偏旁中的一部分,用于将汉字分类并建立索引,而每个部首作为所属分类的第一条索引。
英文单词“radical”用法各异,可能需要根据语境判断含义。许多情形中同汉语定义的“偏旁”,但 Kangxi Radicals 等词组中使用的是“部首”这个词义,例如:
英文维基的 Radical (Chinese characters) 词条(https://en.wikipedia.org/wiki/Radical_(Chinese_characters))将 radical 也解释为“部首”,和 indexing component 同义。
Webster 词典(在线版,https://www.merriam-webster.com/ )中的 radical 词条没有直接对应“偏旁”或“部首”的义项。
Wiktionary 的 radical 词条记录的义项为“形部/形符”,原文为“the portion of a character (if any) that provides an indication of its meaning, as opposed to phonetic”。
汉字部首规范的发展
1983年之前
《新华字典》在交由商务印书馆出版之前,由人教社出版了两版,其中1954年版编写了部首检字表。
很长一段时间来,关于汉字部首并未明确出台一个国家层面的规范文件。这某种程度上甚至影响到了一些其它规范的制定,例如 GB2312-1980 字符集国家标准收录的 6763 个汉字中,一级汉字(3755 字)按拼音排序,二级汉字(3008 字)按部首排序,标准的原文写道:“本标准采用的部首与一般字典用的部首基本相同,略有改并。”
1983年
中国文字改革委员会(现国家语言文字工作委员会)和国家出版局(现国家新闻出版署)于 1983 年公布了《汉字统一部首表(草案)》。草案规定了 201 个主部首和其中一些部首的繁体和异体样式(总计80个)。
2009年
《汉字部首表》由教育部和国家语委于 2009 年公布,沿用了 83 年草案的 201 个主部首,并明确了“附形部首”的概念,由 83 年草案的 80 个变体/繁体样式扩展到 09 年版的 100 个附形部首。
我个人体会最深的一个改动是将“朩”确定为“木”的附形部首。真实的小故事一则:
小学使用的《新华字典》是 1993 年出版的第 8 版(重排本),“朩”尚未作为“木”的附形部首明确标出。当时语文老师带大家查“杂”字,在部首检字表中查了许久也没查到,直到放学老师下班之后我们自己查到了,老师后来也在家查到了。自此这位老师写“杂”字都是这么写的:
《现代汉语词典》中,六个汉字归于“朩”部,“条亲條”按照多开门规则归于其它部首和“朩”部中,“杀杂弑”仅归于“朩”部;另外“朩”也是“茶余”等字的偏旁,虽然这些字不归于“朩”部。
另一个较大的改动是将“竖钩”由折笔改归为竖笔,这影响到了部首表本身以及部首检字表的排序。
与《汉字部首表》同时发布的规范《GB 13000.1 字符集汉字部首归部规范》(GB0012-2009)规定了为汉字归部的一套原则:
优先从左、上、外位置取部首;
左、上、外不是部首而右、下、内是部首的,从右、下、内位置取部首;
左右、上下不是部首的,按先左后右、先上后下的原则从偏旁中拆分取部首;
按照前三条原则取不到部首的,取第一笔作为部首;
确定取部首位置后,优先选取笔画多的部首。
这套原则有时与使用/教学习惯相左,如“思”字按“左上外优先”的原则归于“田”部,但按使用和教学习惯归于“心”部。字典一般会照顾到使用/教学习惯,对这种字采取“双开门”的策略,在两个或更多部首中归部。
GB 13000 国家标准等价于 ISO/IEC 10646 国际标准,后者是 Unicode 的 ISO 标准化版本。语言文字规范中引用的 GB 13000.1-93 等价于 ISO/IEC 10646-1:1993,对应 Unicode 1.1 版本,收录了 20902 个 CJK 统一表意文字(以下用 Unified Repertoire and Ordering / URO 代称)。这些汉字从 Unicode 1.0.1 版本收录,并作为 GB13000.1 国家标准被 GBK 字符集/编码方案完全收录,完整支持这些汉字的字体产品现在也有一定规模。
2013 年公布的《通用规范汉字表》未公布对应的部首归部信息。《通用规范汉字表》8105 个汉字中有 276 个不属于 URO,不过都是左右、左中右等结构明确、容易归部的汉字。
Unicode 中的部首
Unicode 中的汉字部首沿用了《康熙字典》的 214 个部首(康熙部首 / Kangxi Radicals)。Unicode 中连续的区块,比如 URO 以及后来添加的扩展 A、扩展 B 等,均按照康熙部首归部并排序。
将 214 个康熙部首和国家规范中的 201 个主部首进行对比,其中相同的部首有 170 个:
一丨丶丿亠人儿八冂冖冫几凵刀力勹匕匚十卜
卩厂厶又口囗土夂夕大女子宀寸小尢尸屮山巛
工己巾干幺广廴廾弋弓彐彡彳心戈手支攴文斗
斤方无日月木欠止歹殳毋比毛氏气水火爪父片
牙牛犬瓜瓦甘生田疋疒癶白皮皿目矛矢石示禾
穴立竹米糸缶羊羽老而耒耳聿肉臣自至臼舌舟
艮色虍虫血衣角言谷豆豕豸赤走足身辛辰邑酉
釆里金阜隶隹雨非面革韭音食首香骨高髟鬥鬲
鬼鹿麻黍黑鼎鼓鼠鼻龠
不同的部分,康熙部首(44 个):
乙亅二入匸士夊戶曰爻爿玄玉用禸网舛艸行襾
見貝車辵長門靑韋頁風飛馬鬯魚鳥鹵麥黃黹黽
齊齒龍龜
国家规范(主部首,31 个):
乛艹丬门辶飞马王韦车贝见长风户龙业罒鸟覀
页齐麦卤龟青龺齿黾鱼黄
其中,29 个康熙部首和 28 个主部首为简繁/异体的对应关系,其中除了“户/戶”、“青/靑”、“黄/黃”外在国家规范中为主部首/附形部首的关系:
乛/乙(亅) 艹/艸 丬/爿 门/門 辶/辵 飞/飛 马/馬
王/玉 韦/韋 车/車 贝/貝 见/見 长/長 风/風 户/戶
龙/龍 鸟/鳥 覀/襾 页/頁 齐/齊 麦/麥 卤/鹵 龟/龜
青/靑 齿/齒 黾/黽 鱼/魚 黄/黃
更特殊的一些情形(关于汉字的统计数据,使用的样本为 URO,20902字):
康熙部首中既包括“人土日”也包括“入士曰”。在国家规范中后者归为为“人土日”三个主部首的附形部首。
康熙部首中的“匸夊”用于港澳台日等字形的某些汉字,在国家规范中则使用“匚夂”字形并归部。
匸部:匸匹区医匼匽匾匿區
夊部:夊夋夌复夎夏夐夑夒夓夔
国家规范中的“罒”部,其归部汉字在康熙部首中归“目”部或“网”部。
国家规范中的“龺”部,其归部汉字在康熙部首中均以右半部的偏旁归部。
康熙部首中的“黹”部,其归部汉字在国家规范中归“业”部。“业”部的其它汉字(“业邺”等)按康熙部首归于其它部。
黹部:黹黺黻黼
康熙部首中的“行”部,其归部汉字(部首本身除外)为左中右结构、以“彳”和“亍”为偏旁的汉字,在国家规范中归“彳”部。
行部:行衍衎衏衐衑衒術衔衕衖街衘衙衚衛衜衝衞衟衠衡衢
其它国家规范中未使用的康熙部首:
二部:二亍于亏亐云互亓五井亖亗亘亙亚些亜亝亞亟
爻部:爻爼爽爾
玄部:玄玅玆率玈
用部:用甩甪甫甬甭甮甯
禸部:禸禹禺离禼禽
舛部:舛舜舝舞
鬯部:鬯鬰鬱
小插曲
康熙部首在 Unicode 中的码位为 U+2F00~U+2FD5,并且每一个部首在 URO 都有对应的汉字编码(https://www.unicode.org/Public/UCD/latest/ucd/CJKRadicals.txt )。
在为康熙部首制作了字形的字体中,出于节省空间等原因,可能会将康熙部首和对应的汉字映射到同一个字形(glyph)上。于是可能出现这么个问题:“明明写的是个‘工’字,从 PDF 复制出来,总感觉怪怪的,一查,怎么是个‘康熙部首’!”这其实就是从字形反推 Unicode 编码时没能处理好这种“一对多”情形导致的。