“横竖撇点折”之误

2006年9月9日

不知道是谁,什么时候,依据什么理由,把组成汉字的多种基本笔形,归结为“横竖撇点折”五类,后来又写进了国家的语言文字规范之中。

以下是摘自2001年12月19日发布的《中华人民共和国教育部,国家语言文字工作委员会语言文字规范,GB13000.1字符集汉字折笔规范》第一节(范围)的内容:

1965年中华人民共和国文化部和中国文字改革委员会发布《印刷通用汉字字形表》,该表规定汉字的主笔形为横、竖、撇、点、折,汉字附笔形中,提(一)归于横,竖钩(亅)归于竖,捺(乀)归于点,横折撇(乛)、竖弯横钩(乚)等折笔归于折。本规范进一步规定了汉字(印刷宋体)折笔笔形分类……。

本规范主要适用于中文信息处理、汉字排序检索等方面,也可供汉字教学界参考。

把汉字的基本笔形归结为“横竖撇点折”,已被大众所熟悉,并被广泛地应用于汉字编码检索等中文信息技术处理领域。

“横竖撇点折”之误在于,把横与横折,竖与竖折,撇与撇折分开,把分出来的横折,竖折,撇折,捺钩等归为同一类。

“横竖撇点折”之误,可以从两个方面说明,一是归类与常理不符,二是对20多年来的汉字形码输入法的研究,起了错误的引导作用,造成了严重的损失。

错误的第一个方面:归类不合常理。

按常理应该把:

1、路、直路、弯路,归为同类(路类);

2、月、满月、弯月,归为同类(月类);

3、刀、直刀、弯刀,归为同类(刀类);

4、花、花蕾、花瓣,归为同类(花类);

如果把“弯路、弯月,弯刀,花瓣”另作一类(如弯类),而形成“路类,月类,刀类,花类,弯类”五类,这个“弯类”就不伦不类,不合常理。

同理,把:

1、横、横折撇、横折捺,归为同类(横起笔类);

2、竖、竖折左钩、竖折右钩,归为同类(竖起笔类);

3、撇、撇折、撇折钩,归为同类(撇起笔类);

4、点、捺、捺钩,归为点类(点或捺起笔类)。

如果把“横折、竖折、撇折、捺钩”归为同类(折类),而形成“横竖撇点折”五类,这个“折类”就不伦不类,违反了常理。

有人会说,专家们违反常理地把“横折、竖折,撇折、捺钩”归为同类(折类),一定有其特殊的原因,会是为了一个好的结果。我也这样想,但我没有想出这样分类的好处,倒是看到了这样分类,对汉字形码研究带来的坏处。

错误的第二个方面:“横竖撇点折”误导了汉字形码的研究长达20多年。20多年的时间里,数以万计的中国人,为了研究出一个易学易用的汉字形码,付出了无数宝贵的时间和心血,最终也没有达到理想的目的,这也使汉字形码,给人烙上难学难记印记。

以“五笔字型”,“二笔输入法”为主要代表汉字形码编码方案,对笔画,字根,汉字分区分位,都遵循国家语言文字规范中“横竖撇点折”基本笔画分类规则,将汉字字根表分为“横竖撇点折”五个区,结果是字根与汉字在这5个区中的分布很不均匀。

以国标GB2312字符集的6763个字为例,理想的排布是每区1352.6个字各占总数的20%,但实际在横区中汉字有1962个占29.0%,在折区的汉字为732个占10.8%。再加上“横竖撇点折”的分位规则,就造成了在“横与横,横与竖,竖与折,点与点”等码位上集中了太多的单字,而在“横与折,横与点,竖与撇,竖与点,折与横”等码位上,就只有很少的单字,这样严重的不均衡,使得重码很多,做出来的汉字形码没有实用的价值,为了克服这个缺点,各形码输入法都对字根做跨区跨位调整,调整后的字根表就没有了一致的有规律的顺序,字根表就难学难记了。

如“五笔字型”就有50%的字根是无规则排布的,“二笔输入法”虽然有严格的顺序规则,但重码太多,为了克服重码,不得不用音码做补充。

汉字形码字根表设计上遇到的困难,是在“横竖撇点折”分类方法错误引导下造成的,不是汉字的特点,打破这个分类分区方法,汉字形码就能有实质性的进步。

在不了解“横竖撇点折”规范的情况下,和码将汉字的基本笔画归纳为四类:“横竖撇点”,把横与横折放在一起,竖与竖折放在一起,撇与撇折放在一起。考虑到横与横折起笔的字根与汉字最多,在对汉字分区时,就把横分为两个区,即把与其它笔画相交的横起笔的字根(如:扌土艹大木等)单独作为一区。

25个常用字根表

 和码字根表

和码把汉字笔画分为“横竖撇点”四类,把字根分为“横竖十撇捺”五个区,使汉字在各区的分布基本均匀。在此分区基础上建立的和码字根表,有严格的顺序规则,把这个顺序用12345五个数字表示,就形成了25个数字码,数字化后的和码,不仅易学易记,还能在电脑的字母键盘与数字键盘上使用,也能在手机键盘上使用,从而实现了和码在不同的输入设备上完全的统一通用。

在26个键与10个键的不同输入设备上,和码具有同一个字根表,同一种取码方法,与相同的低重码率。

仔细思考为什么汉字形码走了20多年的弯路,我认为问题出在“横竖撇点折”的笔画分类规范上,是这个规范的错误导向,约束了人们的思维,使20多年汉字形码的研究走上了歧路。

为什么要把汉字的基本笔形归结为“横竖撇点折”,为什么要把“横折、竖折、撇折”归为同类(折类),有了上述的坏处,它的好处在那里呢?