北大中文论坛 www.pkucn.com

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 10525|回复: 80

汉语大字典第二版检索表excel发布

[复制链接]
发表于 2013-6-15 02:54:15 | 显示全部楼层 |阅读模式
本帖最后由 tsiank 于 2014-10-9 15:54 编辑



现发布汉语大字典第二版检索表,欢迎大家下载使用。


汉语大字典(第二版)检字表说明

一.        本检字表以第一版字表为基础,经与第二版逐页对照,调整次序,增加字数,将每页的第一个字头及最后一个字头标注页码,而后在EmEditor中利用正则表达式形成每个字头的页码,在excel中利用计算重复次数的countif函数生成每个字头的页内次序,从而完成本表的制作,除外下文提到的那11个字,应该包括了第一版字表上的所有字。
二.        按汉语大字典第二版所言,本版共收字60370个,可是我所整理出来的字头共有60232个,比所说的少了138个,可能是由于我赶进度以及疏忽,把这138个字漏掉了。
三.        在这60232个字头中,用五笔打不出来的共有4590个(我用的五笔码表收录了CJK基本及扩展ABCD区中的全部字,也就是包括了目前所有已编码的汉字)。我说的打不出,指的是我自己打不出来,应该一部分是拆码错误,另一部分是目前的unicode标准确实尚未收录该字。等CJK-E,F发布后估计会补充一部分?
四.        我把这4590个字头分为两部分:异体替代字头(149字)和待定字头(4441字)。前者指该字头虽然打不出来,但可以找到该字头的异体字,于是用异体字加中括号来代替该字头;后者指导该字头打不出来,也未找到异体字,于是用字母X来表示。
五.        在这60232个字头之外,尚有第一版收录的11个字头在第二版中我自己找不到任何对应字头。这11个字头为:𡊡 𡔨  𢀙  𥾋  𩃯  𨥣  𨳔  𨴺  𨵚  𩜣  𣼨  。
六.        有的字头后跟的小括号里面的字为该字的简体字;有的字头后跟的中括号里面的字为该字在第一版中的异体字(由于新旧字形的关系,第一版中新旧字形同收的字比如併和倂,在第二版中已经合而为一,只收新字形,不收旧字形。这类字大多是以幷或幵作部件的字)。有的字头后跟的大括号里面的字为该字的类推简化字,这些类推简化字第二版不一定收录。
七.        表中跨页1,跨页2,跨页3表示连续这几页都有该字头的义项。这个我主要是想把汉语大字典做成mdict格式的电子词典而用的。
八.        该字表目前并不是太完善,但日常查询使用应该基本上不成问题了。只是希望发出来以后大家能一起校对完善它。如果大家在使用过程中发现了错误,找到了所漏的字,打出了我没有打出的字,希望都能够在此提出来以便共同更新。

汉语大字典第二版检字表第二次更新:

本次更新,修正了几十处字头与页码对应错误的问题,增加了一百多个原先没有打出的字头,这些大部分是由extc先生发现并增补的。另外,异体字替换成网上得到的汉语大字典(第一版)异体字,这个异体字表由DAUFU先生发布。excel检索表内的四千多个待定字头增加了由extc先生提供的字体图片以供参考。目前检索表中字头共计60336个,与前言声称的60370个相比尚缺34个,如果大家在使用过程中发现缺失的字头以及其他错误,请在此反馈或者发邮件给我(邮箱:tsiank@qq.com)。


4月15日更新:
修正错误,增加字头,
目前检索表中字头共计60367个,与前言声称的60370个相比尚缺3个!




本次更新下载地址:
http://pan.baidu.com/s/1qWruc2K&third=2

注:72楼有南阳钰锋先生开发的汉语大词典精确检索程序,欢迎大家下载使用。
                                                  
发表于 2013-6-15 09:14:25 | 显示全部楼层
本帖最后由 星空一号 于 2013-6-15 09:19 编辑

哦,听到这个消息,先恭贺一下。

提示一下:前些天你说过,有些字(类推简化字)打不出来,希望能在另一张Excel表格中专门列举出来。
发表于 2013-6-15 09:33:16 | 显示全部楼层
发表于 2013-6-16 20:33:15 | 显示全部楼层
OK,谢谢,先看看。辛苦了。
 楼主| 发表于 2013-6-17 00:01:38 | 显示全部楼层
星空一号 发表于 2013-6-15 09:14
哦,听到这个消息,先恭贺一下。

提示一下:前些天你说过,有些字(类推简化 ...

那些找不出来的字我都用X表示了

点评

你该有个列表,列出是哪些字,在哪一页,不然,大家都不清楚呢。  发表于 2013-6-17 09:34
发表于 2013-6-17 11:04:06 | 显示全部楼层
按汉语大字典第二版所言,本版共收字60370个,可是我所整理出来的字头共有60232个,比所说的少了138个,可能是由于我赶进度以及疏忽,把这138个字漏掉了。
————————————————————————————————
不要紧,既然都弄出来了,再慢慢核对一遍,看漏掉了哪些字?或许是大字典本身就统计错了。
发表于 2013-6-17 11:08:20 | 显示全部楼层
本帖最后由 星空一号 于 2013-6-17 16:24 编辑

有的字头后跟的中括号里面的字为该字在第一版中的异体字
——————————————————————————
这部分字,可能是兼容字,在Unicode兼容区。你使用的五笔,可能不能打兼容区的字。

这里提供几个字,请修改(采用复制、替换的方法)
27页4字 丽
5125页12字(与5126页3字重复),应该是
发表于 2013-6-17 17:10:37 | 显示全部楼层
发现页码错误
2116页(1-5),应该为2115页(1-5)
2117页(1-15),应为2116页(1-15)
2117页(16-24),应为2116页(1-9)
发表于 2013-6-17 17:10:51 | 显示全部楼层
发现页码错误
2116页(1-5),应该为2115页(1-5)
2117页(1-15),应为2116页(1-15)
2117页(16-24),应为2116页(1-9)
 楼主| 发表于 2013-6-17 22:04:08 | 显示全部楼层
星空一号 发表于 2013-6-17 17:10
发现页码错误
2116页(1-5),应该为2115页(1-5)
2117页(1-15),应为2116页(1-15)

谢谢。已经修改,下载文件已经更新。
发表于 2013-6-19 09:02:54 | 显示全部楼层
检字表已经做好了,楼主能否趁重新核对之机,整理一下读音和异体字?
发表于 2013-6-19 23:12:56 | 显示全部楼层
樓主辛苦了
发表于 2013-7-2 10:23:23 | 显示全部楼层
楼主,怎么没有下文消息了?
发表于 2013-7-3 15:04:01 | 显示全部楼层
楼主高人,如此枯燥乏味费力费时的工作,实属不易。
发表于 2013-7-3 16:36:41 来自手机 | 显示全部楼层
支持!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|北大中文系 ( 京ICP备12040209号

GMT+8, 2016-8-8 18:31 , Processed in 0.141708 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表