【编程学习】每天进步一点点,编程学习之路:一款Mdict词典制作工具,Mdict Editor Tool v2.0.35 -- 多功能个性化词典制作工具

【编程学习】每天进步一点点,编程学习之路:一款Mdict词典制作工具,Mdict Editor Tool v2.0.35 -- 多功能个性化词典制作工具

这是一篇陈年旧贴,大学无聊的时候学习了Mdict词典的制作,顺手撸了个制作词典的工具,简化词典制作过程,提高词典制作效率。工具发布在了Pdawiki论坛上,供网友下载使用。

原贴传送门:https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=18986

Mdict Editor Tool v2.0.35 -- 多功能个性化词典制作工具

2017.03.27:
发现bug,修正更新。

2017.03.15:
新增提取功能,按HTML标签提取,速度虽然比不上正则,但简单易用,适合没有编程基础的同学,提取更方便。
正则虽强大,速度快,但处理HTML多层嵌套标签就显得力不从心了。
此功能依赖第三方库lxml,软件打包后体积也略大了一点。

关于多个词典CSS类名(class)重名问题,导致词典合并后样式混乱的解决方案
将词典源文本的所有类名批量改名,添一个前缀字符,再将该词典对应的.css文件里的类名批量替换,添加上该前缀字符。
以《21世纪大英汉词典》为例,把词典源文本中所有的类名 class="example" 添加上 【cent21_】前缀字符(即替换为 class="cent21_example";前缀字符由英文字母、数字及下划线组成,且以英文字母开头),与其它词典区分开来。

1.词典源文本正则替换:

class="(.+?)"

替换为

class="cent21_\1"

2.将样式表文件(.css)正则替换:

\.([a-Z])

替换为

.cent21_\1

即可解决合集词典CSS重名问题。该方法仅对class有效。

使用过程中网友遇到的问题解答:
第一类问题:合并词典的词条大小写区分问题
如网友VIPcoco所描述的问题: 36楼 place词条 language的内容跑道所有内容前面去了,mac下的欧路。
及网友rit919所描述的问题: 32楼 wood的人名词条重复出现extras区的最底部,而不是顶部。查cook,bush等词也有同样情况

原因及解决办法: 见原帖39楼 https://www.pdawiki.com/forum/fo ... &fromuid=203976

第二类问题:词典合并后javascript脚本报错
这种问题归结为两种情况
第1种情况:MDcict PC打开合集词典进入某个词条(还未点击切换按钮)时就弹出javascript脚本错误。
这是由于个别词典个别词条内容下的源数据本身问题,也就是说原词典(合并前)在MDict PC中进入某些词条会报错,词典合并后错误仍然存在,导致合集词典(xin1)也报错。
这种情况只能找词典原作者修复词典。
第2种情况:MDcict PC打开合集词典进入某个词条之后点击切换按钮切换词典时弹出javascript脚本错误。
这种还是词典源数据问题,导致程序新生成的div标签无法闭合,javascript找不到对象,导致切换词典时抛出错误。
这种情况下导致合集词典(xin1)切换时抛出错误的原词典由于源数据差异,并不适合做该合并方式的合集词典。
出现第2种情况时错误排查:
比如:A、B、C、D、E词典合并后"farther"词条出现此错误(即点击切换按钮则报错),那么应该就是这五个词典中的其中一个或多个词典源数据HTML标签无法闭合而导致的该问题。具体排查方法如下:

farther.png

1.将合并词典源文件后缀改为.html(用于显示语法高亮),使用EmEditor打开,查找正则:^farther\r\n,勾选正则表达式,查找定位到所查找的行。

2.复制该项词条下的内容(HTML源码),创建新的HTML文档,粘贴到刚刚创建的HTML文档

3.将显示切换为“wrap by page”

farther2.png

然后正则替换<div class="dict_content_display\r\n\r\n\r\n<div class="dict_content_display,再将鼠标逐个点击到<div class="dict_content_display标签上,EmEditor自动着色显示该标签是否已完整闭合,若某个标签不能闭合,则就是该标签下的词典内容所导致的合集词典在切换某个词条时报错,这样就找到了源数据有问题的词典。

farther3.png

4.最后一步就是修正有问题的词典源数据了,具体操作就要看情况而言了。

第三类问题:词典合并后的@@@LINK=
@@@LINK=这个用法我没有用过,不了解用法,不便谈论。
程序更新已解决这个问题,只是简单粗暴地用正则把@@@LINK=替换成跳转链接,点击便跳转到主词条。

------------ 假装华丽的分割线 ------------

Mdict Editor Tool v2.0.35

软件功能简介:

◆1.词典内容提取
①按单词列表提取。
②按正则表达式提取。如提取例句、音标、释义等。
③提取词典中所有词条。
④按HTML标签提取。

◆ 2.多词典合并
可合并多部词典,合并样式丰富,可自由选择样式。
程序自动生成CSS、JavaScript文件。
理论上可以合并任意无限多个词典,但合并词典数量取决于电脑本身配置。

◆ 3.词典锚点与制作
用于Mdict词典锚跳定位自动化制作,如词组短语、例句、释义、音标等多维查询词典制作。

◆ 4.词条合并
只需确定词头的所在的标签,便可自动给词头的右上角加入序号。同时生成可定位查找的词头标题。

◆ 5.词条去重

◎ 启动软件时部分功能已经预设完毕,刚开始使用此软件的同学可直接点击右下方按钮尝试制作。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352

推荐阅读更多精彩内容