资源描述
各大主流品牌DIY词典分析
做了一段时间各大主流品牌的DIY词典内容,发现了很多的内容和问题,现在就写个建议书大家一起看看吧!
给客户自己DIY词典的意义在于满足特殊用户的词典要求和内容需要。所以它需要的是制作方法傻瓜式和编辑的批量性,这样优秀的DIY产品就会诞生!目前做的最好的是名人的DIY工具。名人电子词典本身内置的版权词典就多,DIY出来的版权词典据不完全统计有200多本之多,由于名人的开放式系统,美化版的词典也相继出现。并且值得注意的是其制作出来的版权词典有很多是独有的版本。如:剑桥学习词典是任何品牌度没有做过的.
以下是各大品牌的词典DIY方法
名人电子词典制作方法:
1.把提取文本时输入的一串特殊符号(如"########")替换成▲^p▲。
2.把词条和音标之间的空格替换成▲■▲。
3.如果要使用"词典制做工具"(老版)做成词典,需要在16进制下(按键Ctrl+H)把每个音标替换成码位转换对照表中的学习机码位。
如果要使用"新词典制做工具V1.0"(新版)做成词典,需要把各个音标替换成相应的区别与别的字符串的特殊字符串(保存这个列表)。
4.处理到自己感觉已经基本成形了,就可以导入到Access中(导入到Access主要是为了检查错误,一般来说,处理文本不可能一次成功的)。
5.导入Access之前一定要将(▲■)这两个字符替换成单字节的符号如(#@$^)等等,但不要使用文件中以有的字符。导入时选择获取外部数据——〉导入——〉文件类型选择文本——〉导入文本向导下点击高级,按照下图填上各项。
6.导入后一般都会有错误,请对照错误项,再在UltraEdit中查找问题所在。
7.不停的修改文本中的错误,再导入,重复之,直到导入后没有错误为止。
8.导入没有错误并不意味着现在就可以继续导入到词典制做工具了,现在还需要检查是否有空字段和词条分割不合理的地方存在。在Access中点击"表"下面的"查询",双击"在设计视图中创建查询",在接下来出现的显示表中点击该词库的名字,点添加。下面的选择查询视图中按照下图填写
9.双击建立的查询,右击"字段1的长度",选择"升序排序",找到空字段,再在文本中找到问题所在,更正后再导入到Access中,反复检查,更正,导入。直到没有空字段为止,再按照"降序排序",看看有没有很长的单词(字段1实际上是单词,单词不可能太长,最大255)。如果发现明显不是单词而是一句话,则需要更改文本再导入。
10.按照第9步的方法检查字段二有没有空字段,若有,改正文本,导入文本。然后按照降序排序,看看字段二的长度有没有超过15000的,若有,在文本中找到这些词条,将其分割成几个较短的词条(因为名人词典支持的单个词条的长度不能超过15000,否则查的时候会死机或者在右上角单词框中显示乱码)。分割后再导入Access。
之后到名人下载中心去下载词典制作工具,导入数据包,做成词典。因为这一步较简单,具体过程略。需要注意的一点是,在使用新版打包工具,填写"特殊字符替换设定框"时,可以点击下面的"导出"(如上图),存储特殊字符的替换表,以便下次打包时不用一个一个填写,直接"导入"替换表即可。
其制作方法不是很难,由于工具的优秀使其可以做到整本收录,所以可是由于电子词典的读取词典的方式使其必须要排序,这个可是个弱点,更主要的还是还要替换学习机码位,有点麻烦,还有就是其有65536条的限制,目前已经有人特殊处理突破了这个限制,所以做名人的DIY词典的大都是高手,一般人是掌握不了的,而高手做的都是版权词典,在营销推广方面可以利用好这个下载词典大获其利润。如你到百度搜索“选购电子词典”只要是推荐名人的电子词典的没有人夸它的下载词典的!可是其实用性还不是很高。其本身内置的牛津等词典的词汇量之类度已经很出色的了,而顾客所需要的一些小型的便民之类的词典就没有什么了!
诺亚舟DIY词典的制作方法
本人是诺亚舟目前唯一一个会做诺亚舟电子词典的方法的人,也难怪,其工具令我抓狂啊!怎么好意思公布呢?(我是诺亚舟的朋友给我的)其工具差的本质原因在于其一开始做电子词典的事情就没有考虑到下载词典的的统一程序的重要性质,所以彩屏机一个程序,黑白机一个程序,英汉词典一个程序,汉英词典一个程序,好多机型不通用。并且值得注意的是它的每个制作程序还有7到8个副程序的哦,气死你啊!所以目前诺亚舟怎么也没有公布其下载词典制作工具!
看看这个就是诺亚舟的黑白机的汉英词典制作工具哦!
其制作方法是写入文本的格式为
汉英词典为这样的:汉语词条项目+换行符+解释项目。
英汉词典为这样的:英语词条项目+换行符+解释项目
也就是谁换行符是其识别符哦,值得一提的是英汉词典只支持一段的解释,而且还有字节限制,汉英词典支持多段解释,可是不是回车表示的,而是在需要回车的地方写入换行符。全部整理好了之后也要排序的哦!之后再转换其词典读取程序的BUG很多,导致其下载词典功能不好用啊!诺亚舟的工具差可是其最大的有点就是其支持最大超过48万的词条是谁都比不上的哦!查词速度都是一样的,这个和其他品牌大不相同!
步步高DIY词典制作方法
步步高的词典制作工具只能说较为简便的一种,可是其技术却不怎么样。步步高的词典制作工具有2套的。一套是A系列的。一套是外语通的{注意:这个工具是某网站的人员爱好者写的}
2套工具的制作方法都差不多,前者是利用MEB格式的导入再转换。可是A系列的工具只支持3000条此条的哦!这个是行业里可以说是最差的了!外语通的那套也不怎么样支持的也只有3万个词条而已.目前好像已经推出升级版解决此问题。
以外语通的电子词典系列制作为例子
1.用ultraedit.exe按词典的格式编辑好中文数据。选择排序:
2. 选择升序排序即可。保存好TXT文档。导入到词典编辑器即可
可是其有个很大的缺点,.因为软件是使用c#开发的,所以要使用词典编辑器首先要安装.net组件.这个组件几百M啊!很麻烦啊!不过步步高的FANS还是特别喜欢这个东东,已经作出了一些大型的词典文件了。
快易典DIY词典制作方法
一说到快易典的词典工具我认为他是目前最值得推广的词典DIY方法。值得注意的是他的工具只有37K哦!而且可以多段解释。制作方法及其简单。很适合满足用户的要求。遗憾就是是字库太少,经常出现一些乱码!再者就是其要求源文件必须是ANSI字符编码格式的,也就是不支持音标显示的哦!这就太可惜了!
其词典制作方法的编码示意图如下
解释项目如果是多段解释的话直接回车就是了,这个很不错。而且值得注意的是它是目前唯一一个不需要排序源文件的工具哦,还是比较强大的。之后就用转换器转换就是了.
由于读取文件的内存有限。经过我的试验。发现支持14万个词条项目的时候最好。如果多了的话会有读取错误和读取死机的现象.其最大的缺点还是不支持小语种词典。太可惜了!
译科思的DIY词典制作方法
前日拿到了译科思的词典DIY工具。我只能说是太强大了,强大到无法接手,强大到令你抓狂啊!
这个是译科思的制作说明书
一、工具安装:
1、将压缩包解压后,在解压的目录中有如下文件及目录。
2、安装插件
运行msxml40-1.msi ,根据提示安装即可。
二、运行
运行程序“ESUDDIY.exe”出现如下界面:
三、设置参数
1、字典名称
字典名称就是所要制作的字典的全称如要制作《实用英汉》的字典数据则在“字典名称”栏填入“实用英汉”。
2、字典标号
每一本字典数据都要指定一个标号。标号一但被某一本字典所使用,就不能再用同一标号来生成另一本字典数据。最多可用标号为20个。
3、字典类型
用于说明字典内容是那一种或那两种语言。如《实用英汉》的字典类型是“英汉词典”。
4、Excel文件
Excel 文件就是用户用Excel l软件制作的字典数据。
Excel 文件格式要求如下:
字段说明:
检索词:用于检索词条的内容,如果为空则用“主词”充当检索词。
主词: 即词头。不能为空。
读音: 如是英语词典该处就放音标,如是汉语词典该放拼音。可以为空。
词性: 可以为空。
标识: 用于说明“解释”字段的内容特征。必须按要求填写。
Word: 表示一个词条开始。
Exp: 表示“解释”字段内容为词条的解释.
ForExm: 表示“解释”字段内容为词条的外国语例句。如是英汉辞典则表示“解释”字段的内容为英语例句。
NatExm: 表示“解释”字段内容为词条的本国语例句。如是英汉辞典则表示“解释”字段的内容为汉语例句。
注意:“标识”字段中的内容不能随意填写,只能填写“Word”、“Exp”、“ForExm”、“NatExm”。
四、数据制作
将参数据填写完毕后,点击“制作”按扭。如制作成功界面如下图:
如不成功信息框会提示失败的原因。
制作好的数据在用户Excel文件目录中的IntMed 目录里,其文件名后缀为*.btx *.dnd 。
五、数据使用
将制作好的 *.btx 、*.dnd 两个文件复制到字典机中去,运行字典机中的“安装与卸载”程序。运行字典机中的“数据浏览”程序,找到数据所在目录并选择用户词典数据,运行即可。
六、注意事项:
1、不能随意删除解压目录中的任意目录及文件。
2、用户必须用Excel软件按要求制作字典数据。
3、用户编写的字典数据,本公司不承担任何的版权责任。
这个工具是在太牛逼了.是真的。是这些工具里面最强大的了。可是它的致命缺点就是它不符合DIY下载词典制作工具的诞生意义了!
客户需要的下载词典制作工具制作方法傻瓜式和编辑的批量性.可是它都不满足哦!
不足1:目前XLS格式的档案只支持65536行(除非使用OFFICE 2007)。现在一般大点的词典动不动就10多万个词条。而且每个词条按照这个格式去做。一个词条项目要占4到5行少则2到3行的话不到输入20000多个词条这个XLS格式的文档就没用了.一本词典怎么做完?
不足2:不能批量性。转换工具如果是支持TXT的源文件的话。我们有UE等大型的整理软件去整理帮忙。可是XLS格式我们怎么下手呢?况且需要的格式那么乱?难道我们要一个一个输入?吐血!
不足3:转换的速度慢。词条多了转换的成功率就不高,而且此工具的转换速度很慢啊!我昨天试了一下一个大概2万个词条的文件转换花了1个小时,后面还说出现了错误!救命啊!
不足4:译科思的电子词典的文件夹和文件名大多是英文命名的,而工具转换后生成的文件有20多个。需要找到 *.btx 、*.dnd 2个文件麻烦啊!生成的其他文件为什么不自动删除呢?
其他的不足还不知道,转换后的成品也不知道效果如何,我也没机器测试,所以就不知道了.这个工具强大到不适合用户去用了。一定要改啊!其工具最大的优点就是其内核是Unicode的,支持很多别的电子词典不支持的字符还有就是它支持的词典类型特别多!强大,强大。译科思果然是技术性为代表的公司啊!
新工具的开发建议
为了进一步提升自己产品的市场竞争力我个人认为做出新的制作工应该满足以下的要求:
1. 词典的源文件的支持必须是MDB或者TXT格式的。最好2个都支持.
2. 字库的扩容,最好是Unicode内核,这样可以支持音标的显示
3. 格式我建议是以下那种格式的
;;
temperature
KK: []
n.
◆◆1. 温度,气温[C][U]
〓〓The temperature dropped abruptly.
气温骤然下降。
◆◆2. 体温[C][U]
〓〓A nurse took his temperature.
护士为他量体温。
◆◆3. 【口】热度,发烧[S1]
反复这样的格式内容绝对没有干涉,全部是用户自己定义,音标是否有都由用户定。其中◆◆与〓〓我只是一个标签,在转换的的时候可以,转换器可以更具这些标签说明这段文字是斜体或者粗体。如果是彩屏机的话我建议还可以插入颜色定义标签!
4. 我认为输入法配置的文件可以也在文件里面,压缩成一个文件。在转换的时候选择词典类型的时候可以选择3中类型。第一个是英汉词典,第二个是汉英词典,第三个是小语种就可以了。选择小语种的时候会需要作者选择输入法文件。而输入法的文件可以由作者自己制作出来的。所以就不会有输入法的限制了,电子词典可是实现任何时候的升值了!
谢谢!
元 素
2007年12月28日
展开阅读全文