人老了容易怀旧。最近找了一堆以前看过的耽美小说复习。有一本处理完"阴阳乾坤"变成"阴阳干坤"。我瞬间抓狂~最讨厌这种东西了啦!
繁简转换我是直接拿 pyzh 项目里的 fanjian.py 来做的。 opencc 的那个高级过头,改变了用词,引用什么的会比较麻烦。又不是看不懂,转换只是图个眼睛爽而已。
记得以前用过一个繁简转换的程序是只转一一对应的汉字,一对多/多对一的都留着不动,我觉得很符合我的需求,可惜后来电脑硬盘和手机存储卡屡次挂掉,早就不知所踪,更不记得来历。这次既然需要了就自己搞一下。
在维基百科找到了"简繁一一对应表" http://zh.wikipedia.org/zh/Wikipedia:Unihan%E7%B9%81%E7%AE%80%E4%BD%93%E5%AF%B9%E7%85%A7%E8%A1%A8/%E7%AE%80%E7%B9%81%E4%B8%80%E4%B8%80%E5%AF%B9%E5%BA%94%E8%A1%A8 ,把网页连锅端回来,用字符串方法和正则表达式整理成字典的样子,把 fanjian.py 里字典 _simp2trad 的内容换掉就好了。
给 N900 和电脑用的版本以上就算搞定了。给 N72 用的版本还有一点工作:自带的点阵字体不是特别全,字体里有部分正体字没有对应按偏旁类推简化的简化字,不加处理的话原本能看到的简化之后反而变成口口。在手机上把显示不出来的条目注释掉就好了。一共两千来个字而已,过一遍发现好多不认识的生字~算是意外收获~
这些都是在 N72 上做的……我知道自己很蛋疼的啦~不过满足了自己的需求,自己动手丰衣足食很开心。这就足够了=w=
--
没有评论:
发表评论