可可拼音输入法用户词库开发进程

词库是可可拼音输入法最弱的一环,最近一段时间一直在开发调试用户词库部分,把这个拿下,可可拼音输入法可以说是比较完美了。

可可拼音输入法是基于LatinIME,有两个词库,一个系统词库,一个用户词库,之前做了一个词库制作工具,见做了个简陋版的词库生成工具,这个工具是制作系统词库的,因为需要非常好的词频生成的词库才好用,否则作用不大,因此最近两个月我一直在不断的改进用户词库同步部分,到今天终于做出了一个能用的版本,接下来一段时间进行一部分测试,然后制作一个用户词库生成工具,后面有时间再对可可拼音输入法进行改进,增加词库同步功能。

不过首先弄出一个几十万的词库先用着,后面再考虑扩展,我个人觉得用户词库最好是从自己以前的个人词库导出来的词进行制作,否则词库太大势必会影响检索速度,目前我还没有进行测试,词汇量过大到底有多大影响还是未知的。

Python+MySQL做了一整套的词库导入导出及生成工具,词库目前有65w词汇,其中20w是自己的私有词汇

2022-04-03 21:52:13 星期日
可可拼音输入法29w词库下载

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

 桂ICP备15001694号-3