Win10自带的微软拼音一直以来有不少忠粉,但是词库导入导出一直是一个问题,因为微软拼音的自学习词库是自有格式,没有对外开放,所以一直没有解决。只能通过自定义短语的形式导入其他输入法的词库到微软拼音中。
最近经过网友的提醒,再自我研究了几晚上,终于把微软拼音的自学习词库导入导出解决了。
本次2.8版本的发布主要包含了以下更新:
- 微软拼音自学习词库的导入和导出。
- 转换词库时如果某些词条无法转换,通过错误窗口提示错误信息。
- 增强了微软拼音自定义短语对多种双拼方案的支持。
- 修改持续集成的实现方式,使用GitHub Action实现自动化的测试。
微软拼音自学习词库对词库的支持是2W个词条,所以如果源词库太大,则无法导入,所以本转换工具也做了限制,只支持2W条内的词库转换,如果源词库太大,可以通过高级设置中的词条长度、词频等过滤条件,将词库控制在2W内。下面以搜狗拼音词库转微软拼音为例:
搜狗拼音把用户词库导出成bin文件,然后打开深蓝词库转换,点击高级设置的“词条过滤设置”,设置一个合理的词频或者其他过滤,让最终文件词条小于2W。
然后点击“转换”按钮,完成微软拼音自学习词库的生成。
打开微软拼音的自学习词库导入页面,选择刚才生成的dat文件,进行导入,几秒后提示导入成功。
最近由于疫情原因,墙的火力很猛,可能无法下载,我这里也放一个下载地址:深蓝词库转换2.8