-
Notifications
You must be signed in to change notification settings - Fork 88
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
切换五笔词库为极点五笔十周年版本 #3
Conversation
Remove all wrong freqs from google
基於以下兩個理由,關閉工單:
|
我目前的做法是:
|
先解決授權問題吧。 解決第二個問題需要寫一些腳本比較兩份碼表,把增加、減少的字碼及重碼順序發生變化的地方篩選出來,再人工複覈。 |
试了好几个方法,已经联系不上作者了。 并且我也已经准备自己维护一套码表了。 |
其实极点五笔用的是窝子词库,我在 Twitter 上 @ 他了,但是暂时没有回应。 |
@lotem @chenzhiwei 已在 Twitter 上联系到作者: 狂飙 on Twitter: "@wozy 您好,我之前一直用极点五笔,感觉自带的窝子词库非常好用。现在极点五笔已不再更新,因此转而使用 Rime 输入法,但是 Rime 默认自带的五笔词库存在很多问题,请问可以将窝子词库授权给 Rime 输入法使用吗? https://t.co/aRHPj3vTbA" / Twitter 窝子 on Twitter: "@networm hi,不好意思,有颇长一段时间没有用Twitter了,刚看到你的信息。可以的,建议让作者直接跟我联系。" / Twitter |
2024年,问题依旧,没有任何改善 |
来用我自己维护的词库吧,把繁体字、非标准字都删除了。 目前是我感觉最好的五笔词库了 😀 |
我也弄了一个方案,提取的微软五笔编码 Rime 86五笔单字方案 - 狂飙 |
问题
由于 Rime 默认的五笔词库加入了词频,导致有些字的简体与繁体顺序出现了错误。
顔
,第二位才是颜
筆
,第二位才是律
这只是其中的两例,可能整个词库还有数不清的错误。
五笔 86 版本来就是用来处理简体字的,大部分人应该都是使用五笔输入简体字的,所以我认为不应该让繁体字排在简体字之前。
猜测
嗯,我记得 2015 年的时候这个问题我就报告过:
wubi86 这个方案内部是简体字还是繁体字? · Issue #90 · rime/brise
但现在看来,是有人恶意将词频引入五笔词库中,正常词频可以只影响词,但是却连单词的频率也修改了。以此来故意劣化 Rime 五笔输入法(包括小狼豪、鼠须管、中州韻)。
我很喜欢这个输入法,已经将 Windows 与 macOS 上的输入法都换成 Rime 了:
所以我不并喜欢默认的五笔词库是一个残废,希望能改得更好一些。希望作者可以严格控制对五笔词库的改动,杜绝一切劣化的行为。
制作
词库重新使用极点五笔十周年版本导出重新制作,并同时增加单字库以方便只输入单字的用户。
syn5
2vtf
制作方法:
wubi86.dict.yaml
码表前面的配置拷贝到新码表中,同时将sort: by_weight
改为sort: original
以保证码表顺序wubi86.dict.yaml
,输入:40,$ g/^\S\{2,}/d
将所有不是单字的码项全部删除保存即可