-
-
Notifications
You must be signed in to change notification settings - Fork 992
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
一些 SMP 字元相關修正 #471
The head ref may contain hidden characters: "Ext\u5B57\u5143\u76F8\u95DC\u4FEE\u6B63"
一些 SMP 字元相關修正 #471
Conversation
另外,「鷿鷈」不是《通用漢字規範表》規範字,也無相關替換規定。Unihan標記「鷿」簡化作「𬸯」,「鷈」簡化作「䴘」,但前者是Ext-E,後者和「鷉」簡化字共用且部件位置不一致。 此次修改後「鷿鷈」將被轉換為「𬸯鷈」,變成繁簡混用,以往「鷿鷈」和「鸊鷉」一樣習慣簡化做「䴙䴘」,雖然不規範但可能對中國民眾是比較符合習慣的做法。若考慮此點,可考慮繁轉簡改為「鷿=>䴙𬸯」、「鷈=>䴘」,簡轉繁改為「䴘=>鷉鷈」(即部分取消 #458,但「䴘」簡轉繁改為「鷉」優先)。 |
61cb29d
to
3fa38fb
Compare
f2cdc77
to
d7ddcf4
Compare
- 「𰰨(U+30C28)」為「菕」的類推簡化字,二者互做簡繁轉換。「芲(U+82B2)」為「花」之異體字,不應與「菕」互轉。
- 以「𤓎」為 OpenCC 正體,「㸇」為異體
最新 rebase 版本先把可能有爭議的「麵」去掉,剩下的應該沒有太大爭議了(以修錯為主,會增加少量 SMP 字元,但都是 Unihan 同意的,而且和原來已收的 Ext-D 字元相比只是九牛一毛)。 「麵」和「鷿」不統一的問題之後再研究怎麼進一步解決吧…… |
這些字都是類似的問題,因此合成一個PR方便討論。如個別字有問題可以提出,我再視需要修改或拆成不同PR。
相關字都不是《通用漢字規範表》的規範字,除了「麵」「麪」。
目前相關字都涉及一些明顯不合理的轉換,Unihan也不支持,因此刪去不合理的轉換。
新加入較合理的簡化字都是SMP字元,「麵」「麪」是《通用漢字規範表》由於已有「面」作為首選簡化字因而SMP類推簡化字作為次選以外,其他都是列為首選。
要不要加入SMP類推簡化字是一個有爭議的問題,我認為這些字《通用漢字規範表》都沒有規範,做不做類推簡化都沒有絕對對錯;況且目前OpenCC已經把許多表外字做到Ext-D的類推簡化,這裡若刻意不加入也不一致。當然,長遠來說按 #217 把規範簡化和類推簡化分成不同字典或實做限制輸出字集的功能可能會更好,不過這些都可以之後再做。
相關SMP類推簡化字都是Unihan有定義的,除了「𮮄」,雖然這字是Ext-F且只有J源,但就字形來看我認為沒有不能視作「麪」類推簡化字的理由,因此還是納入。