-
-
Notifications
You must be signed in to change notification settings - Fork 991
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
日本新字體 #494
base: master
Are you sure you want to change the base?
The head ref may contain hidden characters: "\u65E5\u672C\u65B0\u5B57\u9AD4"
日本新字體 #494
Conversation
danny0838
commented
Jul 10, 2020
•
edited
Loading
edited
- t2jp 方案比照 t2s 採兼容「OpenCC 標準體轉日本新字體」及「日本舊字體轉日本新字體」的做法,因此除了 OpenCC 標準體轉日本新字體以外,也補上《常用漢字表》等表舊字體轉新字體的部分。
- 擴充轉換移至 JPVariantsEx.txt,包括《表外漢字字體表》非簡慣優先的簡慣字體(簡慣優先的直接放 JPVariants.txt)及擴張新字體。擴張新字體與日本標準無衝突的直接轉換,有衝突的預設不轉換,只作為第二候選字。預設轉換方案 t2jp 不包含 JPVariantsEx.txt,並增加包括擴充轉換的 t2jpx 方案。jp2t 則包括 JPVariantsEx.txt 的逆轉換。
- 擴張新字體清單主要沿用 新增日本新字體。 #371,額外加了幾字。
- 「龝」雖是「秋」的異體字而非 OpenCC 標準字,但考量 t2jpx 也包括舊字體轉新字體,源文本未必是嚴格的 OpenCC 標準字,因此仍予保留。
b593869
to
8cc894b
Compare
「非簡慣優先的簡慣字體」是什麼 |
日本2000年的《表外漢字字體表》列出了印刷標準用字,有些字還附有簡易慣用字體(簡慣字體)。 大部分字是印刷標準用字為標準,簡易慣用字體為可接受的變體;但「曽」「痩」「麺」三字例外,以簡慣字體優先,2010年的《改定常用漢字表》也加收此三字作為標準用字。 所謂「非簡慣優先的簡慣字體」,就是指並非以簡慣字體優先的字的簡慣字體,比如「醤」「鹸」。由於它們只是「可接受的變體」而非標準字體,因此預設轉換方案不轉換,但擴充轉換方案 t2jpx 的邏輯既然是「盡可能多使用新字體、類推字」,因此也對它們做轉換。 |
3eff2be
to
9b0ec92
Compare
- 刪除錯誤的「遥=>遙」 - 扣除 Unicode 相容區的字 - ref: https://ja.wikipedia.org/wiki/%E4%BA%BA%E5%90%8D%E7%94%A8%E6%BC%A2%E5%AD%97
- 《表外漢字字體列表》大多使用康熙字典字形,少數使用日本新字體字形,有些也與 OpenCC 標準字體不同,須加入轉換。 - ref: https://zh.wikipedia.org/wiki/%E8%A1%A8%E5%A4%96%E6%BC%A2%E5%AD%97%E5%AD%97%E9%AB%94%E5%88%97%E8%A1%A8 - ref: https://ja.wiktionary.org/wiki/%E4%BB%98%E9%8C%B2:%E8%A1%A8%E5%A4%96%E6%BC%A2%E5%AD%97%E5%AD%97%E4%BD%93%E8%A1%A8%E3%81%AE%E6%BC%A2%E5%AD%97%E4%B8%80%E8%A6%A7
- 《表外漢字字體列表》以印刷標準字體為主,簡易慣用字體亦可接受,故取消強制轉換,移至 JPVariantsEx.txt。(明訂簡慣優先的且收錄於《改定常用漢字表》的「曽」「痩」「麺」除外) - 預設轉換方案 t2jp 不包括 JPVariantsEx.txt,另外增加包括擴充轉換的 t2jpx 方案。jp2t 則包括還原擴充轉換。
@BYVoid Any chance of seeing something like this merged? I understand that you don't think non-BPM 擴張新字體 should be part of the @danny0838 Have you been using a fork in the meantime? |
I am now developing StarCC, the next generation of OpenCC. @danny0838 Could you make a PR there? We can work together on this project. |
@ayaka14732 We are overloaded and probably won't be able to handle the cross-project compatibility shortly. You can port them from our project sts-lib, though. |