(2023 年 07 月 27 日 v1.2.2 版本)
本表用于初步整理 GB/T 2312-1980、《通用规范汉字表》(2013)、《现代汉语通用字表》(1988)(以下简称「G0」「通规」「通用 7000」)以外较为常见的汉字,共分 5 组(附第 0 组:GB/T 2312-1980 以外的《通用规范汉字表》《现代汉语通用字表》汉字及化学元素中文名称)。
下列汉字如无特殊标注则按 Unicode 码位排序,每个字只出现一次。 原则上只收录简体字,对于下表中含有的繁体字、异体字、日本新字体(日本简化字),后续会进一步整理和筛选,对于未予收录的字,用木屐符号「〓」表示筛选之后的空位,并在下方按顺序列出筛选掉的详细汉字,筛选掉的汉字会收录于第二部分(繁异体及其他外字初步整理一览表)。仅供参考。
☛ 《通用规范汉字表》《现代汉语通用字表》TXT 格式来源:https://github.com/NightFurySL2001/cjktables/tree/master/china/standard
啰瞭
㊟ GB/T 2312-1980 中无「啰」「瞭」这两个常用字,可能是受当时《简化字总表》「啰」归并到「罗」、「瞭」归并到「了」的影响。1988 年《现代汉语常用字表》已恢复这两个字。这两个字也包含在 GB/T 8565.2-1988「汉字通信子集」当中。
乂丏夬匜厾玕玙抔抃㧐芼旸吽牤沚沨纴玡玭玠玥玦拤劼拃㧟茓茀杻旻昉呣䏝𬉼炘㤘祎祇垱挦剋柈𠳐眊峣郤饸饹疭竑闿羑浕恓牁姮珰珣琤栟彧眬鸮䥽盉俵俶訚烜浥牂骎琇捯埵捽堉棻梿棁晞唵崚秾鸻馃阇焗惇郿欸①琫琯揳塆靰靸椪雱睄嗞嵖嵎铻媭鲀颎焜湜湲湉愔祾翚瑄蒟②楯跶跐嗐锜鹐亶瘆滫滃滪窣璈叆摽榖靺靿僰豨䁖嘡嘚箓魆粿熥嫚奭鋆瞋颙踒𥻗熜潟褟璟璠璘縠嚄螠䦃镚镠膙獴赟澥窸璪鞡鞬罽鳀鞨鞧藠蹚鹮霨蹽蹾齁㸆巉镴臜瓘镵齉
① GB/T 2312-1980 中收录了「欸」的异体字「诶」。
② GB/T 8565.2-1988(简称 G8)「汉字通信子集」中收录的点阵字形为「⿱艹⿰立可」,该字形尚无 Unicode 编码。
卬𠙶毌邘圢伋冮氿汈氾𬣙讱扞圲圫芃朳朸𨙸邨屼屾辿伣伈癿甪邠𬇕汋䜣讻𬣞孖𬘓玒玓玘玚刬𫭟坉扽𫭢坋扺㧑毐芣苉芠𫇭杕杙杄杧尪尨轪𫐄坒旴旵㕮𫵷岠呇冏觃伾㑇伭佖佁飏汧汫𣲘𣲗沄沘𬇙汭㳇沇忳忺𬣡祃诇邲诐屃𫸩岊䢺妧妘𨚕纮驲𫘜纻𬘘𫘝纼玤玞玱邽邿坥坰坬坽弆䢼𦭜茋苧苾枅㭎枍矼矻匼𬨂𬀩𬀪旿昇昄昒昈咉咇咍岨岞峂㟃囷𬬩钖牥垈侁侹佸佺㑊侂佽侘郈舠郃攽肸狉狝饳忞炌炆泙沺泂泜泃泇峃祋祊𫍣𬣳𬩽鸤弢弨陑𬮿陎𬯀乸妭姈𫰛叕𬳵𬳶䌹𫠊㛃玶珇珅𬍛珋玹珌玿韨垚垯垙垍耇鿍垎垟垞挓垵垏荖荁荙茽荄𬜬荓𦰡㭕柷柊枹栐柖郚剅䴓迺厖砆砄耏奓䶮昺𪾢昽盷咡咺昳昣昤昫昡咥昪虷虸哃峘耑峛𪨰峗峧帡钘𫓧𬬮𬬱𬬭秬俫俙俍垕衎弇侴①鸧䏡胠𦙶胈胣朏飐訄饻庤疢炣炟㶲洭洘洓洿㳚泚浉洸洑洢洈洺洨浐㳘洴洣恔宬扂袆祏祐祕叚陞娀姞姱姤姶姽枲绖骃𬘡𬳽𬘩𫄧骉珪珛珹玼珖𪟝珽珦珫珒𬍤珢珕珝𫭼埗垾垺埆垿埌埇茝𬜯鄀莝䓖莙栻𬂩梠栴梴栒𫠆砵砠砫硁翃郪𨐈辀𬌗剕哢晅晊唝哱冔晐畖蚄蚆𫑡崁峿𪨶崄帨崀𬬸𬬻𬬹𬬿𬭁甡倻倴脩倕倞𫢸倓倧衃虒舥鸰朓虓鱽峱𫗧勍竘羖羓烠烔烶烻𬊈涍浡浭浬涄涢涐浰浟浛浲涘悈悢𬒈宧窅窊窎扅扆袪袗袯隺堲疍𨺙烝砮㛚翀翂剟𬳿𫄨绤骍𬘫䂮琎珸珵琄琈琀珺堎堐埼埫堌晢𫮃掞埪壸㙍萚莿䓫勚䓬菂菍菼萣䓨菉䓛梼梽桲梾桯梣梌桹敔硔硙硚硊硍勔䴕龁逴啫翈㫰晙畤𬱖跂蛃蚲𬟽啴䎃崟崒崌崡铏𫓯𫟹𫟼铚牻笯偰偡偭偲偁㿠鄅偓徛衒舲鸼悆鄃瓻䝙脟䏲鱾猇猄𠅤庱庼痓䴔竫堃羕焆烺焌淏𬇹淟淜淴淯湴涴𬍡㥄惛惔悰惙寁𬤇𫍯裈祲𬤊𫍲谞弸弶𬯎隃婞娵婼媖婳婍婌婫婤婘婠𬘬𬘭𬴂𫘦绹𫟅𬘯骕𫘧絜珷琲琡琟琔琭堾堼揕㙘堧喆堨塅𪣻𡎚惎萳靬葴鄚蓇萩蒐葰葎鄑葖蒄萹棤棽棫椓椑𬃊鹀椆棓棬棪椀𬷕甦酦奡皕詟𫐐辌棐龂𬹼牚睎晫晪晱𧿹畯斝喤崶嵁𫶇嵅崿嵚翙𫖮圌圐赑赒鿏𬭊𨱇𫓶𬭎犇颋稌筀筜筥傃傉翛傒傕畬𫖯脿腘䐃腒𬱟鲃猰𫛭猯㺄馉凓鄗𫷷廋廆鄌遆旐𬮱焞𬊤欻𣸣溚溁湝渰㴔渟溠渼溇湣湑溞愐愃敩棨扊祼婻媆媞㛹媓媂媄矞𬴃𫘨缊缐骙瑃瑓瑅瑆䴖瑖瑝瑔瑀𤧛瑳瑂嶅瑑髢堽赪摛塝搒蒱蒨蓏蔀蓢蓂蒻楪榃榅楒楩椸楙歅𬪩碃碏𬒔碈䃅硿鄠辒𬨎𫐓䣘暕鹍𫫇㬊暅跱蜐蜎嵲赗𫓹锳锧𬭚𬭛稑稙䅟𬕂筼筶筦筤僇艅谼貆腨腯鲉鲊鲌䲟𬶋𬶍鲏雊猺飔觟𦝼馌裛鄘鹒鄜麀阘𫔶煁煃煴煋煟煓溍溹滆滉溦溵漷滧滘滍愭慥慆塱𫌀禋禔禘禒鹔𫖳嫄媱勠戣𫘪𫘬缞耤瑧𫞩瑨瑱瑢斠摏墕墈墐墘摴𡐓𪤗靽鞁蔈蔊榰榑槚𣗋槜疐𬸘酺碶䃎𬒗碨𥔲𫚖䴗鹖㬎幖嶍圙𨱏锽𬭤镃馝鹙箖劄僔僎槃㙦𫚕鲖鲗鲘鲙𬶐𬶏𩽾夐飗𬸚凘廙鲝鄫熇漹漖潩漼漴㽏漈漋漻慬㮾𬤝褕禛隩嫕嫭嫪𬙂㻬麹②璆漦叇墣墦墡薁蕰蔃鼒槱鹝磏殣慭霅暵暲暶踦䗖蝘蝲噇噂噀罶嶲嶓㠇嶟嶒镈镋𬭩镕皞皛䴘艎鹟𩾃鲪鲬觭鹠鹡鹢熛潖潵㵐澂澛瑬潽潾潏憭憕𬸣戭褯禤𫍽嫽遹𬴊璥璲璒憙薳黇𬞟蕗薢橞橑橦觱磡𥕢磜豮𫟦𬺈𫠜虤暿曌曈㬚蹅踶䗛疁㠓幪𪩘嶦𬭬𨱑𬭯馞穄篯簉衠盦螣縢鲯鲹𫗴亸𬸦羱糒燋熻燊燚燏濩濋澪澽澴澭澼憺嬛翯𫄷璱𤩽璬璮髽擿薿薸櫆檞醨繄磹磻瞫蹐蟏㘎𬭳𬭶𫔍𬭸𨱔𬭼𫔎矰穙穜穟簕簃儦魋斶𬸪谿䲠𬶟鲾𬶠鲿鳁鳂鳈鳉䗪襕襚𬶨螱嬬嬥𦈡𫄸瓀釐鬶爇鞳鞮𬟁藟藦藨鹲黡礌𥖨蹢蹜蟫䗴嚚髃镮酂馧簠簝簰鼫鼩皦臑䲢鳑鳒鹯癗𦒍旞翷䎖瀔瀍瀌襜䴙𬙊嚭㰀鬷蠋翾儳儴𬶭𩾌鳚鳛麑麖彟嬿鬒蘘欂甗𨟠巇酅髎犨𬶮𨭉㸌爔瀱瀼襫孅骦𬙋耰𤫉瓖鬘趯𬺓罍鼱鳠鳡鳣爟爚灈韂糵礵鹴皭龢鳤亹籥𫚭玃醾齇③觿
① GB/T 7589-1987(第二辅助集,简称二辅)、G8 汉字通信子集中收录的字形为「⿰⿱亼丑刂」,在二辅、G8 中归「刂」部,尚无 Unicode 编码。
② GB/T 2312-1980 中收录了「麹」的繁体字「麴」,「霞鹜文楷 GB」v0.965 及以往版本未予收录。出于对 GB/T 2312 的兼容性考虑,后续版本将加回「麴」字。
③ GB/T 2312-1980 中收录了「齇」的异体字「齄」。
朘塃揾葓湨塈塮蹓檵礳耲
鿔鿭𫟷鿬鿫
㊟ 本组存在少量繁异体字,1.2.2 部分可暂缓收录,但在增补本表第二部分的繁异体时需全部包含。
朿冇伃佡佫倢毚刲劘劻勷塓墄奀唶啯啍嚜帗屴峓巂①徯夆斨闬阓阛屝珶瑸杅枟柮桋桪梱棑椫榾楀楟楢椵榼槅樋槥檖檴猔殕胾甃敜晬暍暋牣牷掱扡扠挜掯搢擭穀怗惓泆沵浤溎禠砢硵盻眛瞆盝盬鸴鹓鹥瘄瘈瘝窾颣蚃蜅蟢胔筊筎筿篰舺裀褦襶芧荝荅莦菾蓷雘孃豭踖踧辵诪谉霂猆钑铓铔铦锠鲄鲓饤饦饾馂馎鬐②斢
厐禸伕伡伻侢傤匊凃冨贠垇塚尰弌弍弎屲峇徬彨娒婥玔珮琷琕枙桬棸槾狢晧觍搧摷氝③歔飖灺烱焠慓涭澔礽碔礃稖穞痠竜癶颒篲籝粬艸菑蓪踡靔鼌
塂洩蔴蓆挼崅绬焮舘舖痳鬥覀粦亅
㊟ 字表来源字统网,根据 GB/T 8565.2-1988 原文(A2.1.5:汉字通信字集交换码与电报码对照表)及字统网二辅、四辅字表略有调整(字统网 G8 字表参考的是 GB/T 8565.2-1988 里的点阵字形,但点阵字形与其在二三辅或四五辅的对应字形有些出入)。
① 《通用规范汉字表》收录了「巂
U+5DC2
」的异体字「嶲U+5DB2
」(通规表中未体现「巂」为「嶲」的异体字),但通规表却收录了一些以「巂」作声旁的字,如「酅」「觿」等。② G8 汉字通信子集中收录的点阵字形为「䰇
U+4C07
」,而根据 GB/T 8565.2 第 A2.1.5 条,该字在二辅的交换码为9158
,电报码为7580
,对应字形均为「鬐U+9B10
」(该字在 Unicode 的 G 源提交来源为 G3-7B5A),故调整为「鬐」。③ G8 汉字通信子集中收录的点阵字形为「氞
U+6C1E
」,而根据 GB/T 8565.2 第 A2.1.5 条:该字在四辅的交换码为4641
,对应字形为「氝U+6C1D
」(G 源提交来源为 G5-4E49);电报码为8635
,在标准电码本中的对应字形为「氞」(G 源提交来源为 GE-3E76),考虑到 G8 汉字通信子集是从二辅、四辅、一异表中选取有电报码的汉字,而三辅(G3)、五辅(G5)为二辅、四辅的繁体版本,也作为 Unicode 早期收字凭据,故根据来源信息调整为「氝」,「氞」移至 1.2。
並匸夊妳尅崑帋悮旂暎晳樑湧濬炞①畑燿瓩箇籐唡螀②襾觔讬躭釆铇𰾠③颕骔鬱吋呎啗坿媮斏①椝氞氥癒葠蠭
働傑効勳崙巖廈沖浄減準盪脧④龿蒞隻
㊟ 字表来源千千秀字、焰华 Honoka55,略有调整。
① 对于《标准电码本》中「死字」的解释:
a)「炞」:❶人名用字,赵炞,元代四川人。❷炞炮,鞭炮。天津《益世报》1935/1/16 本市新闻:春节中禁放炞炮…… ——《康熙字典 增订版》
b)「斏」:瀚堂认为该字是「𢽂U+22F42
」的讹字,「𢽂」字《康熙字典》释为「甚」。② 《标准电码本》中收录的字形为「⿱⿰丬夕虫」,但不符合《简化字总表》的类推简化原则,且尚无 Unicode 编码,由同为「螿
U+87BF
」简化而来的「螀U+8780
」代替。③ 《标准电码本》收录的字形「𰾠
U+30FA0
」不符合《简化字总表》的类推简化原则,但已有 Unicode 编码。《通用规范汉字表》收录了该字的规范写法「镵U+9575
」。④ 《现代汉语通用字表》、GB/T 8565.2-88 中收录的字形为「朘
U+6718
」(G 源提交来源为 G3-4D2E),在二辅、三辅及 CJK 统一汉字基本区中归月部,而在《标准电码本》中该字归肉部,对应字形为「脧U+8127
」(G 源提交来源为 GE-4861)。不同归部的「朘U+6718
/ 脧U+8127
」含义不同。
☞ 2.1 字表参考方正近几年发布的简体字体。其中 2.1.1 的汉字见于方正早期的简体字库中,但是是以私用区(PUA)字符的形式存在,近几年发布的字体中已对这些字增加了 Unicode 映射。2.1.2 中的部分汉字也见于汉仪近几年发布的简繁字库中。
本组汉字中,由木屐符号「〓」替换掉的字,将在简繁版中加入。
〓𧮪匽朆𠉂僜𢙐悗挌垽𦭌苳葇蓚𦶟①𦻘呯𠸁𠾐𤟯獏〓𩨂②𤆢㭴梹榠𢽾犗𣱝肐痎㾦𤻊䃚眜𥆧𨰾䥺𨱎𨱓皶𦎓䎬聤覅䖬蜰䇲𦨭踄貐𩽼𩾇魌麕〓卲㖞㨘璿敠𥄨𨱍䦆
〓 未予收录的字: 朮③縴④𠚤
㊟ 有少量繁异体字。
① 该字简化不符合《简化字总表》的类推简化原则,但已有 Unicode 编码
U+26D9F
,且由方正源(GFZ-F8F0)提交。《通用规范汉字表》收录了该字的规范写法「爇U+7207
」。② 该字简化不符合《简化字总表》的类推简化原则,但已有 Unicode 编码
U+29A02
,且由方正源(GFZ-F9C4)提交。《通用规范汉字表》收录了该字的规范写法「骢U+9AA2
」。③ 该字为「白术」的「术
zhú
」的异体字,也是「术」的旧字形写法。④ 该字为「纤绳」的「纤
qiàn
」的繁体字。
〓〓〓〓〓〓〓〓〓佢佷〓偆偍偐偖〓〓傝〓〓〓〓〓兲〓冴劵卍厷〓叡吔吥咁咗咲〓哖啛啲喺嗮嗰嘅嘢〓〓〓嚟〓囘〓囧〓〓〓〓堺〓〓〓〓夋〓奻娸娿媕媺〓〓〓〓寔〓〓〓〓〓〓尛屄屌〓峎崐〓〓〓〓〓〓〓〓〓〓惢〓〓〓〓〓〓〓斲昰〓〓〓〓栢〓〓歘〓殭〓〓〓〓涚淩〓湪〓潶〓〓濛〓炤炰〓〓熯〓牠〓〓珨琍畊〓〓〓睺碁祂禟禩〓籹〓〓〓〓〓〓〓〓羣翋肏〓〓菈菓〓〓薙〓裑〓〓〓〓跩〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓〓髈〓〓〓〓
〓 未予收录的字: 丄丅丗両亜仏仩伝伱俬偣傚僞僾儍儚児冄収哊嘫嚐嚒囖団囨囬圝垨増壊売変夲嬅嬢嬭実寛寳対専尒尓屍崱巻幷広庅庝彮徳応恏慾懐戝抺拝搵斎曽朲朶杺桜楽歩毎沢洅涗渋満濆濇瀬炵煖爲犲獣盃県眞秂粧紑紮綉綫緈縄繎莂莣菿蔘衆観訫説赱転郞鈈鈊鉄銆録錵鍒鎚鏂鏄関闇雑靑駄髙魜鰂黒
㊟ 繁体字、异体字、日本新字体(日式简化字)较多,筛选掉的字将加入简繁版。
☞ 2.2 字表参考汉仪早期发布的正文宋体。
哋喼噃噏曱栿氹涊甴笭
☛ 本组汉字参考 https://github.com/eisoch/irg ,整理过程中已筛除繁体字。后续会对这些汉字进行进一步整理和筛选处理。
☞ 参考 eisoch/irg#85 。
- IIcore/UnihanCore 之外: 㶉㻪䞍𠍐𠧚𡛰𡶦𢒉𣬂𤯥𪥰𪻐𫰡𫲦𬎆𬬺𮧵𰌂𰌀𰞇𰵝𰵞𰾫𲂎𲈗
- IIcore/UnihanCore 之内: 㛅淽爕醁霑霙𠇔𡝗𥖄𧝁
- 其他用户追加: 䒕佀𤰉𫘥
☞ 参考 eisoch/irg#105 。
- IIcore/UnihanCore 之外: 㘰㯊㵲㹧湻𣵦𣸤𤱙𪉈𪿖𫜷𬇞𬮴𰽚𱖎𱖒𱮒
⿱𰃮土
- IIcore/UnihanCore 之内: 㙟㱔剳噉廻櫈汎瑠瓈矴硋蟇衖𡌶
未定码位: ⿱𰃮土
☞ 参考 eisoch/irg#86 。
-
IIcore/UnihanCore 之外: 㓥㻋䙆昚襈鼟𡺎𤞤𦏴𩉜𪠽𫊻𫖃𫖘𫛩𫵘𬪍𬸅𭎂𮔅𮣲𮬝𮬡𰇣𰡘𰯼𰵧𰽗𰽴𱂩𱇱𱌮𱎼𲍭
-
IIcore/UnihanCore 之内: 㺭伬僙囍喰嚱囮垝嫮峉懽煚玗皝砯禥罥袴裇裋裻褝豗𧊅
-
eisoch 后续追加: 𤌙
-
其他用户追加: 㤭佉呾㝹
☞ 参考 eisoch/irg#84 。
-
IIcore/UnihanCore 之外: 㞎䖢䜺䲝煿糄鿽𠊎𡚦𦠿𧒽𩠍𪨊𫗫𫗰𫚔𬂁𬊶𬖋𬖞𬲱𬲽𬳇𰪿𰻝𱃱𱫉𱹍𲀃𲋤
-
IIcore/UnihanCore 之内: 㘵唦屻岃栘焿粄罉脷膥衕衚迌𠕇𠲖𣐿𤆵𦛨𨑨
☞ 参考 eisoch/irg#96 。
丼彅枠栃榊畠笹籾辻込雫麿
㐎乭
𫩛
☛ 本组汉字参考「成双酱」(头秃酱)整理的常用字表,及《新华字典(第 12 版)》《现代汉语词典(第 7 版)》的字头,以及少量异体。一些较为偏僻的字头没有收录。
㑩㓦㗑㗒㘗㘥㥏㩟㪗㴩䏿䜩䩄䯄侜倖儗剉劙匄咑咵唗嗙嗛嗻嘑噆噷圂埻堄夿奅奤姁娖嫋嫏岕岧帵怳怹慽抆挵揌揢搕撴擖擩敁晻曚枑枒栔梐楬槑櫼欬殽汍沕滈炁煣牸瑊瓌甽痏睒硃脦膵苶茩袺謷跅蹍蹏躄迍邅酕醄鋬阧霡鞌骭髣髴黵齆𡛟𢫬𣨼𣭲𣱼𥇢𪨇𫄥𫌨𫖔𫘤𫛞𫛶𫜨𫧯𫰰𬢊𬧀𬬫𬭣𬮤𭱊𮉫𮐨𮙋𮝴𮝹𮤲𮩝𰵼𰷥𱂱𱅋
㑌㗏㘄㚢㚻㝿㞗㞘㟂㤅㤞㤥㧀㧥㧯㨄㳠㶁㹢㺢䀦䐛䓞䕷䝋䟡䯼䰀佹侻俤倅倷偊偢傎僝僽儓冓凊刌刓刜刵剒剚剺劀勼卌卼吪吰呝呴啙喌喓喨喭嗈嘒嚃囥坢塕塽墬墺妸娭婗媟媢嫛嫳峬嶕嶰帩幈幧弝忣忨恇恟悕悾惼愊愒慜慠憃憏憯憱懁懆扤抈抏抶掹揅揦揻搰朣椇槺欋欿毑毷氉汏滮澨犼狓猋獕玏疕睩硠磈磎箣膍臲茖藂虡蝂蝄蠵褎赩跰醡陁鬌黁𠲎𡍷𡏋𡒄𢀖𢱉𤞶𤭢𥉳𥥷𥯨𦨩𧏾𨃅𨻧𪎊𪞝𪢮𪣝𪭢𪾔𫉁𫍟𫍢𫓩𫖹𫚉𫚒𫣊𫪁𫪘𫭪𫵼𫼝𬑗𬘵𬣀𮉬𮉯𮔂𮔊𮖱𮙊𮝵𮣳𮩞𮪥𮭦𮭨𮯙𰃷𰟘𰵴𱃺𱇣𱉔𱸇
㐷㨃㹴㽲䌷䓕䲡仌冚冧叒呺姛敹梶榎槏橿檨毴烎獚獛璏瞏苝苨荵莍菵蒾蚖蚚蟿貒阰𣏢𣬠𣬶𦗒𩠌𪠸𫍻𫛚𬃀𬘢𭴊𮀔𮐚𰋀𰤕𰱲𰶊𰽽𱂐𱅛𱏿𱴟𱴱𲍿