Giter VIP home page Giter VIP logo

chaizi's Introduction

漢語拆字字典

說明

本倉庫含開放詞典網用以提供字旁和部件查詢的拆字字典數據庫,有便利使用者查難打漢字等用途。目前數據庫收錄17,803不同漢字的拆法,分為繁體字(chaizi-ft.txt)和簡體字(chaizi-jt.txt)兩個版本。

拆字法有別於固有的筆順字庫。拆字著重於儘量把每個字拆成兩個以上的組成部件,而不是拆成手寫字時所使用的筆畫。

檔案說明

  • chaizi-ft.txt:拆字字典(繁體版)
  • chaizi-jt.txt:拆字字典(簡體版)
  • fanjian_suoyin.txt:對照繁/簡體字的條目索引

範例

漢字 拆法 (一) 拆法 (二) 拆法 (三)
手 斥 扌 斥 才 斥
宀 子
馬 燕
魚 豊
香 兼
司 見
香 香 香
雷 雷 雷

拆字時以容易打出來的字為先,然後儘量列出其餘所有不同拆法,包括正確部首和部件(若包含於統一漢字表內)和異體字:

漢字 拆法 (一) 拆法 (二) 拆法 (三)
旅 肉 旅 月
金 利 釒 利
辵 回 辶 回
言 正 訁 正

目前一字最多可以有六(6)種拆法,例如:

漢字 拆法 (一) 拆法 (二) 拆法 (三) 拆法 (四) 拆法 (五) 拆法 (六)
絲 刀 巴 糹 刀 巴 糸 刀 巴 絲 色 糹 色 糸 色
手 并 扌 并 才 并 手 幷 扌 幷 才 幷
金 亠 厶 川 釒 亠 厶 川 金 巟 釒 巟 金 㐬 釒 㐬

版權

© 2015 開放詞典

本表依照創作共用(創用CC/知識共享)姓名標示(署名)協議發佈。

創用 CC 授權條款
本著作係採用創用 CC 姓名標示 3.0 未本地化 授權條款授權.

chaizi's People

Contributors

dohliam avatar indiejoseph avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

chaizi's Issues

大量的简体字都是□

可能由于作者缺乏简体字的字体,导致chaizi-jt.txt中存在大量的□符号,能否补充一份可以正常显示这些文字的拆字字典?

大约有2916个左右文字无法正常显示:
例如:
image

如何拆分?

我想问一下,这些收录的汉字及其对应的拆字是人工拆分后收集的还是程序拆分的呀?

基于和2013年发布的通用字表对照,发现这些字没有包含进chaizi-jt.txt内

髑   骨 蜀
骨   骨
马   马
饔   雍 食
飧   夕 食
隰   隰
阜   阜
长   长
鎏   流 金
锗   金 者
鍪   鍪
鋈   沃 金
鋆   均 金
銎   巩 金
鄑   晋 邑
迺   辵 西
赜   臣 责
貘   豸 莫
訄   九 言
觿   觿
角   角
襁   衣 强
蜐   虫 去 力
藉   艹 耒 昔
苧   艹 宀 丁
薁   艹 奥
萣   艹 宀 疋
艮   艮
耳   耳
簪   簪
竫   立 争
瞭   目 尞
瓦   瓦
瀔   瀔
璺   璺
瑃   王 春
珊   王 册
猺   犬 爪 缶
燠   火 奥
濮   水 僕
澛   水 鲁
滧   水 效
溍   水 晋
淙   水 宗
沉   水 冗
民   民
氏   氏
毌   毌
毋   毋
楞   木 网 方   木 罒 方
梠   木 吕
擿   手 辵 啇
拤   手 卡
徭   彳 爪 缶
彷   彳 方
廙   广 異
巇   巇
嶲   嶲
宧   宧
媱   女 爪 缶
墼   墼
塆   土 弯
堃   方 方 土
垯   土 达
垈   代 土
喆   吉 吉
又   又
刁   刁
凹   凹
凸   凸
仝   人 工
之   之
丏   丏

有一些字我不知道怎么分,于是就写成一样的了,比如

大概已经不再维护了,个人公开了一份 fork:mirtlecn/chaizi-re

似乎已经不维护了,PR 也没有人管。不清楚诸位知不知道这份拆字码表有没有更好的替代?

之前做输入法码表的时候,发现这份字典错的地方很多,缺字也很多,自己改了份,公开在这里

https://github.com/mirtlecn/chaizi-re

改了几百个格式上的错误,加了几百个常用字,加了几千个拆法。有需要的可以看看。

可惜工程实在浩大,这个码表目前应当还有大量的错误拆法,对比 Unihan 里面还缺 20,000 多个汉字。

有余力的也可以帮忙维护,

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.