ku-nlp / kwdlc Goto Github PK
View Code? Open in Web Editor NEWKyoto University Web Document Leads Corpus
Kyoto University Web Document Leads Corpus
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0001662915-3-01 | BasicPhrase | - | add "NE:DATE:月曜日" | 月曜日 辺り は 、 |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0002300153-1 | BasicPhrase | NE:OPTIONAL:アネモネS | NE:OPTIONAL:アネモネS | S は |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0002400031-1 | BasicPhrase | NE:ARTIFACT:オルティアP/V | NE:ARTIFACT:オルティアP/V | P / V 」 。 |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0001585535-2-01 | BasicPhrase | - | add "NE:LOCATION:北区" | 北 区 は 、 |
S-ID | Type | Wrong | Right |
---|---|---|---|
w201106-0000114578-2, w201106-0000226378-1 | Morpheme | 見出し:演じて 原形:演ずる 活用型:ザ変動詞 | 見出し:演じて 原形:演じる 活用型:母音動詞 |
w201106-0002000153-3, w201106-0002000331-1 | Morpheme | 見出し:演じた 原形:演ずる 活用型:ザ変動詞 | 見出し:演じた 原形:演じる 活用型:母音動詞 |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0000573992-2-01 | BasicPhrase | NE:PERSON:バナー | - | バナー は |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0002300352-3 | Rel | <rel type="ガ" target="揚げ" sid="w201106-0002300352-3" id="3"/> |
<rel type="ガ" target="掻き揚げ" sid="w201106-0002300352-3" id="2"/> |
- |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0002000082-3 | BasicPhrase | - | add "NE:PERSON:サイモン" | サイモン が |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0001643925-3 | Morpheme | 点てる / 子音動詞ラ行 | 点てる / 母音動詞 | - |
w201106-0002100183-1 | Morpheme | みて/ 子音動詞タ行 | みて / 母音動詞 | - |
w201106-0000317489-2 | Morpheme | ひき/母音動詞 | ひき /子音動詞カ行 | - |
w201106-0000317489-2 | Morpheme | うち/母音動詞 | うち /子音動詞タ行 | - |
w201106-0000356456-3 | Morpheme | はいる/母音動詞 | はいる /子音動詞ラ行 | - |
w201106-0000715352-3 | Morpheme | くる/子音動詞ラ行 | くる/カ変動詞 | - |
w201106-0002400233-1 | Morpheme | いる/子音動詞ラ行 | いる/母音動詞 | 居る. not 要る nor 煎る |
w201106-0002000016-2 | Morpheme | いる/子音動詞ラ行 | いる/母音動詞 | 居る. not 要る nor 煎る |
w201106-0000484441-3 | Morpheme | いる/子音動詞ラ行 | いる/母音動詞 | 居る. not 要る nor 煎る |
w201106-0001636249-3 | Morpheme | いる/子音動詞ラ行 | いる/母音動詞 | 居る. not 要る nor 煎る |
w201106-0002000389-1 | Morpheme | いる/子音動詞ラ行 | いる/母音動詞 | 居る. not 要る nor 煎る |
w201106-0002400067-1 | Morpheme | いる/子音動詞ラ行 | いる/母音動詞 | 居る. not 要る nor 煎る |
w201106-0001617144-1 | Morpheme | いる/子音動詞ラ行 | いる/母音動詞 | 居る. not 要る nor 煎る |
w201106-0001005450-2-01 | Morpheme | いる/子音動詞ラ行 | いる/母音動詞 | 居る. not 要る nor 煎る |
w201106-0000191456-3 | Morpheme | いる/子音動詞ラ行 | いる/母音動詞 | 居る. not 要る nor 煎る |
w201106-0001389733-2 | Morpheme | いる/子音動詞ラ行 | いる/母音動詞 | 居る. not 要る nor 煎る |
w201106-0002300302-1 | Morpheme | いる/子音動詞ラ行 | いる/母音動詞 | 居る. not 要る nor 煎る |
w201106-0001510624-2 | Morpheme | いる/子音動詞ラ行 | いる/母音動詞 | 居る. not 要る nor 煎る |
w201106-0001975479-2 | Morpheme | いる/子音動詞ラ行 | いる/母音動詞 | 居る. not 要る nor 煎る |
w201106-0000237105-1 | Morpheme | いただき/子音動詞カ行促音便形 | いただき/子音動詞カ行 |
Similar errors could be in 動詞性接尾辞.
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0000116058-1 | BasicPhrase | NE:LOCATION:広島県呉市焼山三ツ石町 | - | 焼山 |
w201106-0000116058-1 | BasicPhrase | - | add "NE:LOCATION:広島県呉市焼山三ツ石町" | 三ツ石 町 に |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0001328672-3-01 | BasicPhrase | - | add "NE:PERSON:長寿麿" | 長寿麿 と ともに |
w201106-0001328672-3-01 | BasicPhrase | - | add "NE:DATE:1258年" | 1258 年 の |
w201106-0001328672-3-01 | BasicPhrase | NE:DATE:1258年 | - | 生まれ である 。 |
Additionally, there is no entry of "き" in AuxV.dic
in JumanDIC.
https://github.com/ku-nlp/JumanDIC/blob/8cb6398bc239ed188ddaaaf0bb9769808f636af0/dic/AuxV.dic
Dear authors of the annotated corpus,
the data you have shared is quite interesting. Could I ask you under what license is it released, as I was not able to find any clear statement apart from "released for the purpose of contributing to the research of natural language processing"? Is it only for research purposes then or can it also be used for training of commercially used models?
Thank you in advance for your answers!
V.
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0001056049-2 | Morpheme | こなせる / base form = こなす | こなせる / base form = こなせる | possible verb |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0000760202-2 | BasicPhrase | - | add "NE:LOCATION:東横線" | 線 の |
The conjugate type of くる
is not カ変動詞来
but カ変動詞
.
find knp/ -type f | xargs grep '^[^来].*カ変動詞来'
knp/w201106-00006/w201106-0000641526.knp:こ こ くる 動詞 2 * 0 カ変動詞来 14 未然形 3
Also, the conjugate type of 来る
is not カ変動詞
but カ変動詞来
.
find knp/ -type f | xargs grep '^来.*カ変動詞 '
knp/w201106-00024/w201106-0002400238.knp:来たり きたり 来る 動詞 2 * 0 カ変動詞 14 タ系連用タリ形 15
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0000981708-2 | BasicPhrase | NE:ORGANIZATION:関西大学 | - | 関西 |
w201106-0000981708-2 | BasicPhrase | - | add "NE:ORGANIZATION:関西大学" | 大学 と の |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0002300217-3 | BasicPhrase | NE:ARTIFACT:370Z | NE:ARTIFACT:370Z | Z が |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0000463299-1 | BasicPhrase | - | add "NE:LOCATION:日本" | 日本 |
w201106-0000463299-1 | BasicPhrase | NE:LOCATION:日本 | - | 文化 の |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0001239347-1 | BasicPhrase | - | add "NE:ORGANIZATION:中日" | 中日 ・ |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0002000171-2 | BasicPhrase | NE:ARTIFACT:ホークⅡ/CB400T | NE:ARTIFACT:ホークII/CB400T | T の |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0001761264-1 | BasicPhrase | NE:LOCATION:平和通り | - | 平和 |
w201106-0001761264-1 | BasicPhrase | - | add "NE:LOCATION:平和通り" | 通り に |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0001513550-3 | BasicPhrase | NE:LOCATION:「大井町」駅 | - | 「 大井 町 」 |
w201106-0001513550-3 | BasicPhrase | - | add "NE:LOCATION:「大井町」駅" | 駅 は 、 |
S-ID | Type | Wrong | Right |
---|---|---|---|
w201106-0002000066-1 | Morpheme | 見出し:つき 原形:つきる 活用型:母音動詞 | 見出し:つき 原形:つく 活用型:子音動詞カ行 |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0000928415-2 | BasicPhrase | - | add "NE:LOCATION:日本" | 日本 |
w201106-0000928415-2 | BasicPhrase | NE:LOCATION:日本 | - | 一 、 |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0001660616-2 | BasicPhrase | NE:DATE:6月7日 | - | 7 日 |
w201106-0001660616-2 | BasicPhrase | NE:TIME:月曜日 | NE:DATE:6月7日月曜日 | 月曜日 に |
S-ID | Type | Wrong | Right |
---|---|---|---|
w201106-0002000292-2 | Morpheme | 見出し:おり 原形:おりる 活用型:母音動詞 | 見出し:おり 原形:おる 活用型:子音動詞ラ行 |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0002100016-1-02 | BasicPhrase | NE:PERSON:謝霆鋒 | - | 霆 |
w201106-0002100016-1-02 | BasicPhrase | - | add "NE:PERSON:謝霆鋒" | 鋒 |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0002000282-2 | BasicPhrase | <rel type="=" target="不特定:物1"/> |
<rel type="=≒" target="不特定:物1"/> |
l.37 マスク |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0000894601-2 | BasicPhrase | - | add "NE:ARTIFACT:労働基準法" | 法 を |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0001290480-1 | BasicPhrase | - | add "NE:LOCATION:長崎" | 長崎 へ と |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0002100356-2 | Morpheme, BasicPhrase, Bunsetsu | 見出し:決して 原形:決する 品詞:動詞 活用型:サ変動詞 活用形:タ系連用テ形 | 見出し:決して 原形:決して 品詞:副詞 活用型:なし 活用形:なし | Chunking:┃決してありません┃ → ┃決して┃ありません┃ |
w201106-0002100356-2 | Morpheme | 見出し:あり 品詞:接尾辞 分類:動詞性接尾辞 | 見出し:あり 品詞:動詞 分類:なし |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0001238004-1 | BasicPhrase | - | add "NE:ORGANIZATION:昭文社" | 昭文社 が |
S-ID | Type | Wrong | Right |
---|---|---|---|
w201106-0002000038-1 | Morpheme | 見出し:ハッピー 原形:ハッピーエンド | 見出し:ハッピー 原形:ハッピー |
w201106-0002000038-1 | Morpheme | 見出し:エンド 原形:ハッピーエンド | 見出し:エンド 原形:エンド |
S-ID | Type | Wrong | Right | Note |
---|---|---|---|---|
w201106-0000178398-1-01 | BasicPhrase | NE:ARTIFACT:ヤギと男と男と壁 | NE:ARTIFACT:ヤギと男と男と壁と | 壁 と 』 です が 、 |
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.