ChaKi.NET (3.16 Revision 653) | 2021-01-23 23:11 |
ChaMame (1.0.4) | 2020-01-14 17:04 |
Patch Files (TextFormatter for ChaKi.NET (2010/11/20)) | 2010-11-21 23:23 |
その他 (CaboCha-0.66/UniDic用モデルファイル) | 2013-02-18 17:00 |
旧版[ChaKi Legacy] (2.1.0 Build 202) | 2008-11-16 23:47 |
Dependencyパネルで編集する文節・係り受けは、文内の局所的な構造ですが、 これらは内部的にはDocumentに対するアノテーションの一種として表現されます。
ChaKi.NETでのアノテーションスキーマは、SLAT2との互換を図る目的で共通化されています。 すなわち、基本的には
の5要素で表されるスキーマに基づくアノテーションを採用しています。
このスキーマをChaKi.NETに適用する上で、次のような対応関係があります。
つまり、文と語の構造により表現されるDocument構造に対してさらに文節・係り受け構造を 持たせるのではなく、一方で文と語の構造を保ちつつ、他方Documentをシーケンシャルな文字列で捉え直し、 その上に文節(Segment)と係り受け(Link)をアノテーションとして付与する、という方法を取っています。
このように、Dependencyパネルは、Segment等を上記の制約を満たしながら編集する一種のアノテーションツールとみなすことができます。そのように見た場合、Dependencyパネルを通じて係り受け以外の文内のアノテーション作業も行うというのは自然な拡張の方向であると言えます。
(文をまたぐSegment, Linkもスキーマ定義上は十分可能ですが、Dependencyパネルでの編集対象外であり、他の手段で編集するものと考えます。)
Dependencyパネルでは、係り受け以外の一般的なアノテーションとして、現在のところ下記のものが可能です。
これらのアノテーションの方法については次節で説明します。
アノテーションは、Segment, Link, Groupのアノテーションインスタンスを生成し、同時にTagへの参照をそれに結び付けることで行われますが、このアノテーションインスタンスにはTag参照以外にもいくつか編集可能な項目が付属しています。
なお、ChaKi.NETには、DocumentおよびLexemeにも属性(Attribute)と呼ぶキー・値ペアが付属しますが、これらはアノテーション属性の一種ではありません。Document属性は、各Sentenceからマップされる書誌(Bib)情報を指すものであり、またLexeme属性は、語彙の内容(Lexeme Properties)を指します。