国立国語研究所
 
 

はじめに

国立国語研究所基幹型共同研究プロジェクト「コーパスアノテーションの基礎研究」(H21年10月~H27年9月) の成果物を公開するWebページです。

成果物はアノテーションデータ・論文・ドキュメントからなります。

アノテーションデータ

サンプルデータの公開

BCCWJ のサンプルデータは、原著者に著作権があり DVD を購入していない方への再配布はできません。
しかし、以下のサンプルにつきましては、著作権フリーマークが付与されており、再配布が可能です。

  • OW6X_00000 (コアデータ)
  • OW6X_00027
  • OW6X_00165
  • OW6X_00657

アノテーション順序(BCCWJ)

BCCWJコアデータサンプルのアノテーション優先順序です。BCCWJコアデータにアノテーションを行う際には、この優先順位に基づいてサンプルを選択することをおすすめします。

れる・られる用法アノテーション

単語係り受けアノテーション(ラベルなし)

文節係り受け・並列構造アノテーション (deppara)

ダウンロードサーバ

スタンドオフ形式

サンプルに対する文体指標 (sty)

時間情報・時間的順序関係アノテーション

日本語フレームネットアノテーション (jfn)

述語項構造シソーラスアノテーション (pth)

述語項構造アノテーション (pas)

節境界アノテーション (CBL)

拡張固有表現アノテーション

(共同研究「コーパスアノテーションの基礎研究」外の成果物です)

業績一覧

 
 

event

lrw

unidic_btn

chamame_btn

syonagon_btn

chunagon_btn