国立国語研究所
 
 

「梵天」の検索結果

検索結果は50件が画面に表示されるほか、表示範囲をCaboCha形式で、また大量件数をTSV形式でダウンロードすることができます。
以下に画面表示とダウンロードについて説明します。

検索結果の表示について

検索結果は文単位で表示されます。中心となるキーは、検索条件にマッチした文字列すべてを含む文節がキーとなります。
本文文字列の上に品詞が表示され、マウスを乗せた文節は"黄色"、その文節へ係っている文節(係り元)を"青色"、その文節が係っている文節(係り先)を"赤色"で表示しています。



表示件数について

枠上に検索件数が表示されます。画面に表示されるのは50件です。

枠下(画面下部)に次の50件を表示させる「次へ」というリンクがあります。

「次へ」をクリックすることで、次の50件を表示することができます。

「次へ」進めることにより、「前へ」「次へ」のリンクが表示されます。
「前へ」リンクをクリックすることで、前の50件の表示に戻ることができます。

検索結果のダウンロードについて

表示範囲(50件)をCaboCha形式で、または大量件数(最大10万件)をTSV形式でダウンロードすることができます。
検索枠の下部に形式と改行コードを選択する枠があります。形式と改行コードを選択し、ダウンロードボタンをクリックします。


大量件数ダウンロード(TSV形式)

10万件までの検索結果をTSV形式でダウンロードします。



ダウンロードしたファイル名は「corpus_使用検索名_text_年_月_日_時刻」です。
大量件数ダウンロード(TSV形式)では、検索結果が以下のように表示されます。

No.\t文

例:
1  で、朝一で寒すぎるから入ったコンビニでViviを立ち読みしたら、なんかリア充だってオタ〓だぞ☆みたいなページがあって、「ケータイも好きなキャラのユニフォーム仕様に☆」みたいの見つけて、海常の7だったから「リア充のくせにオタ〓すら主張するリア充女子爆発しろ
2 Q最近の音楽最近の音楽ってリア充、リア充経験者、また、あと一歩でリア充という人達を応援するラブソングが多すぎると思い
3 ※ここからは決してリア充な話ではないけれどリア充に見えてくる可能性大なので「リア充なんて氏ねばいいのに」な方はすぐここからUターンすることを推奨します


表示範囲ダウンロード(CaboCha形式)

表示されている範囲の検索結果をTSV形式でダウンロードします。
以下の例では101件目から150件目が表示されており、この範囲の検索結果がダウンロードできます。



ダウンロードしたファイル名は「corpus_使用検索名_cabocha_年_月_日_時刻」です。
表示範囲ダウンロード(CaboCha形式)では、検索結果が以下のように表示されます。

例:
* 0 1D 1/2 0.109741
Q 記号,文字,*,*,*,*,キュー,Q,Q,キュー,Q,キュー,記号,*,*,*,*
最近 名詞,普通名詞,副詞可能,*,*,*,サイキン,最近,最近,サイキン,最近,サイキン,漢,*,*,*,*
の 助詞,格助詞,*,*,*,*,ノ,の,の,ノ,の,ノ,和,*,*,*,*
* 1 2D 1/2 1.860856
音楽 名詞,普通名詞,一般,*,*,*,オンガク,音楽,音楽,オンガク,音楽,オンガク,漢,*,*,*,*
最近 名詞,普通名詞,副詞可能,*,*,*,サイキン,最近,最近,サイキン,最近,サイキン,漢,*,*,*,*
の 助詞,格助詞,*,*,*,*,ノ,の,の,ノ,の,ノ,和,*,*,*,*
* 2 7D 0/1 0.303176
音楽 名詞,普通名詞,一般,*,*,*,オンガク,音楽,音楽,オンガク,音楽,オンガク,漢,*,*,*,*
って 助詞,副助詞,*,*,*,*,ッテ,って,って,ッテ,って,ッテ,和,*,*,*,*
* 3 4D 0/0 0.882934
リア充 名詞,普通名詞,一般,*,*,*,リアジュウ,リア充,リア充,リアジュー,リア充,リアジュー,混,*,*,*,*
、 補助記号,読点,*,*,*,*,,、,、,,、,,記号,*,*,*,*
* 4 7D 4/4 0.778359
リア充 名詞,普通名詞,一般,*,*,*,リアジュウ,リア充,リア充,リアジュー,リア充,リアジュー,混,*,*,*,*
経験 名詞,普通名詞,サ変可能,*,*,*,ケイケン,経験,経験,ケーケン,経験,ケーケン,漢,*,*,*,*
者 接尾辞,名詞的,一般,*,*,*,シャ,者,者,シャ,者,シャ,漢,シ濁,基本形,*,*
EOS

CaboCha形式について

CaboCha 形式は4種類の行からなります。

  • 文節番号行
  • 形態論情報行(形態素解析器 MeCab の出力互換)
  • コメント行
  • EOS行

文節番号行

* 文節番号
係り先の文節番号(係り先なし:-1)
係り受け関係ラベル (D)
主辞の形態素位置/機能語の形態素位置
係り関係のスコア(大きい方が確信度が高い)

形態論情報行

MeCab-UniDic の出力と互換しています。内容と順序は以下の通りです。

出現形書字形\t
品詞,
品詞細分類1(大分類),
品詞細分類2(中分類),
品詞細分類3(小分類),
活用型,
活用形,
語彙素読み,
語彙素,
書字形(表層形),
発音形出現形,
書字形(基本形),
発音形(基本形),
語種,
語頭変化型,
語頭変化形,
語末変化型,
語末変化形

コメント行

#! ではじまる行です。BonTenの出力は以下の通りです。

#! DOC
#! DOCID

EOS行

EOS のみの行は文末を表します。

 
 
event
unidic_bnr

日本語をはじめとする言語を分析するための基礎資料として、書き言葉や話し言葉の資料を体系的に収集し、研究用の情報を付与したものです。