国立国語研究所
 
 

江戸時代編 概要 INTRODUCTION

『日本語歴史コーパス 江戸時代編』の試作版として、ひまわり版「洒落本コーパス」(Ver.0.5,短単位情報付き)とひまわり版「人情本コーパス」(Ver.0.1,テキスト検索のみ)を公開しています。
「部分一致」が「前方一致」と表示されていた誤りを修正しました。<2015.11.27>
原本画像を開けない・ページ数がずれる等の不具合を修正しました。なお、本データはHimawariバージョン1.5.3以降をインストールしてご利用ください。旧バージョンだと不具合が生じる可能性があります。<2015.11.06>

洒落本 江戸時代編Ⅰ

ひまわり版「洒落本コーパス」Ver. 0.5 概要

  • 『聖遊廓』(1757[宝暦7]年・著者不明・1冊・大坂) 底本:洒落本大成編集委員会編
    『洒落本大成』(1978-88中央公論社)  参照用画像:国立国語研究所蔵本
  • 『河東方言箱まくら』(1822[文政5]年・大極堂有長[作]・3冊・京都) 底本:洒落本大成編集委員会編『洒落本大成』(1978-88中央公論社)  参照用画像:国立国語研究所蔵本
  • 『玉菊全伝花街鑑』(1822[文政5]年・鼻山人[作]・3冊・江戸) 底本:洒落本大成編集委員会編
    『洒落本大成』(1978-88中央公論社)  参照用画像:国立国語研究所蔵本

 洒落本は、江戸時代後期の江戸語・上方語が描写された会話文を含む文学作品で、同時期の重要な口語資料とされています。底本とした洒落本大成編集委員会編『洒落本大成』(1978-88中央公論社)は、全30冊に及ぶ大規模な翻刻本文の叢書で、日本語史研究上頻繁に利用されています。

 本コーパスの特徴は次の通りです。

  •  すべてのテキストに読み、品詞、活用形等、短単位の形態論情報が付与されています。
  •  本文には一部校訂を施し、会話などの本文の種別や話者の情報が付与されています。
  •  話者情報については、同一話者の表示を統一し、性差・身分・地域差などの情報を付与しています。
  •  検索結果から半丁単位で本文の画像を参照できます。

利用方法

利用に際しては、以下の利用案内をご一読のうえ、ご利用ください。

なお、『ひまわり版「洒落本コーパス」』 は クリエイティブ・コモンズ 表示 - 非営利 4.0 国際 ライセンスの下で提供されています。データの利用・共有・改変等に際しては、本事項を順守してください。
クリエイティブ・コモンズ・ライセンス

 コーパスデータは以下よりダウンロードしてお使いください。

ダウンロード:

『ひまわり版「洒落本コーパス」』の利用方法

  •  1 あらかじめ、以下のリンク先の説明に従って「ひまわり」をインストールしておいてください。
          参照: 全文検索システム「ひまわり」
  •  2 『ひまわり版「洒落本コーパス」』データをダウンロードしてください。
      ※ Windowsをお使いの方は、ダウンロードした『ひまわり版「洒落本コーパス」』データを右クリックし、[プロパティ] > [全般]でセキュリティのブロックが解除されていることを必ず確認してください。
  •  3 『ひまわり版「洒落本コーパス」』のzipファイルを解凍すると、sharebon_himawariフォルダが現れます。その中に次のファイルがあることを確認してください。
    •    ○ Corpora フォルダ ... データを格納したフォルダ
    •    ○ config_sharebon.xml ... 設定ファイル
  •  4 Corporaフォルダとconfig_sharebon.xmlを「ひまわり」がインストールされているフォルダの中に移動してください。上書きの確認が出るかもしれませんが、そのまま続行してください。以上で、コーパスデータの「ひまわり」へのインストールは終了です。
  •  5 「ひまわり」を起動後、[ファイル]>[新規]を実行し、config_sharebon.xmlを読み込んでください。これで検索できる状態になります。「ひまわり」の使い方については、「ひまわり」がインストールされているフォルダの中にある利用者マニュアルを参照してください。

ご利用にあたって

本コーパスをご利用になる際は、必ず下記の情報を明記してください。(バージョンやアクセス年月日は適宜置き換えてください)

  • 国立国語研究所コーパス開発センター(市村太郎ほか)編(2015)『ひまわり版「洒落本コーパス」(日本語歴史コーパス江戸時代編)』http://pj.ninjal.ac.jp/corpus_center/chj/edo.html#share(Ver. 0.5)(yyyy年mm月dd日確認)

※ バージョンかアクセス年月日のいずれかを明記すれば下記のように短縮しても構いません。

  • 国立国語研究所(2015)『ひまわり版「洒落本コーパス」(日本語歴史コーパス江戸時代編)』http://pj.ninjal.ac.jp/corpus_center/chj/edo.html#share(Ver. 0.5)
  • 国立国語研究所(2015)『ひまわり版「洒落本コーパス」(日本語歴史コーパス江戸時代編)』http://pj.ninjal.ac.jp/corpus_center/chj/edo.html#share(yyyy年mm月dd日確認)

開発スタッフ-江戸時代編Ⅰ 洒落本-

    開発担当者
    • 市村太郎(プロジェクト非常勤研究員)
    開発協力者
    • 小木曽智信(准教授) 田中牧郎(客員教授・明治大学教授) 高田智和(准教授)
    • 鴻野知暁 (プロジェクトPDフェロー)
    • 河瀬彰宏 渡辺由貴 村山実和子 (プロジェクト非常勤研究員)
    • 瀧田裕子(技術補佐員)
    • 鈴木奈生 北﨑勇帆 山田里奈(作業協力者)
    共同研究者
    • 岡部嘉幸(千葉大学教授) 村上謙(関西学院大学教授)

※ 本コーパスは、共同研究プロジェクト「通時コーパスによる日本語史研究の新展開」の研究成果の一部です。また本コーパスにおける話者情報の構築にあたっては日本学術振興会科学研究費補助金「コーパス内話者情報を利用した近世後期江戸語・上方語の研究」(研究課題番号:15K16765 研究代表者:市村太郎)の助成を受けています。


人情本 江戸時代編Ⅱ

ひまわり版「人情本コーパス」Ver. 0.1 概要

 人情本は、幕末期の江戸語が描写された会話文を含む文学作品で、近世江戸語から近代東京語への過渡的状況を研究する上で、重要な口語資料とされています。本コーパスでは、今回新たに底本を翻刻し、テキストデータを構築しました。

 本コーパスの特徴は次の通りです。

  •  本文および振り仮名を対象としたテキスト検索が可能です。
  •  本文には一部校訂を施し、会話などの本文の種別や話者の情報が付与されています。
  •  検索結果から半丁単位で本文の画像を参照できます。

利用方法

 利用に際しては、以下の仕様書をご一読のうえ、ご利用ください。

なお、『ひまわり版「人情本コーパス」』 は クリエイティブ・コモンズ 表示 - 非営利 4.0 国際 ライセンスの下で提供されています。データの利用・共有・改変等に際しては、本事項を順守してください。
クリエイティブ・コモンズ・ライセンス

 コーパスデータは以下よりダウンロードしてお使いください。

ダウンロード:

『ひまわり版「人情本コーパス」』の利用方法

  •  1 あらかじめ、以下のリンク先の説明に従って「ひまわり」をインストールしておいてください。
          参照: 全文検索システム「ひまわり」
  •  2 『ひまわり版「人情本コーパス」』をダウンロードしてください。
      ※ Windowsをお使いの方は、ダウンロードした『ひまわり』用データを右クリックし、[プロパティ] > [全般]でセキュリティのブロックが解除されていることを必ず確認してください。
  •  3 『ひまわり版「人情本コーパス」』のzipファイルを解凍すると、ninjoubon_himawariフォルダが現れます。その中に次のファイルがあることを確認してください。
    •    ○ Corpora フォルダ ... データを格納したフォルダ
    •    ○ config_ninjobon.xml ... 設定ファイル
  •  4 Corporaフォルダとconfig_ninjobon.xmlを「ひまわり」がインストールされているフォルダの中に移動してください。上書きの確認が出るかもしれませんが、そのまま続行してください。以上で、コーパスデータの「ひまわり」へのインストールは終了です。
  •  5 「ひまわり」を起動後、[ファイル]>[新規]を実行し、config_ninjobon.xmlを読み込んでください。これで検索できる状態になります。『ひまわり』の使い方については、「ひまわり」がインストールされているフォルダの中にある利用者マニュアルを参照してください。

ご利用にあたって

 本コーパスをご利用になる際は、必ず下記の情報を明記してください。(バージョンやアクセス年月日は適宜置き換えてください)

  • 国立国語研究所(藤本灯・高田智和ほか)編(2015)『ひまわり版「人情本コーパス」(日本語歴史コーパス江戸時代編)』http://pj.ninjal.ac.jp/corpus_center/chj/edo.html#ninjou(Ver. 0.1)(yyyy年mm月dd日確認)

※ バージョンかアクセス年月日のいずれかを明記すれば下記のように短縮しても構いません。

  • 国立国語研究所(2015)『ひまわり版「人情本コーパス」(日本語歴史コーパス江戸時代編)』http://pj.ninjal.ac.jp/corpus_center/chj/edo.html#ninjou(Ver. 0.1)
  • 国立国語研究所(2015)『ひまわり版「人情本コーパス」(日本語歴史コーパス江戸時代編)』http://pj.ninjal.ac.jp/corpus_center/chj/edo.html#ninjou(yyyy年mm月dd日確認)

開発スタッフ-江戸時代編Ⅱ 人情本-

    開発担当者
    • 藤本灯(特任助教) 高田智和(准教授)
    開発協力者
    • 岡部嘉幸(千葉大学教授) 小木曽智信(准教授)
    • 市村太郎(プロジェクト非常勤研究員)
    • 北﨑勇帆(作業協力者)

このコーパスは、「表記情報と書誌形態情報を加えた日本語歴史コーパスの精緻化」および「通時コーパスの構築と日本語史研究の新展開」の成果の一部です。

 
 
event
unidic_bnr

日本語をはじめとする言語を分析するための基礎資料として、書き言葉や話し言葉の資料を体系的に収集し、研究用の情報を付与したものです。