Site menu:

gcoe_pamphlet_banner tufs_banner ubli_banner
日本語 Top » 言語情報学 » 自然会話収集

1. プロジェクト名:会話コーパス作成のための自由会話収集(フランス語、スペイン語、トルコ語)

2. プロジェクト概要:本プロジェクトは、21世紀COEプログラムで行った先行調査の継続である。このプロジェクトでは、当該言語の自発的な会話に基づいたコーパスを作成していく。会話データは転写し、関連する注釈をほどこして加工する。本プロジェクトは、国際的な協働研究プログラムであり、以下の大学と協働しておこなっている。(Marmara大学、Istanbul大学、 Middle East Technical大学、 Mersin大学<トルコ語>、Aix-Marseille大学<フランス語>、Madrid自治大学<スペイン語>)

3. 事業推進担当者:川口 裕司(東京外国語大学大学院)、高垣 敏博(東京外国語大学大学院)

4. 研究協力者(口語フランス語コーパス):Hisae Akihiro(Aix-Marseille大学)、Shunsuke Nakata(東京外国語大学大学院博士後期課程)、Mito Matsuzawa(東京外国語大学大学院博士後期課程)、Kaori Sugiyama(東京外国語大学大学院博士後期課程)、Koga Kentaro(東京外国語大学大学院博士前期課程)
アカデミック・アドバイザー:José Delofeu(Aix-Marseille大学)、André Valli(Aix-Marseille大学)、Frédéric Sabio(Aix-Marseille大学)

研究協力者(口語スペイン語コーパス):Haruka Kuno(東京外国語大学大学院博士後期課程)、Ryo Tsutahara(東京外国語大学大学院博士後期課程)、Hideki Kumakura(東京外国語大学大学院博士後期課程)
アカデミック・アドバイザー:Chieko Kimura(Madrid自治大学)

研究協力者(口語トルコ語コーパス):Selim Yılmaz(Marmara大学)、Arsun Uras Yılmaz(Istanbul大学)、Yuu Tsukui(在トルコ日本大使館)
アカデミック・アドバイザー:Şükriye Ruhi(Middle East Technical大学)、Yeşim Akasan(Mersin 大学)、Mustafa Aksan(Mersin大学)

5. 業績:
1. 口語トルコ語コーパス
2007年度には、トルコ語コーパスプロジェクトのみ実施。Selim Yılmaz氏協力のもと、Marmara大学にて22のインフォマントによる自発的会話を録音。総録音時間は7時間17分。転写済み。2008年度には、Middle East Technical大学で100万語を含む口語トルコ語コーパスを作成しているŞükriye Ruhi教授と、Mersin大学で5000万語を含む最初の文語トルコ語コーパスを作成しているYeşim教授とMustafa Aksan氏を招聘し、ワークショップを開催した。今後の協働研究を促進していくことにも同意いただいた。2009年度には、新トルコ語コーパスを作成。Selim Yılmaz氏とArsun Uras Yılmaz氏の協力のもと、Marmara大学とIstanbul大学にて23の自発的会話を録音。総録音時間は8時間47分。転写済み。2010年度には、新トルコ語コーパスにデータを追加。Selim Yılmaz氏の協力のもと、Marmara大学にて30の自発的会話を録音。総録音時間は6時間48分。転写済み。口語トルコ語コーパスの総語数は330,048語。2011年度には、もう一つのトルコ語コーパスを作成中。Selim Yılmaz氏とArsun Uras Yılmaz氏の協力のもと、Marmara大学とIstanbul大学にて21の自発的会話を録音。総録音時間は7時間17分。現在、転写中。

<論文>
川口裕司 「話し言葉トルコ語における述辞後続要素:コーパス分析ノート」, 2011, コーパスに基づく言語学教育研究報告7 『フィールド調査、言語コーパス、言語情報学Ⅳ』, 171-197.
Ruhi Şükriye, “The Pragmatic of yani as a Parenthetical Marker in Turkish: Evidence from the METU Turkish Corpus” 『コーパスに基づく言語学教育研究報告3』 Global COEプログラム, 東京外国語大学大学院総合国際学研究科, 2009, 285-298.
Aksan Yeşim, Mustafa Aksan, “Building a National Corpus of Turkish: Design and Implementation” 『コーパスに基づく言語学教育研究報告3』 Global COEプログラム, 東京外国語大学大学院総合国際学研究科, 2009, 299-310.
Karadaş Derya Çokal, Şükriye Ruhi, “Features for an Internet Accessible Corpus of Spoken Turkish Discourse” 『コーパスに基づく言語学教育研究報告3』 Global COEプログラム, 東京外国語大学大学院総合国際学研究科, 2009, 311-320.
Yuji Kawaguchi, A corpus-driven analysis of -r dropping in spoken Turkish, 2009, Corpus Analysis and Variation in Linguistics, John Benjamins, 281-297.

2. 口語フランス語コーパス、口語スペイン語コーパス
2009年度には、Madrid自治大学へスペイン語の自発的会話を録音するため、研究チームを派遣。総録音時間は34時間56分。転写済み。2009年スペイン語コーパスの総語数は462,248語。同じく2009年度には、フランスのAix-Marseille大学に、研究チームを派遣。大学の講義室および個人の家で、計34の自発的会話を録音。現在、転写済みの総語数は484,232語。残りの転写も進行中。2011年度には、Aix-Marseille大学に、新たな研究チームを派遣。