1.プロジェクト名:スワヒリ語の自然会話収集
2.内容概略:
スワヒリ語には、これまでHelsinki Corpus of Swahiliで利用可能なコーパスが存在するが、これは書き言葉が主で、話し言葉については部分的に存在するものの、データも非公開である。本プロジェ クトでは、自然会話を文字化することで、話し言葉におけるスワヒリ語の文法的諸現象を分析するためのコーパスを構築する。
3.事業推進担当者:稗田 乃
4.研究協力者:阿部優子(本学グローバルCOE研究員)、安部麻矢(大阪大学非常勤講師)、井戸根綾子(大阪大学博士後期課程)、宮崎久美子(大阪大学博士後期課程)
5.進捗状況:
2007年度は、プロジェクト参加者の調整、そして参加者の一人である阿部優子をタンザニアに派遣した。阿部優子は、ダルエスサラーム大学、スワヒリ語研究所に 協力を要請し、現地コーディネータと2008年4月以降の計画を調整し、契約書を取り交わした。さらに、会話資料として、現地新聞(Sani、週2回発 行)のカートゥーンの購入、タンザニア北部、ダルエスサラームにおけるスワヒリ語接尾辞-ag-の意識調査を行った。
2008年度は、ダルエスサラーム大学、スワヒリ語研究所と取り交わした契約書にもとづき、ダルエスサラーム大学、スワヒリ語研究所の協力を得て、スワヒリ語会話コーパスを作成した。また、阿部優子(本学グローバルCOE研究員)をタンザニアに派遣し、スワヒリ語の発話資料の収集を行った。また、スワヒリ語コーパスに自動タグづけソフトの開発を推進している。
6.成果物:
2008年度の成果物として、ダルエスサ ラーム大学、スワヒリ語研究所の協力を得て、文字化した会話データを作成し、スワヒリ語会話コーパスを作成した。また、阿部優子のスワヒリ語接尾辞の調査結果は、 2008年5月8日-9日のグローバルCOE主催シンポジウムで発表した。
2011年までに構築したスワヒリ語「口語」コーパスは、公開されている。また、開発を試みたスワヒリ語形態素分析ツールは、公開するには至っていない。開発中のスワヒリ語形態素分析ツールを用いてスワヒリ語「口語」コーパスを解析することが言語研究に貢献する可能性について、稗田乃「スワヒリ語の目的語接辞の働き-スワヒリ語「口語」コーパスを用いた研究の試み―」(Pragmatic Functions of Swahili Object Suffixes – an analysis of ‘spoken’ Swahili corpus – )において議論した。