「リサーチ・ナビ」に関するアンケートを実施しています。皆さまのご意見をお聞かせください。アンケートに答える

トップアジア諸国の情報をさがす刊行物>ヒンディー語書誌における表記文字に関して : アジア情報室通報第5巻第1号

ヒンディー語書誌における表記文字に関して : アジア情報室通報第5巻第1号

アジア情報室通報 第5巻第1号(2007年3月)

松木園久子

1.はじめに

非ローマ字言語の資料に関して、書誌情報をローマ字に翻字することによりさまざまな問題が生じることはこれまでも指摘されてきた*1。ヒンディー語はデーヴァナーガリー文字で表記される言語であり、やはり翻字を通して数々の不都合が生じる。日本では、アメリカ議会図書館(以下、LC)にならってヒンディー語書誌データを作成してきたため、主として翻字が用いられてきた。これまでは各図書館がそれぞれ試行錯誤と工夫を重ねる状態が続いてきたが、昨年国内で実質初めて明確な方針が示された。すなわち国立情報学研究所から「デーヴァナーガリー文字資料に関する取扱い及び解説」および「コーディングマニュアル(デーヴァナーガリー文字資料に関する抜粋集)」が発表されたのである(2006年3月発表、同年6月より適用)*2。これは書誌データの記述においてデーヴァナーガリー文字すなわち原綴の使用を主とし、翻字に補助的な役割を与えている。すでに日本国内の大学図書館でも、翻字を用いた旧来の方針から原綴が採用される方向にあり、当館でもこれに沿って資料整理をすすめている。今後ヒンディー語書誌はより統一され、利用者にとってより身近なものとなるだろう。

ある資料に関する情報が、元の文字のままで扱われるのは、いわば当たり前のことである。しかし、これまでの経緯や実用性を考慮すれば、今後も翻字の必要性は無視できないのも事実である。小稿では、ヒンディー語書誌に翻字と原綴を用いた場合の有効性と問題点についてそれぞれ報告し、あわせて今後望まれる方向性を考えたい。

2.ヒンディー語資料整理の経緯

まず最初に、日本におけるヒンディー語書誌作成の各段階を振り返っておこう。ここでは筆者が携わった1994年度から1998年度までの大阪外国語大学附属図書館(以下、大阪外大図書館)での処理を中心に述べたい。これまで生じた問題のなかには、原綴使用によって解決されるものも、今後も検討が必要なものもある。これらがどのように対処され、何が優先されたかを明らかにしておくことは、今後より充実した書誌を作成するための手がかりになるだろう。

国内で相当数のヒンディー語資料を所蔵しているのは、専門研究・教育を行っている東京外国語大学(約12,000点)、大阪外国語大学(約13,000点)の両大学附属図書館に絞られる*3。資料整理においても両図書館が先行している。ヒンディー語資料の整理に初めてコンピュータが導入されたのは、1992年頃、大阪外大図書館で館内コンピュータへの登録が開始された時点であろう。当時は蔵書の重複調査および管理を目的として、図書館職員と大学院生が作業を進めつつ、書誌作成の方針を固める、手探りの状況であった。文字に関しては、ローマ字入力以外に選択肢はなかったが、翻字方法も容易に決定したわけではなかった。というのも、後で述べるように、ヒンディー語には今なお複数の翻字方法が流通しており、それぞれに用途があって一概に優劣がつけられないからである。そこで大阪外大図書館では、統一した方針でデータを作成することと、他の言語資料のデータとの一貫性を考慮して、LCの翻字方法(ALA-LC Romanization Tables。以下「ALA-LC翻字法」と略記)を採用し、書誌データ全般においても彼らの仕事を参考にした。こうして最初期のコンピュータ化は始まったが、データにアクセスできるのは、ALA-LC翻字法を知るごく一部の者に限られた。この翻字方式は、たとえば大学院生だった筆者にとっても、全く目新しいわけではないが、実際の発音と異なる場合も多く、「図書検索のためだけの専用の翻字」と感じられていた。

次の段階は、1998年度から2001年度に行われた「ヒンディー語文献の書誌情報及び画像データベース」であろう*4。これは科学研究費補助金(成果公開促進費)の交付を受け、ヒンディー語教員および大学院生・学部生が参加することにより、資金面でも人材面でも条件が整って可能となったプロジェクトである。その主旨は、書誌データに表題紙および目次を写真撮影した画像データ(JPEGファイル)をリンクさせ、インターネット上で公開するというものであった。当時ホームページにデーヴァナーガリー文字のフォントを使用することは実用的ではなかったため、画像として表示することが選ばれた。これにより利用者は、表題紙と目次ページを現物のまま、「デーヴァナーガリー文字で情報を得る」ことができるようになったのである。書誌データにおいても、公開されることを前提に、検索率を向上させる工夫がなされた。引き続きLCのデータを基本としたが、この時点でもなお学内の教員や学生にALA-LC翻字法が浸透していたとはいえなかった。そのためヒンディー語資料を必要とする、すなわちヒンディー語を読める人々が使うであろう翻字を、VT(その他のタイトル)フィールドに補足した。

さらにこのプロジェクトには、原綴での検索機能も付与された。すなわち「〔大阪外大図書館の〕HP(ホームページ)上の仮想キーボードからマウス操作により、利用者所有マシンのデーヴァナーガリー文字フォントの有無に関わらず検索できる」*5ようになったのである。後に東京外大図書館のOPACでも、原綴による検索が可能となっている。これらのシステムはALA-LC翻字法を熟知していない利用者にとって、格段に利便性を向上させたといえるだろう。ここでいよいよ「デーヴァナーガリー文字による検索および表示」が可能な段階に入ったのである。

以上の経緯から、各図書館は利用者が原綴を使えるように配慮してきたことが分かる。国立情報学研究所が打ち出した原綴使用の方針は、このようなニーズに応えるものであり、またLCとは一線を画した、日本の独自路線とみなすことができる。

翻字のバリエーション

先にヒンディー語には複数の翻字法が並存していることに触れたが、小稿では便宜上3種類に大別して説明しよう。たとえば「辞書」を意味するに対する翻字として、(1)śabdakośa、(2)śabdkoś、(3)shabdkoshがあげられる。

(1)がALA-LC翻字法にあたる。これはデーヴァナーガリー文字1文字ずつにローマ字表記(子音と母音の組み合わせ)を対応させる方法である。26のローマ字のほかに、字母に特殊な記号を付与して、発音の区別が表される。たとえば短母音はa、i、uと表記されるのに対し、長母音はā [aù]、ī [iù]、ū [uù]となる。また、歯音のtに対して反舌音はṭ、歯擦音にはsのほかśやshがある。これは現時点で学術分野の標準とされているサンスクリット語の翻字法The International Alphabet of Sanskrit Transliteration(IAST)とかなり近いものである。ヒンディー語は、サンスクリット語と同じデーヴァナーガリー文字で表記されるために、この規則が適用されている。しかし発音に関しては、サンスクリット語とは異なり、ヒンディー語は必ずしも表記どおりではないため、両者はしばしば大きく異なるのが実状である。このため、ヒンディー語使用者から見れば、この翻字法は不自然に映ることがある*6

この方式の長所は、文字に特化して機械的に移し変えるため、翻字から正確に原綴を還元できることである。つまり、文字の識別さえできれば、発音規則を知らなくても書誌データを入力できることになる。しかし反面、資料を利用するヒンディー語使用者から見れば、実際のヒンディー語の発音と異なるため、違和感があり、翻字を確定しにくいため不便でもある。たとえば先のは、śabdakośaと翻字されるが、特定箇所の短母音aは発音されない規則にのっとり[S«bdkoùS]と発音される。

このような表記と発音の乖離を解消した翻字方式が(2)といえる。長母音や反舌音、歯擦音を表す際に字母に付与される記号(ā、ī、ū、ṭ、ś等)はほとんど全て(1)と同じだが*7、発音されない短母音aは除かれる。つまりは、(1)によればśabdakośaだが(2)ではśabdkośとなる。

これはヒンディー語の入門書や辞書などに「読み仮名」として補助的に用いられる方式であり、日本語や英語で書かれる学術的な文章中にも用いられることが多いため、ヒンディー語学習者にとっては最もよく目にする形である。しかし問題は、この方式にも統一された規格ができあがっていないことである。特に鼻音化音についてはいくつかの表記が並存している*8

ヒンディー語資料の利用者にとってこの方式が最も馴染みのあることを考えれば、書誌データもこれに対応していることが望ましいに違いない。しかし、発音を知らなければ入力できないという制約は小さくはない。というのも発音が分かるということは単に音韻規則を知っているだけでなく、合成語の構成要素を見分ける語彙力や、例外的に語末のaを発音するサンスクリット語由来の語なども理解していなければならないからである。何より、翻字法に統一された規格がない以上、整合性あるデータ作りも困難である。

最後の(3)は、(2)よりもさらに恣意的なもので、あえて定義するなら、「英語風の翻字」とでもいえようか。つまり英語話者の読み方を想定して翻字されたものと考えられる。これは(1)や(2)とは異なり、特殊記号を用いず、26のローマ字のみで表される。たとえば長母音の[iù]はee、[uù]はooあるいはohなどと表記される。歯擦音शとषの区別はなくなり両者ともshと表記され、च [tS«]とその帯気音छ [tSH«]は、(1)と(2)ではそれぞれcaとchaで区別されるが、(3)ではchaに統一されるか、後者のみchhaとされたりする。このため、も、発音[S«bdkoùS]を英単語風に書き取ったshabdkoshが一般的である。さらには英語の発音規則を取り入れたと考えられるパターンも考えられる。たとえば英単語では発音されない語尾e(storeなど)を適用して、किशोर「少年」[kiSoùr]をkishoreと表記する場合もある((1)ではkiśora、(2)ではkiśorとなる)。

この方式は、学術分野ではあまり見られないが、英語で書かれている新聞や小説、ホームページなどでは最も一般的である。つまり、必ずしもヒンディー語の専門知識を必要としない、広範囲で用いられているといえよう。(1)や(2)で用いられる特殊記号は、たしかに慣れていなければ、煩わしく、紛らわしいものでもある。(3)の方式が広く用いられているのは、簡潔さと無関係ではないだろう*9。ヒンディー語図書には、表題紙の裏のページなどに翻字された書名や著者名が印刷されていることがあるが、それらも大半がこの方式である。

1998年度からの大阪外大によるデータベース作成プロジェクトでVTを拡充させたのも、この方式で検索されることを想定したためである*10。背景には、インターネット上でヒンディー語書誌を公開するにあたり、利用者のほとんどが検索の際に(1)や(2)の特殊記号を用いるとは考えられなかったという状況があった。そこで、図書に印刷されている例や英語の文章のなかでの翻字を参考にしつつ、ヒンディー語を学んできた学生が自らの体験に照らしながら、検索に用いられる可能性が高いと判断したパターンを絞り込み、VTに補ったのである。しかし、その数は膨大な数にのぼり、入力者にかかる負担はあまりに大きすぎ、実用的とは言いがたかった。

以上のように、ヒンディー語の翻字法には、それぞれに使用される分野と実際に使われてきた事実がある。これらは、いずれにも存在意義があり、今後も存続していくだろう。これまで日本で採用されてきたALA-LC翻字法は、最も確実に原綴を還元できるものであり、また入力者の立場から見ても、最も統一された、扱いやすい方式だといえる。ヒンディー語の学習者・研究者にとっては、実際の発音と異なるために不都合な面もあったが、この問題は今後原綴を用いることによって解消されていくだろう。

それでは今後翻字にはどのような必要性が考えられるだろうか。ヒンディー語資料およびそのデータがやりとりされる場面を想定しつつ、考えてみよう。

4.まとめにかえて

先の国立情報学研究所による方針では、原綴とともにALA-LC翻字法による表記をその他のヨミ(TRVR、VTVR、CWVR)フィールドに引き続き入力することとされている。このことからも、翻字の必要性をみとめることができる。ヒンディー語資料を利用する人はヒンディー語を読めるはずだが、その周囲の関係者がデーヴァナーガリー文字を判読できない可能性は十分にあり得る。たとえば図書館員は、資料を受け入れたり、書誌データを管理したり、相互貸借にもかかわる。その際既存データのやりとりを含むことから、翻字方式(1)が有用だと思われる。また大学等で資料を購入する際にも、請求者と関係職員および業者との間で、翻字で情報をやりとりすることになるだろう。この場合翻字方式(3)が簡便だと考えられる。最近ではインターネット上の店舗で、ヒンディー語資料を購入できるようになったが、現時点では大半が(3)の翻字方式で表記されている。

すでに、図書館員と研究者の間でのきちんとした意思疎通がはかられなかったことが、資料整理における混乱を招いた例が報告されているが*11、ヒンディー語資料の場合も同様の危険性は大いにある。幸いにも初期からLCの書誌データに則ったため、大きな混乱は免れたが、これまで述べてきたように、ALA-LC翻字法が十全というわけではなく、今後も複数の翻字法が並存していくだろう。また、現時点ではヒンディー語資料の利用者に検索方法が周知されているとはいいがたい。より有効に資料およびデータが活用されるよう、今後も関係者間の積極的な情報交換が重要だと考えられる。

*1 たとえばアラビア文字の資料に関しては、三沢伸生「アラビア文字表記資料の翻字問題」『アジア資料通報』35(3), 1997.6, pp.1-7を参照。

*2 http://www.nii.ac.jp/CAT-ILL/manuals/devanagari_toriatsukai.doc外部サイトへのリンク

*3 統計はhttp://www.ndl.go.jp/jp/service/kansai/asia/directory/directory/language.htmlによる。

*4 このプロジェクトの詳細はhttp://wwwlib.osaka-gaidai.ac.jp/files/multilan/hinkaisetsu.html外部サイトへのリンク。また1998年当時、筆者は東京外大図書館と国立国会図書館に訪問したが、ヒンディー語書誌入力の方針は定まっていなかった。

*5http://wwwlib.osaka-gaidai.ac.jp/files/multilan/hinkaisetsu.html外部サイトへのリンク

*6顕著な例として、ज्ञの文字はサンスクリット語では[dZø«]、ヒンディー語では[gj«]と発音する。

*7 (1)ではषの文字に対して、サンスクリット語ではs、ヒンディー語ではshが割り当てられている。

*8 たとえばपाँच「五、五つの」[paâùtS]に対して、paÜâncやpāimagecなどのパターンがある。

*9 これらのなかには翻字というよりもむしろ英単語として通用していると言っても過言でないものもある。たとえばआया「乳母」[aùjaù]はayahという表記で、英語の文章の中でも定着しているし、Oxford Dictionary of English等の英語辞書にも掲載されている。

*10 たとえばVTVT(異なりアクセスタイトル)には(2)の特殊記号を省いた形や(3)で頻繁に見られる慣用的な表記を、VTOH(その他のタイトル)には資料に印刷されている書名や著者名等の翻字による表記を補って入力した。このような対策については、その後も検討が続いている。

*11三沢、前掲論文、p.5。

(すべてのURLのlast access:2006/11/13)

  • 国立国会図書館
  • 国立国会図書館オンライン
  • 国立国会図書館サーチ
  • 国立国会図書館デジタルコレクション
  • ひなぎく
  • レファレンス協同データベース
  • 本の万華鏡
  • 参考書誌研究