「リサーチ・ナビ」に関するアンケートを実施しています。皆さまのご意見をお聞かせください。アンケートに答える

トップアジア諸国の情報をさがす刊行物>台湾のデジタルアーカイブプロジェクト : アジア情報室通報第4巻第2号

台湾のデジタルアーカイブプロジェクト : アジア情報室通報第4巻第2号

アジア情報室通報 第4巻第2号(2006年6月)
安藤 一博 (国立国会図書館アジア情報課)

 

1. はじめに

2005年11月末から12月上旬にかけて台湾のデジタルアーカイブプロジェクトを調査する機会を得た。

台湾の学術機関、図書館、博物館は「數位典藏國家型科技計畫(National Digital Archives Program 、以下NDAP)」*1の下で、所蔵する一次資料や重要文物の電子化及び研究成果のデータベース化を進めている。このプロジェクトは従来の「數位博物館計畫」、「國家典藏數位化計畫」、「國際數位圖書館合作計畫」の成果を引継ぎ、2002年に開始された包括的なデジタルアーカイブプロジェクトである。中心機関として国家図書館(台湾)、国立故宮博物院図書文献館、中央研究院、国史館、国史館台湾文献館、国立台湾大学、国立歴史博物館、国立自然博物館が参加するほか、公募の形でその他の大学や博物館などがプロジェクトに参加している。作成するコンテンツの主題も生物、考古、地質、档案、器物、書画、善本古籍、新聞など多岐に渡る。

NDAPは第1期を2001-2006年と定めており、訪問時はちょうど第1期の取り組みが実現化する時期であった。今回は訪問した機関のうち、プロジェクト参加機関である国家図書館(台湾)、国立故宮博物院図書文献館、中央研究院歴史語言研究所傅斯年図書館、国史館、国立台湾大学図書館の雑誌、新聞、古籍、档案資料の電子化の取り組みについて紹介する。

2. 雑誌

国家図書館は雑誌の電子化を進めるにあたり、プロジェクトを立ち上げて刊行時期と雑誌のタイトルで対象を選別してまとめて電子化を行う方式とドキュメントサプライサービスを通して利用者の依頼を受けたものを随時電子化する方式の2つの方式を並行して行っている。

プロジェクト方式ではNDAPの子計画である「國家圖書館期刊報紙典藏數位化計畫」*2と教育部が所管する「圖書館事業發展三年計劃」*3(2002-2004年)の子計画である「中文期刊報紙數位化計畫」の下で進められている。すでに終了した「中文期刊報紙數位化計畫」では1971年以前に台湾で出版された中国語の雑誌200タイトル、論文208,300件分が電子化された*4。なお、現在進行中の「國家圖書館期刊報紙典藏數位化計畫」では2002-2006年の5年間で1,000タイトルの雑誌の電子化を予定している。

これら電子化されたデータは「期刊文獻資訊網」*5のコンテンツの1つである「國家圖書館期刊影響資料庫」で提供されており、利用は館内に限定されている。

ドキュメントサプライサービスは、「遠距圖書服務系統」*6というサイトを通して提供されている。雑誌論文や博士論文などのデータベースの検索結果から直接複写依頼できるようになっている。受取方法は郵送、FAXのほか、電子データのダウンロードがあり、すでに電子化済の論文はすぐに入手することができる。電子化されていない論文も、国家図書館に電子化を依頼すると3開館日以内に電子化され、依頼者にはメールによる利用可能の通知が送られる。従って、ニーズの高い文献ほど早期に電子化されることになる。しかし、2004年の「公開伝輸権」(公開伝送権)*7を認める著作権法の改正により、論文の電子データを提供するためには著作権者の許諾が必要となり、現在、ダウンロードできるのは許諾を得た文献のみになっている*8。国家図書館は出版社、著者等に許諾を求めているが、論文により著作権者が出版社であったり、著者であったりと様々であるため、作業は非常に煩雑であるという。

3. 新聞

新聞の電子化も雑誌と同様にNDAPの子計画である「國家圖書館期刊報紙典藏數位化計畫」と「圖書館事業發展三年計劃」の子計画である「中文期刊報紙數位化計畫」の下で国家図書館が進めている。

「中文期刊報紙數位化計畫」では1971年以前と2001-2004年に発行された新聞の電子化とマイクロ化を進めた。「國家圖書館期刊報紙典藏數位化計畫」では2001-2006年の5年間に30タイトルの新聞の電子化をする予定である。全文データは「全國報紙資訊系統」*9で提供されているが、利用は館内に限定している。

4. 古籍

(1)国家図書館(台湾)

所蔵する善本12,300余部126,000冊のうち約6,000部及び金石拓片約6,200幅を電子化の対象としている*10。データは「古籍影像檢索系統」 で提供されている。全文の画像データの利用は館内に限定されているが、巻頭の画像データは館外に公開されている。

また、有名な絵師によるなど芸術的、文化的に重要な挿図を収録する古籍4,624部を電子化し、国立故宮博物院、中央研究院歴史語言研究所と共同でデータベースを構築するほか、米国議会図書館(LC)との合同プロジェクトで、LCが所蔵する古籍の電子化を2005年から2007年の予定で進めている。

(2)国立故宮博物院図書文献館

国立故宮博物院図書文献館は善本書籍176,690冊を所蔵する。NDAPでは、国家図書館と中央研究院歴史語言研究所と共同で上述の挿図を収録する古籍データベースを構築する*12。清朝宮廷の「舊藏善本」、「殿本舊籍」及び楊氏観海堂蔵書から5,200冊を電子化する。全文データは「善本古籍資料庫」*13に搭載する。料金徴収のシステムが完成した後はインターネットで公開する予定である。

(3)中央研究院歴史語言研究所傅斯年図書館

中央研究院歴史語言研究所傅斯年図書館は善本3,800余部44,000余冊、古籍線装本約140,000冊、俗文学資料約12,000件などを所蔵する。中央研究院歴史語言研究所は1984年に漢籍テキストデータベース(漢籍全文電子文獻)の作成を開始するなど早い時期から電子化に取り組んでいた。

所蔵する善本の電子化も1988年には開始している。当初、経史子集の分類順に電子化を行う予定であったが、経部の電子化が終了した後は、利用率、本の状態などから判断し、手稿、宋元刊本、敦煌資料などを優先的に電子化するようになった。2000年までに善本1,430部12,980冊の電子化が終了している。

2002年以降は明版明人詩文集156部1,773冊について国家図書館、故宮博物院、台湾大学などと「明人文集聯合目錄及篇目索引資料庫」*14を共同プロジェクトで構築、地方誌の地図など重要な挿図を含む古籍2,375部を 国家図書館、故宮博物院との共同プロジェクトで電子化している。以後、清版明人詩文集42部393冊のほか、医学、考古、金石に関する主題の善本を電子化する予定である*15

データは「中研院史語所傅斯年圖書館數位典藏系統」*16に収録されている。全文データベースは未公開だが、目録データベースは一般に公開されている。

電子化の作業は、A3サイズまでの資料は館内で電子化を行っているが、それ以上の大きさの資料は事前に研修を行ったうえで外部委託に出しているという。資料の破損などの大きな問題はまだ発生していない。

5. 档案資料

(1)国立故宮博物院図書文献館

故宮は所蔵する清代の档案資料約400,000件のうち、「軍機處檔摺件」190,000件の電子化の作業を1997年に開始した*17。NDAP*18開始後も同資料の電子化を継続し、2003年には「宮中檔奏摺」約158,000件が電子化の対象に加わる*19。訪問時の2005年末には「軍機處檔摺件」の電子化はほぼ終了していた。全文データは「清代宮中檔奏摺及軍機處檔摺件全文影像資料庫」*20に収録されている。館外には有料で提供されているが、サービスの対象は台湾の機関に限っている。海外では目録データベース「清代宮中檔奏摺及軍機處檔摺」*21のみが利用できる。

(2)國史館

国史館の電子化計画では 「國民政府檔案」、「蒋中正檔案」、「資源委員會檔案」、「臺灣省政府地政處檔案」、「蔣經國總統文物」を電子化の対象としている。「國民政府檔案」、「蔣中正總統文物」、「資源委員會檔案」はすでに電子化が終了し、現在は「臺灣省政府地政處檔案」、「蔣經國總統文物」の電子化に取り組んでいる*22

その成果は校正が済み次第順次「國史館數位典藏資料庫查詢系統」*23に掲載される。「國民政府檔案」、「蒋中正(蒋介石)檔案」、「資源委員會檔案」はすでに目録が公開されている。本文データの利用は館内に限定されているが、一部のデータは一般に公開されている。

電子化にあたって中央研究院計算中心に技術的な支援を受け、外部委託により館内で行っている。

(3)国立台湾大学図書館

清代の淡水廳﹑台北府及び新竹縣の行政と司法档案である「淡新檔案」などを電子化している*24

「淡新檔案」はテキストデータ化と画像データ化を同時に進めており、画像データ化はすでに終了している。テキストデータとメタデータの作成は2006年に終了する予定である。全文データの利用は大学構内に限定している。

画像データ化は外部委託により館内で行っている。テキストデータの作成は資料のコピーを渡して入力を業者に委託している。

6. おわりに

ホームページにより計画の存在と規模はある程度知ることができるものの、本文データなどのコンテンツは非公開の機関が多く、進捗状況や成果を日本で把握することは難しかった。今回の調査で、一部ではあるが、その状況をこの目で確かめることができた。数万、数十万ページの善本や檔案などの電子化に取り組むその規模の大きさもさることながら、1点1点の資料の扱いにどの機関も非常に神経を使っていたのが印象的であった。電子化する資料は作業に入る前に必ず1ページずつ点検し、破損などの問題があるがある場合は裏打ちなどの補修を行っている。電子化計画は資料の点検・整備も兼ねているともいえる。

最後に、訪問を承諾し案内をしていただいたすべての機関と関係者に心から感謝申し上げる。

*4 江綉瑛, 繆永承「圖書館事業發展三年計劃執行成果報告」『國家圖書館館訊』2005(2)

*7 著作権者がその著作を公開伝送する権利を専有する権利

*8 許諾をとっていない文献のデータも館内限定で提供している。資料保存のために電子化したものを館内で提供するならば法的に問題はないという判断による。

*10 國家圖書館善本古籍典藏數位化子計畫:

http://readopac.ncl.edu.tw/ndap/rar/ndap-rar-int-00.htm外部サイトへのリンク

*12 故宮善本古籍數位典藏子計畫:

http://www.npm.gov.tw/dl/05/index05.htm外部サイトへのリンク

*15 珍藏歷史文物數位典藏計畫史語所傅斯年圖書館藏善本圖籍:http://lib.ihp.sinica.edu.tw/c/rare/DAP/index.htm外部サイトへのリンク

*17 馮明珠「『軍機處檔--月摺包數位化典藏』與『清代臺灣史料彙編』--國立故宮博物院目前進行的兩項檔案整理與出版工作」『近代中國』139号 2000.10 p68-73

*18故宮清代檔案數位典藏子計畫: http://www.npm.gov.tw/dl/04/index04.htm外部サイトへのリンク

*19 許宜如「『清代宮中檔奏摺及軍機處檔摺件』資料庫檢索與應用」http://www2.ndap.org.tw/newsletter/news/read_news.php?nid=1114外部サイトへのリンク

*22 國史館數位典藏計畫: http://dftt.drnh.gov.tw/外部サイトへのリンク

*24 臺灣大學圖書館典藏數位化計劃:

http://www.lib.ntu.edu.tw/General/digital_program.htm外部サイトへのリンク

(注1-3, 5, 8-16, 18-24 のlast access:2006.5.10)

  • 国立国会図書館
  • 国立国会図書館オンライン
  • 国立国会図書館サーチ
  • 国立国会図書館デジタルコレクション
  • ひなぎく
  • レファレンス協同データベース
  • 本の万華鏡
  • 参考書誌研究