2010年9月11日土曜日

D・O・I! D・O・I!

引用の記述形式について網羅的にまとめておきたいといろいろ調べているうちに、
ふとDOI(Digital Object Identifier/ディジタルオブジェクト識別子)に目が行った。

考えてみれば他人の論文の冒頭で触れられているのを見る程度で
大雑把にしか知らないし、
これを機にと思いDOI.orgを見ながら少し自分で調べてみたわけです。

ざっと気になった所だけ読んだ限りでは、
システムに組み込むとかでなければ、
内田 尚子. “ディジタル・オブジェクト識別子(DOI)”. 情報管理. Vol. 42, No. 1, (1999), 32-46 .を読むだけで満足できる、という結論に達しました。

なんという徒労… この目の疲れからくる悔しさをどこにぶつければ…
規格だから当たり前かもしれないが
10年前からそんなに変わってないじゃないか…


ということで、その悔しさはこのブログにぶつけることにしました。
同字異義語の多さ(他に人名等の固有名詞もある)と表記ゆれのバリエーションが豊富だし、
書いておいたらちょっとくらいいいことあるかとも思って。

僕は英語があまり得意ではなく、このあたりのことも教わったことがないから
うっかりすると間違ってるかもしれないんですが…、
まぁ、間違ってたら間違ってたで、そのときはしょうがなかったということで。
てへ☆(可愛くごまかすことをねらう成人男性の図。)


まずDOIとは何かという話から。

DOIというのは、簡単に言うと「電子的なコンテンツの識別記号」です。
IETF RFC 2396に規定されるURI(Universal Resource Identifier)、
URN(Uniform Resource Name)の一種という位置づけです。


ちょっと違うけど、書籍についてるISBNと似たようなもの。

ISBNは1タイトルの書籍に対して1つのISBNをつけているけど、
DOIは1つの「オブジェクト」に対して1つのDOI nameをつけるために使います。

「オブジェクト」というと抽象的なのですが、
DOI® System Demonstrationsによると、
例えば、雑誌の1論文(Journal Article), 本の1章(Book Chapter),
モノグラフ1冊(Monograph), 地図1枚, 動画1本(※グロ注意)など
様々なものに対してDOI nameをつけています。 

さらに上記の内田氏の記事(doi:10.1241/johokanri.42.32)によると
1.雑誌自体に対してつける(ISSNと同じレベル)
2.その中の1号分に対してつける
3.その中の1論文分に対してつける
4.その中の抄録という一区切りに対してつける
というように様々なレベルに対してつけられることも書かれています。

事典の各項目に対しても記号をつけることができるってんだから驚きです。
どうもDOIというと「1論文」という単位で
番号をつけているイメージだけど、実はそうでもないと。

いやー、面白いくらいにつけ放題だね。(ただしdigitalに限る。)


あと主なメリットとして「リンク切れに強い」とよく言われています。

オブジェクト、というかリソースの管理・識別にはURLを使う場合もあります。
理由は「一意」だから。
一意というのは、同姓同名がいなくてきちんと各々を識別できる、ということ。

でもURLはあくまでUniform Resource 「Locator」であり、
「所在」を示すものなので、
リソースが移転したりすると、リンクが無効になって困ったりするわけです。

そこで、特定のリソースを呼び出すとき、管理するときなどは
リソースにつけた「名前(例えばDOI name)」を使うことにして、
インターネット上のどこかで「名前」と「所在」の対応づけをさせることにする。

そうすると、
リソースを使う人は常に「名前」を使い、
自動で「名前」から「所在」を割り出す係にあとのことを任せ、
「所在」へのアクセスを導いてもらう形にできる。

「名前」と「所在」を正確に対応させる係がしっかり仕事をしていれば、
「名前」を使う人たちは
「所在」が移ろうが行動に変化はなく、困ることはない。


…。

あまり上手に説明できてないな…。
うーむ…。ま、しょうがないか。
授業のときまでにはもう少し勉強して黒板に図を書きながらやろう。


ちなみにDOIはIDF(the International DOI Foundation)によって管理されている。

registrant(登録者)が、IDFやその委託を受けているRegistration Agencies(RA)に登録をすることで、自社のコンテンツにDOI name がつけられるようになるようです。

少なくともFAQの3を見る限りでは、
RAの顧客になるか、RAになるか、
DOI財団の一般会員になってお値段お安めのトライアルで制限付きの権利を得るか
いずれかによって登録者になれるということらしい。


あとDOI name の構成はこんな感じ。


記述するときはANSI/NISO Z39.84-2000のルールに従います。
全体の長さに関して、技術的な制限はない模様。

中心の"/"より前(左側)をPrefix、後(右側)をSuffixとよびます。
全部まとめてDOI nameです。

PrefixにはDOIのルールに基づくことを示す記号や
登録者をあらわす数字が書かれます。
桁数の制限については書いてなかったけど、
大きな組織のときは「1000.10」のようにsub-prefixを作ることもあるらしい。

Suffixは登録者(主に出版社)が自由に英数字を使って、
登録者所有のオブジェクトを識別する部分。
ISBNをはじめとした様々な規格に則って記述することもできる。
FAQなどを読む限り、DOI systemでは他の規格(たとえばISBN)を
使ったからといって困ったりはしない様子。


___

授業で使う気はあんまりないけど
もう少し上手に説明できるようになっておきたい…。


ここから先は疑問に思ったこと。暇を持て余したら調べる。

日本の学協会誌・機関がどのくらい登録しているか統計をとった報告書等を見たい。
他の識別子も含めて、動向が知りたい。

勝手にPrefixを作ってdoiぽく見せて使用したらどうなるんだろう?
怒られるんだろうか。
裏でURLの対応づけをしてくれないのは確かだから悪意しか感じないけど。

規格団体はどこも手堅くお金が入る流れができあがってそうだけど
収支はどうなっているんだろう?下世話な意味で気になる。

0 件のコメント:

コメントを投稿