リレーショナルデーターベース2
《データーベース》
データベースと云うとき、これを少し整理して考えておく必要があります。
古書の場合、
「出版社」「書名」「著者」と云う項目は、どこのサイトが扱うにしても変わらないものです。
一方、売価は、それぞれの古書店で異なります。
今は、これらを一体のものとして各店でデーター作成されているわけです。

出版社 書名 著者 売価
講談社 火の鳥-1- 手塚治虫 \500
講談社 火の鳥-2- 手塚治虫 \500

と云った具合です。
これを、変わらないものと変わるものに分けて2つのデーターファイルを作成するとします。

ファイル1
出版社 書名 著者 ID
講談社 火の鳥-1- 手塚治虫 1
講談社 火の鳥-2- 手塚治虫 2

ファイル2
ID 売価
1 \500
2 \500

2つのファイルのデーターを関連づける為に、ID番号をそれぞれに付けておきます。
この時、変わらない方のファイル1を「ホストデータ」と呼び、
変わる方のファイル2を「ローカルデータ」と呼びます。

データーベースというのは本来、ここで云う「ホストデータ」の事です。
「the古書」の検索ページに先日リンクしておきましたが、
日本の書籍で、今最も巨大なデーターベースは、国立国会図書館のものです。
しかしこのデーターベースは、個別の検索は出来ますが全体は公開されていません。
無論、商用利用も認めていません。
ISBNコードに基づくデータベースもISSNに基づくデーターベースも同じ状況です。

《古書データーベース》
さて、いよいよ本題に入りましょう。

ホストデーターが出来上がっていて、誰でも自由にそのデーターを引き出せるようにしてあれば、
各店の古書目録の作成はかなり楽な作業になります。
上の例で云えば、idと売価の入力だけで済むようになるからです。

ホストデーターの容量として、現在の「the古書」のサイト容量ではとても足りませんから、
いずれ、別サイト作りに取り組みますが、その際一番必要なのは上記のホストデーターです。
ホストデータのidとしては、ISBNコードを使います。
図書館協議会の十進分類コードは、データーベースが公開されていませんから、残念ながら使うことが出来ません。

CSVファイルであれば、データー構造はプログラム処理で変換できます。
書籍分類には、Cコードを使います。

現在各店で作成されている目録の項目に、上記コードを追加しておいて頂くと、共通のデーターベース化が早く進むわけです。