検索対象ファイルの作り方 | ||||||||||||
「the古書」で用いている検索対象ファイルの作り方を記します。 自分で作成できる方は、以下の方法で作成して、添付メールとしてお送り下さい。 出来れば圧縮ファイルでお送りいただくと助かります。 mail=book@classic.interq.or.jp この場合のメール返信は、必要な場合を除き、遠慮させていただきますのでご了承願います。 データーのupは早急に行いますから、検索頁の方でご確認下さい。(時として深夜にまとめてと云う場合もあります) | ||||||||||||
☆ジャンル ファイルは、ジャンル分けに従って下さい。 現在、次のように分けています。 ★ c…漫画 ★ b…文庫 ★ z…雑誌 ★ n…自然科学系 ★ o…一般書 この分け方はデーターの量に応じて、検索速度を見ながら細分化していきますので、 時折確認して下さい。 | ||||||||||||
☆ファイル名 各サイトには登録順に登録番号を付けています。 古書店仲間という頁のフォルダー記号の最初の数字です。 緑風舎は01、書肆アモルフさんは08、の様になります。 漫画の場合を例にしますと、 緑風舎の場合、01c-○○○○.htm 書肆アモルフさんの場合、08c-○○○○.htm の様に、数字の後にジャンルの種別を表す記号(漫画はc、文庫はb)を付けて下さい。 この場合漫画ですから「c」を付けます。 ○○○○の部分は任意です。 | ||||||||||||
☆ファイルの仕様 検索ファイルを開いてもらうと解りますが、 ◎タイトルは必須です。 ◎URLとメールアドレスを必ず入れて下さい。 緑風舎の漫画小のファイルを参考にすると、最初の部分のソースは次のようになります。 赤文字の部分は、各サイトで適時書き換えて下さい。
データーは、一行に1データーとなるようにします。 テーブルを使うかどうかは任意です。(テーブルを使う方が更新管理は楽です) CSVファイルをそのまま貼り付けるか、 txtファイルをそのまま貼り付けるかして下さい。<BR>を忘れないように。 テーブルを用いた場合のソースは次のようになります。
これだけです。simpleで簡単ですね。 試しに作成してお送り下さい。 各サイト別に既に作成しているファイルを見ていただくと参考になると思います。 こちらでチェックを必ず入れますから、少々ミスがあっても修正しますし、即日up出来ます。 | ||||||||||||
☆ファイルサイズ ファイルの大きさは、1ファイル当たり、50Kb以下を基準にして下さい。 上記の作り方だと、おおよそ1ファイルに500点のデーターが入ると思います。 項目を減らせばその分、データー点数を増やすことが出来ます。 50Kbを越すと表示が重くなります。 データー項目で最低必要なのは、次の項目です。 書名、著者、出版社、売価。 (項目数を、これだけに減らすと、1ファイルで1000点程度のデーターが入ります。) 検索ファイルはあくまで各サイトへの案内用ですから、不要な項目は出来るだけ減らすようにして下さい。 詳細は、各サイトに飛んでいき見てもらうわけです。 項目を減らす方法は、EXCELを用います。 シートの一番上の行の大文字アルファベットで記してある列名(Aなど)にマウスを当て、 左クリックすると列全体が反転しますから、そのまま右クリックして、「削除」を選択します。 | ||||||||||||
◎ 複数のCSVファイルを1つのファイルにまとめる方法 これも簡単に出来ます。 手っ取り早いのは、ワープロソフトを使うことです。 最初に1つCSVファイルを読み込んでおき、その下に追加読み込みしていきます。 Wordであれば、「挿入」→「ファイル」で、CSVファイルを選択します。 一太郎であれば、「編集」→「ファイルから貼り付け」で、CSVファイルを選択します。 ファイルを保存する際は、どちらの場合も、拡張子がCSVであることを確認した上で、別ファイル名に変えて保存します。 editorなどでも似たような機能は勿論あります。 秀丸であれば、「ファイル」→「カーソル位置に読み込み」等です。 Excelファイルのままでこれを行うことも勿論出来ます。 簡単なのは行毎マウスコピーしてしまう方法です。 あと、ODBCの追加インストールして、クエリー処理でリンク作成すると云う方法もありますが、まあ面倒です。 これをExcelで行うぐらいなら、Access使う方が便利です。 もっと簡単なのは、dosのバッチ処理です。A+B=Cのような、コマンド操作することですが、今時流行りませんね。(^^ゞ まあ、色々試して見て下さい。CSVファイルの自由度の高さがお解り頂けると思います。 | ||||||||||||
《おまけ》 ◎ 文字コードの指定は、JISなどでも構いません。 JISだとメタタグ指定部分で <META http-equiv="Content-Type" content="text/html; charset=iso-2022-jp"> の様になります。 文字化けを避けるために、このメタタグ指定は必ず書き入れておいてください。 検索プログラム側で、コード変換を行う際、autocheckでは、文字化けする可能性が高くなります。 ◎ CSVファイルの貼りつけは、HPBであれば次のようにして簡単に行うことが出来ます。 最初に、一行一列の表を作っておきます。その表の中にカーソルをいれて、次の操作をします。 1.HPB3.0の場合 ファイル→ファイルの挿入→(csvファイルを選択)→改行位置を保持 2. HPB2000以降の場合 挿入→ファイル→(csvファイルを選択)→改行位置を保持 txtファイルの場合も同じです。 更新の際は、一行追加し、最初にデーターを読み込んでいた行を削除します。 そして残った行に対して、上記のファイル挿入操作を行います。 ◎ CSVファイルをHTMLファイルに貼り付ける他、エディターでCSVファイルを読み込み、 その上側と下側に、HTMLタグを記述し、別ファイル名を付けて保存する方法でも作る事が出来ます。 「日本の古本屋」用のtxtファイルやその他、源×やEasySeek等のデーターファイル等の場合も、これと同じ方法で作成できます。 データー部分の最初と最後に、必要なタグ部分(上記の水色部分)を追記して、htmという拡張子で保存するだけです。 (項目名の行がデーターにない場合には書き入れて下さい) ◎ プレーンテキストでデーターが作られている場合、 タグがある場合にはファイルのタグを一旦全て削除します。 その上で改めて、上記のHTMLタグの記述を上側と下側に書き入れて下さい。(水色の背景色部分) 1データーが、一行に記述されていない場合でも構いません。検索可能です。 タグを削除するには、ワープロソフトでHTMLファイルを読み込み、txt形式で保存します、これでタグは削除されます。 又、シェアウェアのEdit HTML等を使うと、タグの切り落としが出来ます。 EditHTMLは、http://member.nifty.ne.jp/hirotomo/ からdownすることが出来ます。 ◎ HTMLファイルで、直接テーブル作成をしてデーターを打ち込んでいる場合 一旦、EXCELでそのHTMLファイルを読み込み、そのままCSVファイルとして出力します。 そのCSVファイルをEXCELでもう一度読み込み、不要行の削除などを行い整形します。 そして再度CSVファイルとして保存します。 後は、上記の作業を行って下さい。 (この様なステップを踏むのは、HTMLタグの削除や、データーとしての不整を解消するためです。) ◎ Accessを使われている場合、 Accessの場合CSV出力ファイルには標準仕様では、txtという拡張子がつきます。実際の中身はCSVデーターですから これはこのままCSVファイルとして使えます。上記の方法で検索ファイルを作成して下さい。 ◎ 解らないことがあれば、何なりと遠慮なくお尋ね下さい。 メールでもQ&Aコーナーでもどちらでも構いません。 | ||||||||||||
《閑話休題》 ここで作成したファイルは、CSVファイルをベースにして、最も簡単な形でHTMLファイルとして使えるようにしたものです。 半年くらい前でしたか、「あしび文庫」さんの掲示板で、「CSVからの変換は簡単に出来ますよ」等と記したことがあり、 あの時は、説明しませんでしたが、これでお解り頂けるでしょう。(もしご覧になっていれば) ここで作成したファイルはHTMLファイルですから、リンクさえ貼っておけば亜樹さんのサーチにも掛かります。 これ迄みてきた中で、検索対象に出来ない目録は基本的にありません。 スペース区切りやTAB区切りデータなども、置換処理で全てCSV変換できます。 しかし、登録サイト数が増えてくると、その様な変換作業を一人でやっていくのは、大変時間が掛かりますし、 自店の目録作成が放置状態になってしまいます。 実際「the古書」は緑風舎の売上げ収益だけで維持していますから、自店目録が進まないとストレスが溜まります。(~_~;) 作業プロセスは、更新チェックし、downロードし、配置し、解析し、CSV変換し、再合成し、HTML変換し、upする。 という作業で、結構面倒です。一番時間の掛かるのは更新チェックとdownロードですね。 ここに記したような作業を各店で行っていただければ、各店のデーター仕様のクセや問題点などにも気づいて貰えるのではないかと思います。 現在の「the古書」の検索プログラムは、かなり自由度の高いものにしてあり、それは、各店データー仕様の多様性に対応する為なのですが、 その分機能的には個人的に不満も多々あります。 古書店間のデーター仕様がある程度仕様統一できれば、利用者にとってより一層使いやすい検索システムを構築する事も出来る訳ですから、 目録作成の際、その様なことも配慮していただくと幸いです。 | ||||||||||||
《追記》 当初記してから、随分時間が経ちました。 その後色々便利なソフトもありますから紹介しておきます。 A.Flexible Renamer http://hp.vector.co.jp/authors/VA014830/FlexRena/ 複数ファイルの拡張子を一括変換する。 B.AddBR http://members.at.infoseek.co.jp/oriheus/soft/index.htm 拡張子.txtの複数ファイルをHTMLファイルに一括変換する。 C.TextSS http://www.vector.co.jp/soft/win95/util/se072729.html 複数のHTMLファイルを、色々書き換えるのに便利です。 で、 1、Excelで出力したcsvファイルを、Aを用いて拡張子をtxtに変換 2、txtファイルを、BでHTMLファイルに変換 3、上で作ったHTMLファイルを、Cでアレンジする。 と云う方法で、静的な目録頁は簡単に作ることが出来ます。 csvファイルから、テーブル型のhtmlファイルを作るソフトも色々あったと思いますので Vectorで探してみて下さい。 又、Excelから直接出力したhtmlファイルは無駄なタグが大量に付加されて、 サイズが異常に大きくなりますが、 HTMLDIETというソフトで、簡単に無駄タグを削除し、サイズを小さくすることが出来ます。 http://hp.vector.co.jp/authors/VA010593/download.html | ||||||||||||