ファイル管理1…ファイル名
ファイル管理の最初はファイル名の付け方でしょう。
書籍の場合、どういう考え方でファイルを構成していくかで、ファイル名の付け方が変わってきます。
先ずはディレクトリを巧く使うことですが、ディレクトリを削除して
1つのディレクトリにファイルをまとめた場合にも、
同名ファイルが生じないようにしておく必要があります。

《マズイ例》
−home−data1−book.htm
     └data2−book.htm
 ←同名はダメ

ディレクトリというのは仮想的なもので、各ファイルのヘッド部分に
その情報が記述されているのですが、これが何らかの原因で消えることもあるからです。

HDDがクラッシュした場合など、ファイル内容自体は壊れていなくても、
ヘッダー情報が消えてしまう事は良くあることですし、ファイルをディレクトリ移動した場合など、
同名ファイルがあると上書きしてしまい、元ファイルが消えてしまうことになります。
(注)実際にはヘッダー情報だけが消されているので、直後なら回復可能です。
上書きと云っても、同じディスク領域に書き込むのではなく、空き領域に書き込んで、
元のファイルのヘッダー情報を読めなくするだけです。
但し、この場合、その後は空き領域としてOSは認識するので、同じエリアに他データーの書き込みをすると
回復は出来ません。
この辺りは技術的な話になるので深入りはしませんが、直後なら回復可能である事だけは知っておいてください。
慌てる必要はないと云うことです。マズッタ時にはそのまま何もせず、年季の入った人に任せるのが一番良い。
回復作業は結構面倒なので、晩飯奮発するぐらいは必要です。
(と云うことにしておこう、ホントは簡単だが)(^○^)

さて、日本語ベースでファイルを作る場合、ネット上のファイル名に日本語を使うことが出来ません。
ローマ字読みのアルファベットで記述している場合がほとんどだと思いますが、
ここで一工夫しておくと、管理がしやすくなります。
それは、五十音を数字に割り振って、ファイルの頭に付けておくのです。
あ行 …1 は行 …6
か行 …2 ま行 …7
さ行 …3 や行 …8
た行 …4 ら行わ行 …9
な行 …5

例えば、著者名で夏目漱石と森鴎外であれば、
natume.htm と mori.htmでは、どうしてもm→nの順になるので、
五十音の並びにはならないのですが、これを、5natume.htm と 7mori.htm としておけば
五十音の並びになる訳です。

無論、もっと細かく、「あ」「い」「う」「え」「お」を順に「01」「02」「03」「04」「05」と全て区分することを
考える人もいるでしょうが、実際やってみると、これはかなり煩わしいものになります。
「過ぎたるは及ばざるが如し」ということですね。

後に触れますが、コンピューター上ではファイルの分割や結合が簡単にできますから、
頭から壮大な計画を立てて、ファイルを細かく分類しておく必要はないのです。
必要に応じて、分割や結合をしていけば良いのです。

目録データーがホンの僅かしかない小さなファイルを多数作ったり、
膨大なデーターを一つのファイルにしたままで放置したりするのは、この点で考えものです。
利用者にとっては、前者は煩わしく、後者は処理速度が遅いと云うことになるのです。

ExcelやAccessのHTMLファイル標準出力でデーターファイルを作る場合、
1ファイルのデーター件数は100件が目安でしょう。
100件を越えると、重くなりますから、半分に分割していく必要があります。
これはセル単位で書式指定しているためです。
この書式指定を切り落とした場合でも、200件程度が限度です。
(切り落とし方は、別機会に触れます)
逆に、この程度のサイズになるまではファイル分割する必要はないのです。
これもファイル管理上のノウハウです。

CSVファイルでは、ベタで400件と云ったところでしょう。
無論これらは、項目設定の如何によりますが、
ファイルサイズで云えば100Kbが上限で、このサイズ以下にしておかないとネット上では重いのです。
かく云う私自身100Kb越えるファイルを時折upすることもありますが、
150Kb越えることは決してありません。(無いはず、無いだろう、自信はない・・・・

ファイル名については、既に記しましたが、ロングファイル名が使えるWindows上でも、
8文字+3文字で付ける方が良いのです。
これはDOSに降りる必要があった場合、見分けが付かなくなるからです。
ロングファイル名を使うと、最初の6文字はそのまま表示されますが、その後の文字列は
DOS上では、~1 の様に、略号化されてしまいます。
試しに、「スタート」→「プログラム」→「DOSプロンプト」と進んでDOS窓を開き、
dir/w あるいは、dir/p とタイプしてみて下さい。
DOSに降りたときのファイル名がどう表現されるか見ることが出来ます。
《閑話休題》
パソコン教室はポツリンポツリンと進めているので、もっと早くしろと云われそうですが、
多忙故ご容赦願います。
余り早く進めて、理解されないまま先に行っても仕方ないですしね。
読まれなければ、尚記す気が失せますしね。(-_-;)

《閑話休題2》
まだ余り読まれていない様ですので追記。
各サイトのファイル名見てると解ります。(^^ゞ

あとファイル名で使うべきではない文字というのがあります。
全角文字は勿論ダメです。
機種依存文字も勿論ダメです。
予約語(特殊記号)もダメです・・・・「?」「*」「&」「!」「.」「,」「/」「~」「#」「$」「%」「:」「;」「@」「+」等

これらは、勿論ディレクトリ名(フォルダー名)で使うのもダメです。

ファイル名を簡単にすると、解りにくいと思われる方にヒント。
Excel用・・・・・・Rba新着.xls
作業用CSV・・・・・Rba新着.csv
Web用HTML・・・・・Rba.htm
Web用CSV ・・・・・Rba.csv

つまりWeb用ファイルに漢字は使えませんが、パソコン内部で作業する際のファイル名は
漢字を使っても良いわけですから、上の例のように、しておくと、対照が取れて解りやすい訳です。

(注意)
「*」や「/」あるいは「+」がいけないのに「−」は良いのかと思われる方が居るでしょう。
勿論これも使わない方が良いのです。
私は結構「-」を使って居ますが、「_」を使う方が良い。
四則演算記号が問題になるのは、プログラムなどで、ファイル呼び出しする場合等です。
引数オプションで「-」がある場合ですね。
で、そういう場合には、「-」を使わない別ファイルを作っています。
そんな面倒なのに、何で「-」を使うんだ?と云われそうですが、癖・習慣としか云いようがない。(~_~;)
悪い癖は治せよ・・・・いえタバコも止めないし・・・(-_-;)
ただ、「_」使った場合、ファイルリンクなどで下線が付く場合に、見えにくいからです。
まあ、どういう場面で問題になるかが解っているので、ご容赦。
解らない人は、使わない方が良いです・・・・・・モゴモゴ。

さて、実際に、検索用ファイルを作る際、出来る限り各サイトのファイル名に準じるようにしていますが、
上記の基準に当てはめて、マズイファイル名の場合は、ファイル自体作らなかったり、
変更もしくは、該当頁リンクを貼らなかったりしていますから、お解り頂けるのではないかと思います。
WindowsOSと、サーバーで用いられるLinux或いはUnixOSは、文字やファイルの使い方が異なります。
Windowsでは漢字のファイル名やディレクトリー名は使えますが、
Unixでは漢字は原則として使えません。
漢字というのは日本国内だけの環境にすぎず、インターネットは世界を繋ぐものだからです。
海外から来られる方が漢字のファイル名やディレクトリー名に遭遇すると、これはもうどうしようもない事になるわけです。
半角カタカナがダメというのも同じ理由です。

Windowsではファイル名やディレクトリー名でアルファベットの大文字小文字の区別はしていません。
(エクスプロラーなどで見ると、一見区別しているように見えますが、実際にはOS内部では同じものとして扱っています)
UNIXでは、これをきちんと区別しています。
文字入力時に大文字小文字を使い分けてファイル名を付けると、UNIXでは入力通りに区別しますが、
Windowsでは、適当に判断してファイル名にします。
この為、ファイルへのリンクエラーが生じたりしますから、注意が必要です。
FTP画面で後から見ても判別できません。
日本語入力システムの設定によっては、勝手に表示を大文字に変換する場合もあります。
良く解らない人は、大文字は一切使わず、全て小文字で記す様にした方が良いと思います。

the古書