© 2007-2024, Kyu-hachi TABATA Last updated  2022/02/27

ファイル操作 (1) 概念と形式


■1.ファイルの概念


ファイルとは、ひとまとまりのデータです。ファイル名は原則、半角英数字で表記し、拡張子でファイルの種類を示します*1。 ファイルの種類には多々ありますが、大きくはテキストファイルとバイナリファイルのふたつに分けられます。

テキストファイル
  1. 文字データ(テキストデータ)のみでできたファイルです*2
  2. 拡張子は .txt が普通で、テキストエディタで開くことができます。
  3. 1バイト文字*3か ら構成されるテキストファイルな らば、100字の文章は100バイ トのファイル(文字数×1バイト)となり、ファイ ルサイズが文字量を素直に反映します。
例: 普通の文章(.txt)。
スクリプト言語のソースファイル(.js, .bas)
マークアップ言語のソースファイル(.html, .htm, .xml)

バイナリファイル
  1. 画像、音 楽、プログラム など、非文字情報のデータ(バイナリデータ)でできたファイルです。
  2. 拡張子はさまざまで、開くのに専用のソフトが必要だった り、実行ファイルそのものであったりし ます。
  3. 非圧縮画像(.bmp)ならば、1画素が1バイトになるので、画素数がファイルサイズを反 映しますが、圧縮という手法でサイズをぐっと小さくできま す。
例: ワード、パワーポイント、エクセル、PDF などのデータ (.doc, .ppt, .xls, .pdf)。
音楽データ(.mpg, mp3)、動画データ(.wmv, .avi, .mp4)。
アプリケーション、コンパイルされたプログラム、実行ファイル(.exe)。

*1 Mac には拡張子がありません。代わりにリソースフォークという隠しファイルがあって、ファイルのデータ情報を保存していま す。 
*2 ワードファイル(.doc)は文章だけでなく、修 飾情報がバイナリデータで埋め込まれているのでバイナリファイルになります。ただし、.docx 形式で保存された文章は、xml 形式になっていて、テキストファイルとして扱うことができます。
*3 文字ごとに固有の番号(文 字コード) が割り振られています。また、半角で示される英数字などは1バイトコードなので、1バイト文字ともいい、全角で 示される漢字、ひらがな、かたかな、ハングルなどは2バイトコートなので、2バイト文字ともいいます。
 


■2.ファイル名

基本は半角8文字まで。 次のようなルールがあります。
  1. Win や mac では半角も全角も使えて、半角254文字(全角127文字)まで。ただし、ネット上では、半角8文字までにおさえるのが無難です。また全角文字はネットでは ダメと思ってください。
  2. 使 えない文字があります。 /\?*:|"<>, など。# はダメな場合といい場合があります。
  3. 大文字も注意。小文字との使い分けは OS によって違うからです(下記参照)。
【Windows 】 English.txt, english.txt, ENGLISH.txt を同じファイルと認識します。
【Mac】 English.txt, english.txt, ENGLISH.txt を違うファイルと認識します。
ネットワーク・サーバーは Unix 系が普通なので、ファイル名の違いは厳密にする必要があります。
【Unix 】
【Android】


■3.拡張子

半角で3文字(4文字まで)が基 本。次のようなルールがあります。
  1. ファイルの種類を示す略号で、ファイル名の後ろにドット(.) に続いて表記されます。
  2. 書き換えは容易ですが、勝手に替えるとファイルが使えなくなることがあります。
  3. 小文字も大文字も使えますが、PCに よっては厳 密に区別されますので注意。小文字のみでの表記が無難です。
  4. エクスプローラでは、デフォルトでは見えない設定になっています。見えるようにするには、 エクスプローラの「ツー ル > フォルダオプション > 表示」で「登録されている拡張子は表示しない」のチェック を外します(くわしくはこ ちら)
  5. Mac では拡張子という仕組みがありません(かわりにリソース・フォークという隠しファイルがあります)。Finder で拡張子が表示できるようにするには、Finder の環境設定を開き、「すべてのファイル拡張子を表示」にチェックしま す。
主な拡張子は 下記のとおり。

実行ファイル  com,  exe 画像 bmp, gif, jpg, tiff, psd, ai
文書 doc, txt, html, htm, pdf  
音声 mid, mp2, mp3, wav
表計算
xls, csv 動画 wav, mpg, mov, wmv, avi  
圧縮
lzh, zip
プログラム 
bas, c, js
*青文字はテキストファイル。他は全てバイナリファイル


■4.フォルダ名

フォルダ
*1 と はいくつかのファイルをひとまとめにできる格納構造です
  1. フォルダ名は、ファイル名のルールとほぼ同じか、より厳格だと考えてください。
  2. フォルダはいくつも入れ子にできます。こうしてできる階層構造をディレクトリといいます。くわしくは「ファイル操作 (2) ディレクトリ」へ。
  3. ドライブ名、PC名も同様ですが、くわしくは「ファイル操作 (2) ディレクトリ」 へ。
*1 もともとは Apple のみで使われていた用語。Unix や Dosでは、ディレクトリと呼んでいたのですが、格納構造に加えて階層構造の意味にも使われてましたので、初心者にはわかりにくい面がありました。そこ で、格納構造をフォルダ、改造構造をディレクトリと言い分ける用法が徐々に浸透してきたように思 います。ディレクトリは次ページで詳細に 説明します。


とびら へ 前へ 次 へ
↑ トップへ