第五回 『ログデータの保存 (形式・書式)』
さてさて。前回までで取得するデータを揃えたわけですが、 今度はそれを保存しなければ、閲覧には利用出来ません。 どういう形式・フォーマット(書式)で保存するかは 各人の好みになるんですが、形式には大別して2種類あります。
まず、通常のファイルに保存する方法。 これが一番分かり易く、直接エディタで開けるので編集もしやすいです。 デメリットとしては大量のデータが有ると読み込み・保存が遅くなる点と、 データの破損が起こりやすい点。 特にアクセス解析ではデータの読み書きが頻繁になる為、 どうしてもログが飛びやすくなります。
次にデータベース(DB)に保存する方法。 最近ではこっちの方が主流になりつつあります。 データ操作がスクリプトもしくはコマンドラインに限定される為、 初心者には扱いづらいですがデータの読み込み・保存は超高速。 データの破損も起こりにくいです。
最近のサーバーでは『MySQL』や『PostgreSQL』といったDBが 標準で使える所が増えてきましたが、まだまだ使えない所も少なくないです。 なので今回はファイル形式で保存する事を前提に話を進めますね。
で、ファイルのフォーマットなんですが、区切り文字(デリミタ)に 「,」(カンマ)を使用した「.csv」(Comma Separated Values)が定石ですね。 まぁデリミタはタブ(\t)でもなんでもいいんですが、 あんまりトリッキーなデリミタにすると二次使用がしにくくなるので 無難なモノがお勧めです。