2012/10/20

文系のための「メタデータ」

何か、調べごとがあって図書館に行ったり、インターネットで本を検索する際に、
我々は、未知の情報をどのような方法で探し出すのだろうか?
ふむ。少々、哲学的な質問かもしれないが、今回の話はこれが重要。

例えば、欲しい情報を「」からを探したい時に、
数億冊の本の文章と図の全てに目を通して、欲しい情報を探すことはしない。
いや、そのような事をする人は、実際にいるのであるが、ごく少数であろう。

目的が定まっている場合には、ある程度、情報を絞り込むことができる。
本の場合であれば、著者から探したり、発行年タイトルといった情報を使うだろうし、
実際に、図書館の目録や、Web検索の結果などは「必要最低限な情報」しか表示しない。

過多な情報は、情報へのアクセス性を著しく低減させる。

どいう意味か?全ての情報が何の整理も無く出てくると常人は混乱する
いや、実は人だけでなくて、コンピュータも大混乱に陥ってしまう
中身を見なくても、何となく、中身が解るような情報が必要なのである。

情報を抽象化した情報」と言うのか、
情報のための情報」と言うのか、
情報についての情報」と言うのか...

まぁ、実際のところ、どのような言い方でも良いのだけれど、
一応、一般的には、「メタデータ」あるいは「メタ情報」と呼ばれているので、
本ブログにおいても、これらの用語を使うことにする。

ちなみに、「メタ」というのは、ギリシアの前置詞に由来する言葉で、
〜の後」、「〜を超えて」、「隣接した」、「自身の」といった意味があり、
要するに、他の事柄を、高次に抽象化するという意味がある。

「中身を見なくても、中身を想像するための情報」メタデータである、
ということが理解できていて、それが色々と便利であることが解ればそれで良い。
では、メタデータは、実際には、どのように役立つのか?

さて、エクセルのデータでも、無意味にも見えるワードの書類でも、
コンピュータ上のデータを確認してみると、作成や編集日時などが書いてある。
それだけでは無い。データの種類によって様々な情報が付与されている

音楽ファイルの場合には、曲名歌手名再生時間CDのジャケット写真など、
本来は、音の情報しか入っていないハズであるが、それ以外の情報が入っている。
再生しなくても中身が解るのは非常に便利である。普通はそう思うハズ。

写真に関しては、撮影した日時カメラの名前型番画像のサイズ
最近では、撮影した際の地球上位置情報や、絞りフラッシュスピード
シャッタースピードといった情報が入っている。他にも色々。

実は、こうしたのメタデータというのは、人にとって有り難いだけでなく、
コンピュータにとっても色々と有り難いことがあって、
そのおかげで、我々は、様々な利益を享受することができるのである。

例えば、ファイルをコピーする際に、新しいファイルで上書きする時。
メタデータが付与されていれば、どちらが新しいかを簡単に知ることができる。
どちらが新しいのか、中身を見ても自動判定は難しい

音楽CDの場合には、ちゃんと元のCDには、CDのトラックセッション情報
メタデータとして入っていて、これを元にインターネット上データベースから、
先に述べたように、音の情報に加えて詳細な付加情報を取得できるのである。

写真の場合だと、メタデータから自動的に位置情報を抽出して、
写真を撮影した場所を地図上にプロットすることができるし、
撮影日時撮影機材ごとにフォルダを作って分類することもできる。

このように、元のデータを作成する際に、
メタデータがきちんと関連付けされていると、
後に、多くの手間が省けるのである。

確かに、メタデータがきちんと整理されていると、
後のデータ整理が大幅に簡略されるのであるが、
当然、メタデータ自動的に記録できる機材が必要である。

あるいは、そうした機材が無い場合には、データ取得者の負担にはなるが、
それでも、後の編集作業やデータを共有のためには、メタデータの事を理解し、
より正確なメタデータの取得を心がける必要がある

また、ファイルを編集するとメタデータが書き換えられることもあるので、
可能な限り最初に取得したデータは無闇に編集しない方が良い
特に、写真や動画を後処理で編集する際には、メタデータの扱いに注意する必要がある。

その重要性は、フィールドワークを中心に活動する研究者ほど理解するべきである。

さて、メタデータの重要性を理解した上で、
次回からは、様々なデータごとに、メタデータを詳しく見ていくことにする。
また、そのメタデータを用いたデータ整理を実践していくことにする。

0 件のコメント:

コメントを投稿