このページの本文へ

--我流コンピューティングのススメ

【連載コラム 山木大志のマイペースのパソコン散歩道 】第13回 タグとコンピューター

2000年08月07日 17時09分更新

文● Text by 山木大志

  • この記事をはてなブックマークに追加
  • 本文印刷

“タグ”という言葉をご存じだろうか? 平たく言えば、「以下のデータは、こういう意味だよ」ということを、分からせるための看板のようなものだ。データ(文章)にタグを付けるという考え方は、私たちが普段文章などのコンテンツを作成するときに役立つ考え方が含まれている。

衣服に付いているタグと機能は同じ

“タグ”という言葉は、衣服のタグ、たとえばシャツなら襟元に付いているものと基本的に同じ性質のものだ。衣服のタグには、使っている繊維や洗い方などが書かれている。「このシャツは木綿でできています。洗い方は洗濯機でも、ドライでも構いません」という意味のことが表示されているわけである。

タグの役割も基本的には同じである。たとえば、文字列に対して付けられたタグには「これは見出しだよ。文字の大きさはこれこれだよ」という意味づけがされている。コンピューター上のタグが衣服のタグと異なるのは、一般のアプリケーションデータのタグは、普通では見えない形になっていることだろう。

むろん、タグの仕様を公開すれば、それに合わせたアプリケーションを作成し、オリジナルアプリケーションと同様にデータを閲覧できる仕組みができる。より進んで、タグそのものを汎用性のある形にすれば、多くのアプリケーションでそのデータを活用できる。こうしたタグの代表は、HTMLタグだろう。HTMLはWebブラウザーならもちろん、多くのメールソフトやワープロソフトで読み込みが可能になってきている。

タグによってデータを制御することのメリットはたくさんあるが、ここでは次の点に着眼してみたい。それは、他の種類のタグであっても、対応するタグがあれば容易に置き換えることが可能なことである。つまり、きちんとした法則に従ってタグを付ければ、それが私的に作られたものであっても、他の用途に容易に流用できるようになる。

タグ付きテキストで自動レイアウト

たとえば、レポート文などにタイトル、小見出しなどと行頭に書いておく、あるいは文章中で使わない記号類を付けておく。さらにタグの意味を本文よりも先に一覧で書いておく。書き終えたら、テキストエディターなどで一括してレイアウトソフトのタグに置き換えるのである。これをレイアウトソフトに読み込ませると、自動的にレイアウトが完成する。

生のテキストデータをレイアウトソフトに読み込み、“<タイトル>”、“<小見出し>”、本文と個別に書式を指定するよりもはるかに簡便である。これによって、文書体裁を整えるための時間を大幅に節約できる。複雑なものならタグ付きテキストをテンプレートとして蓄積しておき、他の人も利用できるようにしておけば、文書作成は一層効率化する。

レイアウトソフトAdobe PageMakerには専用のPageMakerタグがある。これはHTMLよりもはるかに複雑なもので、一般の方にはかなり難しい
しかし、左図のように“見出し1”、“見出し2”などの日本語タグも利用できる
日本語タグを利用する場合は、“スタイル”パレットで定義された書式名が適用され、ユーザーが自由に設定できる
これを利用するには、「ファイル」メニュー→「割り付け」-「オプション」-「タグ読み込み」を選択する
スタイルパレットの書式名を読み込んだ結果が左図

こんなことは一般の文書作成では必要がないと考える方が多いだろう。一般の方が文章を書くときは、ワープロなどで書きながら書式を整えるのが一般的だ。その場合は確かに不要だ。問題は“書きつつ書式を整える”という作業方法にある。このやり方は一見効率的に見えて、実は非常に効率の悪い方法なのである。

書きながら書式を整えていると、誤字脱字を修正したり、表現不足を補ったり、重複する部分を削除したりする。そのつど、レイアウトが変わってしまうので、1行だけのページができたり、見出しがページの下端にかかったりして、レイアウトの調整が必要になる。写真、図版を挿入することも多いから、その場合には、再びレイアウトの調整が必要になる。書いているよりも、体裁を整える方に時間がかかっているのである。より大きな問題は、内容と体裁が別のものとして意識されないことにある。

内容と体裁を別々に考え、作業することの意味とは?

内容と体裁を分離して考え、作業を行なうことは、単に作業時間の短縮だけが目的ではない。文章、コンテンツを構造的に捉えることの第一歩であることだ。それによって、より重要な課題にも応えることになるのである。“構造化”というと難しそうだが、要は文章相互の関係、全体の仕組みを明らかにすることだ。

今、企業はIT革命を旗印に大規模な情報システムへ投資を行なっている。しかし、そのベースとなるべき企業内文書には、情報システムに載せ、情報共有や意思決定の迅速化に役立つものがどれほどあるのだろう?

文書管理システムに関係するセミナーで、ある講師の方が「企業の文書のうち、XML(※1)化して意味があるものは2割もない」と語っていた。これは文章が構造化しておらず、XML化しても文書データベース中で位置づけが不可能だから、という説明だった。

この話は、メーカーに関してだったから、その他の企業ではもっと少ないだろう。メーカーにはマニュアル、仕様書などがたくさんあるので、構造化が容易だろうと一般的には考えられているが、実はどうもそうでもないようである。

※1 XML:eXtensible Markup Language。構造化言語SGML(Standard Markup Language)の記述を簡略化したサブセット

構造化文書作成への課題

構造化されていない文書、コンテンツであっても、HTMLに変換することは容易だ。これはすでに多くの企業で実行され、企業のWebサイトに掲げられている。しかし、より情報を活用するためには、構造化が不可欠であり、SGML、XMLへの集約が必要になる。残念ながら、それが現状では多くの文書をカバーできず、この方面でのシステム構築は、試みは多いもののあまり進んでいないのが実状だ。

HTMLの制作でさえ、印刷物と並行処理の場合、スタートだけが一緒で後のプロセスはバラバラに進んでいる。これは、オリジナルコンテンツが整理されていないからである。SGML、XMLでの制作となると、文章そのものの再構築が必要となるために、非常な困難を抱えることになる。理想をいえば、SGML、XMLでオリジナルデータを管理し、そこから必要に応じて、HTML、PDF、印刷と必要なフォーマット、メディアへ変換していくことが望まれる。しかし、そこまでには多くの課題が横たわっている。

SGML、XMLでは、コンテンツと構造、スタイルがそれぞれ別の要素として定義されているからである。「そんな文書構造は欧米のもので、日本語は違う」ということは簡単だが、それでは情報革新には対応できない。欧米の文書作法をそのまま日本語に取り入れることはできないにしても、最初の文書作りからその考え方だけでも借用すべきだろう。

SGML/XMLの仕組み。SGML、XMLは、内容、構造、体裁が別々に定義されている。これを利用して、構造ごとに内容を再構築したり、同じ内容でも体裁を様々な形で見せることが可能になっている

そのための1つの方法として、私的なタグ付き文書作成をお勧めしたい。“概要(サムネール)”、“見出し”、“注釈”、“引用”などのタグを行ごと、ブロックごとに付けておけば、後でレイアウトするときにも、データベースに組み込むときでも、それほど手間をかけずに使い回していける。最も卑近な例では、同じテキストデータをレイアウトソフトに渡すことも、HTMLにすることも瞬時に可能になる。要は、文書その他のコンテンツは、異なる要素で成り立っており、分解できることを知ることである。

上記のような大がかりな用途を想定しないときでも、他人に見せるため文章、コンテンツであれば、他人が理解しやすい形の申し送りは常に必要である。コンテンツはコンテンツのみでは機能しない。他人が見るための、あるいは次の作業に渡すためのインターフェースが必要なのである。そのために、タグという考え方は大いに役に立つものだと私は考えている。

2000年8月1日

山木大志(やまき・ひろし) かつてコピーライタ―(化石語!)、今はただの(?)ライター。DTP、デジタルパブリッシングの技術的展開やその実務利用のレポートなどが主分野。4月10日に『Adobe Acrobat4.0 PDFテクニカルブック』(技術評論社)を出版。得意技、ネコのナンパ。宴会が苦手。愛妻家(^^;)

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン