このページの本文へ

前へ 1 2 3 4 次へ

WWW完全制覇 第4回

進化するWebページの中身はどうなっている?

HTMLからXMLへ!Webを彩るコンテンツを知ろう

2009年05月26日 08時00分更新

文● 遠藤哲、中塚寛幸、ネットワークマガジン編集部

  • この記事をはてなブックマークに追加
  • 本文印刷

インターネット上でのショッピングやブログの更新、映像の視聴など、現在では多種多様なコンテンツを見られるようになった。このパートではWebの「中身」であるコンテンツの仕組みについて見ていこう。

HTMLとブラウザ

 WebブラウザとWebサーバの仕組みを使ってやり取りされる情報がコンテンツだ。まずブラウザでコンテンツを表示する仕組みから見てみよう。WebページはHTML(HyperText Markup Language)という、文書構造を記述するためのマークアップ言語で作られている。HTMLは1997年1月にW3C(WWW Consortium)にて初めて標準化された。

 HTMLには見出しや文字の大きさといった文書の見栄えを定義する、「タグ」と呼ばれる情報が数多く規定されている。記述方法は、これらのタグで表現したい範囲の文書を挟むという形式である。このタグは色情報を指定するcolorや文字サイズを指定するsizeなどの「属性」情報と組み合わせて記述する。ほかにも、hrefという「リンク」先を指定するものがある。

 一方、ブラウザには、大きく「通信」「HTML解析」「画像描画」の3つの機能がある。入力されたURLに従ってWebサーバへアクセスしてHTML文書や画像ファイルなどを取得。そのHTML文書の文書構文を解析、そして埋め込まれたタグ情報に従ってブラウザの画面上に描画する。HTML文書中に画像などが張り込まれている場合は、そのファイルを読み出して文書の一部として表示する。

 また、ブラウザには「プラグイン」と呼ばれるブラウザの機能を拡張する仕組みがある。ブラウザのHTML解析において「<embed>」というタグを認識すると、そこに記述されているファイルをダウンロードし、そのファイルの拡張子を判断して該当するプラグイン機能で処理をするというものだ。以上のようなブラウザの機能によって、Webページの多彩な表現が実現できているのである。

(次ページ、「HTMLからXMLへ」に続く)


 

前へ 1 2 3 4 次へ

カテゴリートップへ

この連載の記事