ASCII.jp：Just Arks (2/5)

Just Arks

2001年11月08日 00時00分更新

文● culi

XHTML形式での保存と
従来のオフィス文書との関係


CalcArkとPrezArkのXHTML形式での保存ダイアログ。外部からリンクしている画像については、埋め込み型で保存(画像ファイルを一緒に保存)するかしないかを選択できる。

　Just Arksに共通したもうひとつの大きなセールスポイントは、「XHTML」を標準文書フォーマットにしていることだ。今やWebブラウザによる表示を考慮した「HTMLで保存」機能はオフィスソフトでは必ずサポートされているし、その際アプリ固有の書式をXML形式で保存する場合もあるが、それにしてもXHTMLでの保存を標準形式としたのはひとつの決断であろう。

　XHTML(The eXtensible HyperText Markup Language)というのは、現在のHTML 4をベースに、XMLに適合させるための改訂を行った規格だ。大ざっぱに言ってしまえば、わりとアバウトだったHTMLのタグ規則が、ちょっと厳密で理屈っぽく変更されている。一太郎Ark発売の翌月、2000年1月にW3Cの「Recommendation」(勧告)となり、2001年10月に「第2版」のドラフトが出たばかりだ。

　では、XHTMLを使うメリットは何か？　というと、以下のような点が挙げられる。

文書を保存し直すことなく、そのままWebブラウザで見ることができる。
文書ファイルはテキストで記述されているので、文書をテキストエディタなどで直接修正できる。ブラウザに依存した見た目の不都合を直すのも簡単だ(ただし編集内容次第で以後、元のアプリで文書を読めなくなることもある)。
スクリプトやXSL(XML文書のスタイルシート言語)と組み合わせて、CalcArkやPrezArkの文書ファイルを自動処理、生成できる。


PrezArkのXHTML形式のデータを一太郎Arkから「テキスト」として開いてみた。冒頭にXHTML 1.0の宣言がある。&lt;style&gt;タグでは見出し、箇条書き、本文といったレベル別に文字の位置や大きさ、フォントファミリーの指定が記述されている。

　最後の点について補足すると、オフィスソフトではデータをインポートしてマクロを使うような処理、例えばWeb上からの入力を自動的に統計データ(文書)に蓄積し、それをプレゼン文書の一部に引用として自動挿入する、といったシステムが、Just Arksでは、ブラウザを制御するのと同じスクリプトやスタイルシートベースで構築できるということだ。大きなシステムでなくても、各部門で作成された業務文書をそのままWeb上で公開する際、大量の文書に対して共通したデータ変更を一度に行うといった処理が使い慣れたスクリプトで簡単にできることは、特に企業のWebサイト管理上では労力とコスト面で大きなメリットになるだろう。


CalcArkとPrezArkのプラグイン設定。Webからダウンロードしたり、ユーザーが作成したプラグインを組み込めば、アプリそのものの機能を拡張できる。

　従来のオフィスソフトの文書の読み込みについては、代表的なものは標準でサポートされており、これまでの文書資産も活用できる。一部の文書形式については書き出しも可能だ。これらのデータコンバートは、そのほとんどが各アプリ本体とは別ファイル「プラグイン」の形で搭載されており、必要なときにだけ本体から呼び出される。

Just Arksがサポートする文書形式
共通	XHTML 1.0ファイルの読み・書きテキストファイルの読み・書き
CalcArk	Microsoft Excel 5.0／95／97／2000／2002ファイルの読み・書き CSVファイルの読み、書き (以下、後日公開予定) 三四郎8～9ファイルの読み込み Lotus1-2-3ファイルの読み込み
PrezArk	テキストファイルの構造化分析(後述)読み込み HTMLファイルの構造化分析読み込み HTML4.01ファイルの書き出し JAR形式(後述)の読み・書き Microsoft PowerPointファイルの読み込み
一太郎Ark	一太郎Ver.5～10ファイルのテキストと一部書式の抽出 Microsoft Word 6.0／95／97／98／2000およびRTFファイルのテキストと一部書式の抽出 HTML 4.0ファイルの読み・書き Zip圧縮されたテキスト、HTMLファイルの読み・書き ZipまたはGZip圧縮された一太郎8～10ファイルのテキストと一部書式の抽出 GZip圧縮されたテキストの読み・書き (以下、Webからダウンロード可能) 一太郎Ver.5～10ファイルのテキストと一部書式を抽出(標準添付のプラグインより精度が高い) 一太郎Ver.3、Ver.4ファイルのテキストと一部書式を抽出 HTML 3.2ファイルの読み・書き

　中には書式を完全には再現できないものや、テキストの抽出だけできる形式があるのは残念だ。特に多くの人が使っているMicrosoft Office系の文書については、できるだけ(本家Microsoftのコンバータ並みに)正確な読み込みを可能にしてほしい。なお、LANやインターネット上のURLを指定し、HTTPやFTPでファイルを直接各アプリに読み込むこともできる。

前へ 1 2 3 4 5 次へ

ツイートする

カテゴリートップへ