きのうのクロスメディアとかワンソースマルチユースとか、自動組版とか、そのへんをまとめてみる その2の話の応用なんだけど、ってことは、XMLは、操作しやすいからそうしているだけで、べつに論理構造がわかるんなら、XMLでなくてもいいわけですよ。
たとえば、HTMLで章をH1であらわすとか決まっていればHTMLを解析して文章構造を抽出できるし、DTPでスタイルと章とかの関係を持っていれば、スタイルも書き出すタグ書き出しでもいい。
いや、文章中に
第一章 ことのはじめ
1.1 はじめに
みたいに、章の書き出し方が決まっていれば、テキストでタグがなくても、文章構造は抽出できるわけで、ここからXMLをつくるなり、DBにいれるなりのプログラムを書けばいい。
教科書とか、法律の条文のようなもののテキストは、こういう書きかたがはっきりしているので、XMLにわざわざしなくても、テキストから、ある程度文章構造は抽出できて、その文章構造抽出プログラムを書くほうが、XMLで入力してもらったり、エディタを書いたりするより、簡単なこともある。
このへんの検討をしないで、すべてXMLっていうようにもって行くと、プログラマはいいかもしれないけど、ユーザーとか、周りの人は悲劇(喜劇?)なんだよね・・・