最近、Excel方眼紙が血祭りに上げられている
日経ウーマンが美文書「Excel方眼紙」特集、古傷を刺激された皆さんの叫び声が響きわたる
http://matome.naver.jp/odai/2136948486965928001
が、正直、どうしてExcel方眼紙が血祭りになるのか・・・正直、よくわからない。
データの再利用という観点から言うと、
Wordの表で書かれるよりも、
方眼紙でかまわないからExcelで書いてくれたほうが、再利用しやすい。
なぜなら、普通、データを抜くときは、マクロを書いて抜く。
そのため、Excelだと、たとえ方眼紙でも、たとえどんなに升目が多くても、
セル位置内に文字があれば、
RangeやCellsで位置取得し、テキストを取ってこれる。
そうすれば、後はテキトーにつなげて、CSVにすれば、
ExcelでもRでもWekaでも、MySqlに入れるにしても、なんでもできる。
ところが、Wordやパワポでかかれると、このデータを抜きにくい。
(Wordのマクロはあるけど、該当する部分のデータを指し示しにくい)
テキストでも、構文解析しなきゃいけなくなると、
Excel方眼紙よりも大変。
ほんと、Excelなら、方眼紙でも何でもありがたい!っていうかんじ。
そのために仕様書はExcelで書かれる。
仕様書からデータを抜いてプログラム自動生成しやすくするために。
実際に、Excelからデータ抜いて、プログラムを自動生成している人
とかでないと、XMLのほうがいいんじゃないか?と思うかもしれないが、
XMLは、大変なのだ・・・
XMLのDomの場合、getElementsByTagNameで、タグ名で値をとってくることになる。
このElementsってなっていることろが、面倒なのだ。
NodeListで入ってきてしまう。
なので、1つの値をとってくるのに、一呼吸はいる感じになる。
Excelマクロのように、のりのりに書けないのだ。
ちょっと怖いのは、最近、みんながExcelで書いてくれて、
やっとデータ分析、ビッグデータ解析とかの前処理が
ちょっと楽して自動化できそうになったのに、
文書はWordで書け!
TeXで書け!
とか、理由わからんこといって、
前処理の仕事を増やすことだけはやめてくれ。
批判する人は、こうやって、データぶっこ抜くと、
Excel方眼紙よりぶっこ抜き易いという方法論と
ともに、批判をして欲しい。
PS.
「Excel方眼紙を利用したBigData処理」っていう
シリーズ、面白そうだね(^^)v
日経ウーマンが美文書「Excel方眼紙」特集、古傷を刺激された皆さんの叫び声が響きわたる
http://matome.naver.jp/odai/2136948486965928001
が、正直、どうしてExcel方眼紙が血祭りになるのか・・・正直、よくわからない。
データの再利用という観点から言うと、
Wordの表で書かれるよりも、
方眼紙でかまわないからExcelで書いてくれたほうが、再利用しやすい。
なぜなら、普通、データを抜くときは、マクロを書いて抜く。
そのため、Excelだと、たとえ方眼紙でも、たとえどんなに升目が多くても、
セル位置内に文字があれば、
RangeやCellsで位置取得し、テキストを取ってこれる。
そうすれば、後はテキトーにつなげて、CSVにすれば、
ExcelでもRでもWekaでも、MySqlに入れるにしても、なんでもできる。
ところが、Wordやパワポでかかれると、このデータを抜きにくい。
(Wordのマクロはあるけど、該当する部分のデータを指し示しにくい)
テキストでも、構文解析しなきゃいけなくなると、
Excel方眼紙よりも大変。
ほんと、Excelなら、方眼紙でも何でもありがたい!っていうかんじ。
そのために仕様書はExcelで書かれる。
仕様書からデータを抜いてプログラム自動生成しやすくするために。
実際に、Excelからデータ抜いて、プログラムを自動生成している人
とかでないと、XMLのほうがいいんじゃないか?と思うかもしれないが、
XMLは、大変なのだ・・・
XMLのDomの場合、getElementsByTagNameで、タグ名で値をとってくることになる。
このElementsってなっていることろが、面倒なのだ。
NodeListで入ってきてしまう。
なので、1つの値をとってくるのに、一呼吸はいる感じになる。
Excelマクロのように、のりのりに書けないのだ。
ちょっと怖いのは、最近、みんながExcelで書いてくれて、
やっとデータ分析、ビッグデータ解析とかの前処理が
ちょっと楽して自動化できそうになったのに、
文書はWordで書け!
TeXで書け!
とか、理由わからんこといって、
前処理の仕事を増やすことだけはやめてくれ。
批判する人は、こうやって、データぶっこ抜くと、
Excel方眼紙よりぶっこ抜き易いという方法論と
ともに、批判をして欲しい。
PS.
「Excel方眼紙を利用したBigData処理」っていう
シリーズ、面白そうだね(^^)v