表計算ソフトのエクセルは前から使っていたが、今まではもっぱら計算に関係ない表形式の文書を作るのに使うだけだった。
最近、初めてデータ整理のため本格的にエクセルlを使用して、データをソートしてみたが、
ソートキーに日本語文字列を使用した場合、同じ文字列を持つデータの行が離れてしまう現象が発生した。
しばらく悩んでいたが、インターネットを検索してみると、「教えて!goo」 などで原因と対策があり解決した。
(1)エクセルで日本語文字列を入力するとき、IMEなどによる日本語入力時の、かな漢字変換で使用した仮名データがふりがなデータとして残り、
これが変換して得られた漢字データ(表示されるデータ)と共にエクセルの列データとして保存される。
ソートは表示されないふりがなデータの値により行なわれる。
(2)ワードのファイルやインターネットなどからエクセルにコピーした漢字データは当然ふりがなデータを伴っていない(空値)。
従って同じ漢字データを持つデータでもふりがながあるとない(空値)では全く別の値とみなされるので、
日本語入力によるデータと他からコピーしたデータを同じファイルに混在させてソートした場合、同じ値のデータでも行が離れていまう。
(3)この現象を回避して、ふりがなの有無にかかわらず同じ漢字データの列を隣接させるには、
ソート時に「ふりがなを使用しない」のオプションを指定すればよい。
エクセルを使い慣れた人には知られていることなのだろうが、1つ勉強になった。
しかし、日本語入力時の(表示されない)かなデータを保存し
これを元にソートするとはとても良い仕様とは思われない。
最近、初めてデータ整理のため本格的にエクセルlを使用して、データをソートしてみたが、
ソートキーに日本語文字列を使用した場合、同じ文字列を持つデータの行が離れてしまう現象が発生した。
しばらく悩んでいたが、インターネットを検索してみると、「教えて!goo」 などで原因と対策があり解決した。
(1)エクセルで日本語文字列を入力するとき、IMEなどによる日本語入力時の、かな漢字変換で使用した仮名データがふりがなデータとして残り、
これが変換して得られた漢字データ(表示されるデータ)と共にエクセルの列データとして保存される。
ソートは表示されないふりがなデータの値により行なわれる。
(2)ワードのファイルやインターネットなどからエクセルにコピーした漢字データは当然ふりがなデータを伴っていない(空値)。
従って同じ漢字データを持つデータでもふりがながあるとない(空値)では全く別の値とみなされるので、
日本語入力によるデータと他からコピーしたデータを同じファイルに混在させてソートした場合、同じ値のデータでも行が離れていまう。
(3)この現象を回避して、ふりがなの有無にかかわらず同じ漢字データの列を隣接させるには、
ソート時に「ふりがなを使用しない」のオプションを指定すればよい。
エクセルを使い慣れた人には知られていることなのだろうが、1つ勉強になった。
しかし、日本語入力時の(表示されない)かなデータを保存し
これを元にソートするとはとても良い仕様とは思われない。