今、作業中の「データ整理」
AとB、2つのリストの内容を1つにまとめる作業です。
キーになるのが、ある「名前」(人名ではありませんが固有名詞ではあります)
2つのリストの「名前」で結びつけていくのですが、これが、なかなかの大仕事。
まずは機械的にマッチングして、そこで出たエラーを1つ1つ目で見て確認しながら、結びつけていきます。
「○○ヶ岡」と「○○ケ岡」...同じものなのに、機械的にはじかれてしまいますので、これを1つにして更に
「ヶとケは、どちらが正しい表記でしょう?」とコメントをつけます。
これに、片方のデータが
「○○ヶ丘」と「○○ケ丘」(入力ミスというモノです)
更に更に「○○が岡」まで参戦してくると、もうタイヘン!!
1つ1つ調べながら、時々、
「ま、いいか」
になってしまうことも...。
(あ、決して「テキトー」にやっているわけではなく、「100%の確定」ではなく90%くらいでOKにしてしまうという程度デス...やっぱりマズイ?)
これこそが、いつぞや大騒ぎになった
「消えた年金」の「名寄せ作業」ですね。
自分で入力したデータなら、間違っていても素直に反省(?)もできますが、
他人様の入力したデータ同士をつき合わせるというのは、結構ストレスが溜まります。
特に片方は「お役所」が作成したモノで、元は各都道府県の関係部署が作ったものです。
そうすると、”-”(ハイフン)と”ー”(長音記号)の区別がつかない(?)某自治体。
「学力テストで順位が低いのも納得できちゃうなぁ」とか、ついつい独り言。
「万件」まではいかない量なので、まだまだたいしたことはありませんけれど、
とにかく早く終わらせたい!!
(そういえば、最近はちっとも話題に上らなくなってしまいましたが
「年金」の方の「名寄せ」はどうなったのでしょう?)