ひでんかの”雅でない”日々

庶民の"ひでんか"の日々はちっとも雅じゃないけれど、いろんな人達と楽しい毎日を過ごしています

名寄せ作業

2010-07-15 23:12:00 | ひでんかの「日々の徒然」

今、作業中の「データ整理」
AとB、2つのリストの内容を1つにまとめる作業です。

キーになるのが、ある「名前」(人名ではありませんが固有名詞ではあります)
2つのリストの「名前」で結びつけていくのですが、これが、なかなかの大仕事。
まずは機械的にマッチングして、そこで出たエラーを1つ1つ目で見て確認しながら、結びつけていきます。

「○○岡」と「○○岡」...同じものなのに、機械的にはじかれてしまいますので、これを1つにして更に
「ヶとケは、どちらが正しい表記でしょう?」とコメントをつけます。
これに、片方のデータが
「○○ヶ丘」と「○○ケ丘」(入力ミスというモノです)
更に更に「○○岡」まで参戦してくると、もうタイヘン!!

1つ1つ調べながら、時々、
「ま、いいか」
になってしまうことも...。
(あ、決して「テキトー」にやっているわけではなく、「100%の確定」ではなく90%くらいでOKにしてしまうという程度デス...やっぱりマズイ?)

これこそが、いつぞや大騒ぎになった
「消えた年金」の「名寄せ作業」ですね。

自分で入力したデータなら、間違っていても素直に反省(?)もできますが、
他人様の入力したデータ同士をつき合わせるというのは、結構ストレスが溜まります。

特に片方は「お役所」が作成したモノで、元は各都道府県の関係部署が作ったものです。
そうすると、”-”(ハイフン)と”ー”(長音記号)の区別がつかない(?)某自治体。
「学力テストで順位が低いのも納得できちゃうなぁ」とか、ついつい独り言。

「万件」まではいかない量なので、まだまだたいしたことはありませんけれど、
とにかく早く終わらせたい!!

(そういえば、最近はちっとも話題に上らなくなってしまいましたが
「年金」の方の「名寄せ」はどうなったのでしょう?)

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする