『地球上で一番難しい言語・日本語(表意文字と表音文字混合)2』
『混乱続くマイナンバー関連の施策評価は 技術的・客観的に!』
『表意文字漢字と、表音文字平仮名+片仮名+ローマ字は構造問題』
マイナンバーカードみほん
ウエブ情報から引用
先日(2023/08/21)日経新聞 経済教室蘭の記事の抜粋・引用です。
『混乱続くマイナンバー、施策評価 技術的・客観的に』そのポイントは、
- 誤登録は人為的ミスに加え構造的問題も
- マイナンバーの利用範囲拡大が不信招く
- 個人情報保護委員会の体制強化が不可欠
マイナンバーカードだけでなく、マイナンバー関連の報道が続いている。
本稿では情報学の研究者立場から、マイナンバーに関わる問題の背景を考えたい。 今回の問題の多くは、個人に関する情報に別人のマイナンバーを紐付けたという、誤登録だ。 この情報が医療登録の場合、重大な医療事故となり得るため、件数に関わらず軽視すべきではない。 また誤登録は人為的ミスとして扱われるが構造的問題としてみるべきだ。
健康保険組合などでの別人のマイナンバーを、紐付けた問題は、組合員本人でなく、地方公共団体情報システム機構にマイナンバーを照会していた場合に起きている。 この照会では対象個人の基本4情報(氏名・生年月日・性別・住所)になっていたが、住所の転居に加え『1丁目2番地』『1-2』『1の2』などの表記の揺れが多いため、住所そのもの、又はその一部を外し、氏名・生年月日・性別が同じとなる人が複数になることがある。』とありました。
誤登録は同姓同名の者同士だけではない。 氏名表記に用いられる漢字は多様性が高い一方で、極めて類似した場合も多い。』、とありました。
漢字のこと『渡辺・渡邉・渡邊等々と11種類』、なんと『斎藤、斉藤、齋藤、齊藤、齊藤、齋籐、齊籐、斎籐、薺藤、斉籐、薺籐、齎藤、齊籘、齏藤、霽藤等々と60種類』。 実際、戸籍で使われている渡辺の「べ」は11種類の文字がある。 なんと斉藤の「サイ」に至っては、60文字もある。 それに対して、コンピュータで規格化されているのは。 渡辺の「べ」が3文字、斎藤の「サイ」が15文字しかない。 文字情報基盤整備事業(IPA)が扱っているMJ文字集合の約6万字がISO規格として定められた。 この中には、戸籍統一文字の約5万6千字と住基統一文字の約2万1千字を含んでいるから、戸籍に登録されているあらゆる渡辺さんや斎藤さんの文字入力が可能になるという。
どんなにIT化が進もうと。『必ず、初度にあるステップ「人が機械に入力」するときに照合判断が必要』になります。
ここで余談ですが、
中国語の漢字の数は、常用字部分で約2,500字とされています。 現代漢語常用字表には3,500字が収録されていますが、そのうち2,000字で出版物の98%、3,000字で99%をカバーしていると言われています。 使用頻度で見ると、最常用漢字は560字、常用漢字807字、準常用漢字は1033字の合計2400字だそうです。 以上が漢字の国、中国で常用される表意文字です。 これに数万字の漢字対して、表音文字・ピンイン(拼音)・発音記号の25文字のラテン文字で表現ができます。
中国では、国民の身分証(「居民身份証」)をICチップ導入型の「第2代身分証」にほとんど移行させている。 この新型の身分証を使えば、銀行などでは識別機とコンピュータの連結で、データの読み込みが正しくできる。 その場合は、もはやキーボードを使って人名、地名の稀な字を打ち込む必要はないと。
現在,日本人の『氏』に使える漢字は5万5271字(戸籍統一文字),日本人の『名』に使える漢字は2998字(常用漢字+人名用漢字)が定められています。
表題『地球上で一番難しい言語・日本語(表意文字と表音文字混合)2』『混乱続くマイナンバー関連の施策評価は 技術的・客観的に』に戻ります。
『担当者が読み取る際に漢字の誤識別が起きる。 その場合、間違った氏名でマイナンバーの照会がなされ、その間違った氏名や生年月日などが一致するもののマイナンバーが登録されてしまう。 誤登録は人を介さない場合でも起きる。 氏名登記に使われる漢字には標準的な情報システムで扱えないものも多い。 自治体や健康保険組合などは、そうした漢字を外字、つまり組織単位で独自に文字を作成表記してきた。 ただし外字の字体やコードは組織ごとに異なるため、マイナンバーの照会がそのまま送信できない。
マイナンバーに対する不信感の高まる要因として、マイナンバーの利用範囲の拡大がある。 当初はマイナンバーを利用できる事務を厳格に規制していたが、23年6月に成立した改正ナンバー法では、社会保障、税、災害対策の3分野の事務に準ずる事務であれば広く利用できるようにした。 マイナンバーによる情報連携についても省令により広げられるようになった。
個人に関わる情報の多様な統合が可能になり、利便性も期待できるが、同時に個人が想定しないような情報の統合・利用が起きる可能性も高まる。 マイナンバーの民間開放にも似も懸念がある。 マイナンバーが他人に知られても実害がないとされるが、それは利用範囲が限定されてきたからであり、利用範囲が広がれば実害の可能性が高まる。
米国の社会保障番号は、社会保障だけでなく就職から不動産購入まで幅広く利用された結果、権利利益の侵害につながった。 マイナンバーの民間開放には慎重な判断が必要。
政府はマイナンバーのメリットとして、
⓵行政の効率化
②国民の利便性の向上
③公平・公正な社会の実現、の三つ挙げていた。
③は、所得を正確に把握ができ、公平・公正な社会保障制度が実現できるとあり、当初は消費税の逆進性を緩和するためによるマイナンバーによる給付付き税額控除を想定していたとされる。 消費税の軽減税率の導入により給付付き税額控除への関心が薄らい立ち言えるが、同時にマイナンバーのメリットも見えにくくなった。
今後行政がデジタル技術への依存度を高めるのであれば、技術的観点から政府の施策の妥当性を評価すべきだ。 現行の政策評価法や行政事業レビューは技術面からできておらず、マイナンバーを含めデジタル関連施策の技術的妥当性を第三者の立場から評価する仕組みを検討をする必要がある。』
とありましたが、
漢字文化圏内でも中国語と日本語以外は漢字表記をほとんど廃止されていますが、なお約15億人が漢字(表意文字)使用し、約50億人が使うラテン文字(表音文字)についで、世界で2番目に使用者数が多い文字体系です。
IT後進国・縦割り行政組織の中で、カタカナ語・カタカナ英語が大氾濫している現状に加え『表意文字の漢字(数万字~数十万字)と、表音文字の平仮名+片仮名+ローマ字』に、どう対応してゆくか難しい局面にあると思っていますが、半世紀前よりはIT技術面、デジタル技術面の環境は良くなっていますので関係者には『難しい日本語に対応した「マイナンバーの仕組みつくり」』に頑張っていただきたいと切望おります。
(記事投稿日:2023/08/26、#683)