KMPGのニューズレター「財務会計データから不正の兆候を発見するデータ分析」
に面白い記述がありましたのでご紹介。
このレポートでは、不正リスクマネジメントの観点より不正・不祥事の発見的
コントロールにおけるデータ分析の有用性や、
不正の可能性を発見する分析方法などを紹介しております。
ご興味ある方は「通し」でご一読下さい。
で、不正の可能性を発見する分析手法の1つとして紹介されているのが
「ベンフォードの法則による仕訳分析」。
以下、自分の備忘録として、当レポートから引用・要約してみました。
(出所)http://www.kpmg.or.jp/resources/newsletter/risk/fas/200806/01.html
-----------------------------------------------------------------
■ベンフォードの法則とは何か?
・ランダムな数字の集合体から、各数字の最初の一桁を取り、
その数字が発生した回数を並べると、一定のルールが存在するという法則。
・数字の最初の一桁を発生回数で並べた場合、1の出る確率は2が出る確率より
高く、また2の出る確率は3より高い、といったように、
数字の高いものほど発生確率は低いというルールを確立。
(具体的には30%以上の数字は1から始まり、17.6%は2から始まるとのこと。)
・また、この法則は最初の一桁だけではなく、最初の二桁、三桁においても
同じ法則が成り立つことも実証。
■仕訳に使われる金額もベンフォードの法則が当てはまるのか?
・仕訳に使われる金額も、基本的にはランダムな数字の集合体と言えることから、
ベンフォードの法則に当てはまることが可能と。
↓
<実際の仕訳の数字を使っての検証例>
ベンフォード分布図:このケースでは、仕訳に使われた金額の最初の二桁を
取り、各数字の発生回数を並べている
(分布図)http://www.kpmg.or.jp/images/resources/newsletter/risk/fas/200806_03_01.gif
【横軸】仕訳に使われた金額の最初の二桁。
例えば125万円、1,230円といった場合は、最初の二桁は12になり、
5,630円、5億6千万円はともに56となる。
【縦軸】各数字が仕訳の集合体内で発生した回数。
棒グラフは各数字が発生した回数。
青い線は、ベンフォードの法則による各数字が発生しうる回数、
いわば期待値
↓
各数字の発生した回数は、概ねベンフォードの期待値と似た動きをしているが、
中には期待値を大幅に超える数字(上記グラフの場合、49、75、99、
黒い矢印のある数字)がある。
言いかえると、49、75、99で始まる数字が通常、期待されている回数より
多く発生している。
↓
ベンフォードの法則から発生する「期待値を超える数字の発生の原因」には
不正の可能性、または内部統制の不備の可能性が考えられる。
特定の数字が期待値を大きく超えて発生した場合、その内容精査の必要あり。
(以上 引用・要約終わり)
--------------------------------------------------------------------
(追加コメント)
○「ベンフォードの法則」でググってみたところ、こちらのサイトでも興味深い指摘が
ありました。
http://ara3.fc2web.com/analysis/benford.htm
注目したのはこの箇所です。
「法則の応用の1つとして、決算資料の捏造をチェックするというようなことが
行われています。 つまり決算書からすべての数字を抜き出して、
その先頭の数字を数えます。
その分布がベンフォードの法則から大きく外れているようだと、
その決算書は人間の手によって捏造されたものである確率が高くなる
というわけです。」
↓
なるほど。これは確かにトライしてみる価値がありそうですね。
チャレンジしている人は少なさそうですからね。
もうすぐXBRLで財務データが容易に入手できると聞いておりますし、
この手法による粉飾分析ってのも結構盛んになるのではないかと思った次第。
に面白い記述がありましたのでご紹介。
このレポートでは、不正リスクマネジメントの観点より不正・不祥事の発見的
コントロールにおけるデータ分析の有用性や、
不正の可能性を発見する分析方法などを紹介しております。
ご興味ある方は「通し」でご一読下さい。
で、不正の可能性を発見する分析手法の1つとして紹介されているのが
「ベンフォードの法則による仕訳分析」。
以下、自分の備忘録として、当レポートから引用・要約してみました。
(出所)http://www.kpmg.or.jp/resources/newsletter/risk/fas/200806/01.html
-----------------------------------------------------------------
■ベンフォードの法則とは何か?
・ランダムな数字の集合体から、各数字の最初の一桁を取り、
その数字が発生した回数を並べると、一定のルールが存在するという法則。
・数字の最初の一桁を発生回数で並べた場合、1の出る確率は2が出る確率より
高く、また2の出る確率は3より高い、といったように、
数字の高いものほど発生確率は低いというルールを確立。
(具体的には30%以上の数字は1から始まり、17.6%は2から始まるとのこと。)
・また、この法則は最初の一桁だけではなく、最初の二桁、三桁においても
同じ法則が成り立つことも実証。
■仕訳に使われる金額もベンフォードの法則が当てはまるのか?
・仕訳に使われる金額も、基本的にはランダムな数字の集合体と言えることから、
ベンフォードの法則に当てはまることが可能と。
↓
<実際の仕訳の数字を使っての検証例>
ベンフォード分布図:このケースでは、仕訳に使われた金額の最初の二桁を
取り、各数字の発生回数を並べている
(分布図)http://www.kpmg.or.jp/images/resources/newsletter/risk/fas/200806_03_01.gif
【横軸】仕訳に使われた金額の最初の二桁。
例えば125万円、1,230円といった場合は、最初の二桁は12になり、
5,630円、5億6千万円はともに56となる。
【縦軸】各数字が仕訳の集合体内で発生した回数。
棒グラフは各数字が発生した回数。
青い線は、ベンフォードの法則による各数字が発生しうる回数、
いわば期待値
↓
各数字の発生した回数は、概ねベンフォードの期待値と似た動きをしているが、
中には期待値を大幅に超える数字(上記グラフの場合、49、75、99、
黒い矢印のある数字)がある。
言いかえると、49、75、99で始まる数字が通常、期待されている回数より
多く発生している。
↓
ベンフォードの法則から発生する「期待値を超える数字の発生の原因」には
不正の可能性、または内部統制の不備の可能性が考えられる。
特定の数字が期待値を大きく超えて発生した場合、その内容精査の必要あり。
(以上 引用・要約終わり)
--------------------------------------------------------------------
(追加コメント)
○「ベンフォードの法則」でググってみたところ、こちらのサイトでも興味深い指摘が
ありました。
http://ara3.fc2web.com/analysis/benford.htm
注目したのはこの箇所です。
「法則の応用の1つとして、決算資料の捏造をチェックするというようなことが
行われています。 つまり決算書からすべての数字を抜き出して、
その先頭の数字を数えます。
その分布がベンフォードの法則から大きく外れているようだと、
その決算書は人間の手によって捏造されたものである確率が高くなる
というわけです。」
↓
なるほど。これは確かにトライしてみる価値がありそうですね。
チャレンジしている人は少なさそうですからね。
もうすぐXBRLで財務データが容易に入手できると聞いておりますし、
この手法による粉飾分析ってのも結構盛んになるのではないかと思った次第。