誤った確率論


迎撃ミサイルの撃墜率

確率計算

迎撃ミサイルの撃墜確率が50%なので、それを二段構えに配備すれば確率は100%になる、と聞いて驚いた話は、別のところで触れた。正解は75%である。たとえば4発のミサイルが飛んできたとしよう。すると一段目の迎撃でそのうち2発が撃墜され、2発はすり抜けてしまう。二段目では、そのうち一発が打ち落とされ、残る一発は標的に当たってしまうだろう。確率50%というのはそういうことである。

第一、もし二段構えで確率100%なら、三段、四段と重ねれば、確率は100%を超えることになる。計算が正しいなら、そんな答えは出て来ない。確率は最高100%であり、それを上回ることはないのだ。

他の分布

受注する仕事量には、繁閑がつきものだ。忙しいときは次から次に注文が来るし、暇なときには問い合わせもないことがある。ある日は忙しかったので「景気が良いのか?」と思い、暇になると「不景気なのか?」と疑う。ところが、世間の景気動向にあまり変動がなければ、月単位で見ると、ほぼ平均的な受注量だった、という経験は誰にもあるだろう。

そこで、たいていの職場では、「もっと平均的に仕事ができんのか」などということが叫ばれる。経営者から見れば、忙しいときには残業代まで出し、暇なときには遊ばせているのだから、もったいないと思う。だが実はそういうことは不可能だ。

これは、平均受注間隔の捉え方が誤っているからである。平均受注間隔とは、トータルの時間を受注件数で割った値である。1日8時間営業して、月20日とすれば、160時間だ。月平均80件の受注があれば、平均受注間隔は2時間である。

ここに160cmのひもがあり、それをランダムな長さに、80本に切り分けたとすると、その断片の長さの総平均は、当然2cmである。では、この断片を長さごとにより分け、どの長さの断片が最も多いかを考えてみよう。

われわれは、つい「2cmの断片が最も多く、それより短いものも長いものも少ないはずだ」と考えてしまう。普通の平均値はそうなっている(中心地の周りに、ほぼ正規分布する)ことが多いからだ。しかし、この場合は違う。

たとえば、ある断片が非常に長く、80cmもあったとしよう(上記の例では、10日間も受注が全く来なかったことになる)。すると、残りの79本が元のひもの80cm分の中にあることになる。その平均の長さは、およそ1cm(受注間隔が1時間程度)だ。その中にまた30cmの断片があったなら、残りの78本が50cm中にあり、もう長さは1cmを切っている。こうして、よく見れば長さの短い断片(繁忙期)が非常にたくさんあり、長いもの(閑散期)は少ないのが当然だ。

それが実情なのだが、よく理解されていない。実は、仕事には繁閑があるのが当然で、それを単純に平均するのが間違っているのだ。

では、経営者が気にする閑散期の戦力もてあまし状態はどうするのか?私の案は、暇なときには他の仕事も覚える、情報を収集したり、新しい問題に取り組んでスキルアップを図る。仕事に問題点を見つけて、解決を図る。特に重要なことは、繁忙期の仕事の処理遅れを反省したり、改善するような手立てを考えることである。もう一つは、たいていの職場では、ある人は忙しいが、他の人は暇そうにしているということが起こる。人の仕事は分からないから、誰かが超多忙でも、他の人は手伝おうとしない。しかし、暇なとき、少しずつ他人の担当している内容も憶えるとか、横の連絡を緊密にして、互いの状況をよく把握するとか、方法はある。

個人の処理能力はどれぐらいあればいいのか?よく「一時間で片付く仕事なら、一日8時間で8件できる」などと言う人がいるが、これも実は暴論である。繁閑の存在をきれいさっぱり忘れているからだ。この問題は『待ち行列の理論』として、すでに解決されている。

受注の舞い込む間隔を平均してTa、一つあたりの平均的な処理時間をTsとすると、

未処理の仕事の件数=(Ts/Ta)/(1−Ts/Ta)

平均待ち時間(Tw)=(Ts/Ta)/(1−Ts/Ta)*Ts

仮にある散髪屋に行ったとき、その店には客が平均して1時間に一人やってきて、一人あたり平均48分で仕事が終わるものとすると、Ts/Taは0.8だ。上記の公式に当てはめて、待っている客は平均して4人いる。したがって、平均待ち時間は3時間と12分になる。あなたが家に帰れるのは4時間後である。とても待ちきれないだろう。処理時間が30分とすれば、Ts/Taは0.5になり、待っている客は1人である。30分後にはあなたの番が来て、1時間後には家に帰れる。

仮に1人の客に1時間かけているなら、待っている客は無限大になる。すなわち、いつまで奮闘しても終わらない。まあ、そういう店には客が来ないようになり、次第にTaが大きくなるので、ある平衡点で収まることになるだろうが。

結局、平均的な受注間隔より、はるかに短い時間で処理しなければ、合理的な処理時間には到達しない。平均的受注間隔と同じ処理時間では、多忙なときには仕事を溜め込んでしまう。それがやっと片付く頃には、また新しい受注を抱え込み、普通なら暇になる閑散期も働きづめに働くことで、やっと追いつく。経営陣からは「いつも忙しい、忙しいと言ってるが、最近受注が来てないじゃないか」と言われることにもなる。まずく行けば、顧客が離れてしまう。いつも同じように忙しければ、本当の繁閑がよく分からなくなってしまい、顧客の動向もつかめなくなるかも知れない。

仕事の繁閑に関してはほとんど理解されていないので、誤解されているのもやむを得ないが、経営者にはぜひ分かってもらいたいものだ。会社経営に携わるほとんどの人は、作業時間を積み上げて仕事量が割り出せると考える。前記の例で言うと、Ts/Taが0.5程度になるのが合理的だが、逆に1に近い方が理想だと思い込むのである。そのため、一つの作業に必要な時間が受注間隔より短ければ「社員を遊ばせている」というので、その空き時間には余計な仕事までさせようと思うようになる。その結果、労働が過重になっても、経営者から見ると計算は合っているはずなので、なぜ抵抗に遭うのか分からない。それになぜ残業が増えるのか分からない。

統計というものは、こうした錯覚を起こしやすい。カイ二乗分布だか何だか知らないが、現実には正規分布とは異なるのに、平均値を出すと、すべてのデータがその平均値の左右に均等に分散する(正規分布の形になる)と思い込んでしまうのである。

相関する量

よくある誤った確率論は、相関する量を気付かずに独立した変数に見立ててしまうことである。

あるとき、警察が「暗い色の服を着て夜道を歩くと、自動車事故に遭いやすい」という統計結果を発表した。夜道で自動車にはねられた人の服装を調べると、ほとんどが暗い色の服を着ていた、という。確かに暗い夜道で暗い色の服を着ていたら見にくいだろうから、誰でも納得する話なのである。

ところが、統計学者がこの発表に噛みついた。「日本人サラリーマンの大半は暗い色の服を着ている。その道を歩いた人の何パーセントが暗い色の服を着ていて、何パーセントが明るい色の服を着ていたのか、それぞれの事故に遭う確率を求めなければ意味がない」

つまり、暗い色の服を着て歩けば、そのうちx%が事故に遭い、明るい色の服を着ていればそのうちy%が事故に遭うとすれば、そのxとyに「有意差」があるときに限って、上記の警察発表にも意味があることになる。

警察も指摘を受けてデータを見直したらしく、結局その発表は撤回されてしまった。事実を言えば、少々暗い色の服を着ていても、動いている人の姿は運転者から見えるようで、別に事故に遭いやすいというデータは得られなかったらしい。

高齢ドライバーについても、警察発表は納得できない。「高齢ドライバーが増えている」、「現実に高齢ドライバーの事故が増えている」と発表されているが、私には同じことを言っているようにしか聞こえない。「高齢者は若年者より事故を起こす確率が高い」というデータはどこにもない。「高齢者は動作が鈍いから、事故を起こす確率が高いだろう」という予想(先入観)の元に数字を並べているだけのようだ。

むしろ、私の聞いているところでは、高齢者は経験も豊富で、慎重な運転をする傾向があり、事故は少ないという説がある。女性ドライバーが判断ミスを犯しやすく、危ない運転をするというのは、事実のようだ。私も、女性がとっさの場合に正しい判断とは逆の選択をしやすい傾向があると思っている。だが女性の場合、どちらかと言えば軽微な接触事故にとどまることが多いようだ。

何にしても「数字はウソをつかない」式の考え方は危険である。自分の求めるデータ(自分の出したい結論に合ったデータ)などは、探せば見つかるものである。そこに疑いを持つ、ということこそ科学の(つまり検証の)出発点だろう。


とっぷ   科学のくずかご
inserted by FC2 system