(=^・^=)の記事のご批判に「そうなの偶然だ」とゆうのが、良くあります。(=^・^=)はその反論として、偶然にそんなことが起きてしまう確率を計算して、偶然にはほとんど起きないことを主張することがあります。でも、どの記事にも偶然に起こってしまう確率の計算方法は書いていません。いれは以下に理由があります。
①すででに多くのサイト取り上げられており、いまさら(=^・^=)が書く必要がない。たとえば(1)(2)(3)
②記事にちょい書きするには、分量が多すぎる
でも、1度くらい説明する必要があつと思いますのでこの記事を書きます。
1.例題1
その昔、うさぎとカメさんが競争し、うさぎさんが1回、カメさんが7回勝ちました。うさぎさんは悔しくて仕方ありません。そこで、うさぎさんは言いました。
「本当はおれの方が強いのさ、いまのは偶然だと」
そしたら、かめさんは言いました。
「だったら、偶然に起こる確率を計算してみよう」
と言いました。計算してみてください。
2.例題1への回答―その1―
うさぎさんとカメさんの実力が、同じであると仮定し、偶然に起こる確率を計算してみます。一番、わかりやすい方法は、すべての可能性を洗い出し、その中から、うさぎさんが1勝以下になる割合を計算します。
①うさぎさんとカメさんが、8回勝負したとして、1回戦から8回戦まで、カメさんが勝つかうさぎさんがかつの2通りのパターンしかありません。しかも、どちらもおこる確率は同じです。このようなパターンは
1回戦2通りで、2回戦2通りで、二回戦までで4通りのパターンがあります。
3回戦も2通りなので、3回戦まででは8通り、
4回戦で16通り、5回戦で32通り、6回戦で64通り、7回戦で128通り、
8回戦で256通り
です。うさぎさんとカメさんの実力が同じなら、この256通りはすべて同じ確率で起きます。
②うさぎさんが1勝以下の通り数
a)全負けは1通り
b)1勝は、1回戦から8回戦戦のとれか一つで勝ので8通りです。
c)合計は9通りですね。
③うさぎさんが偶然にも1勝しかできない確率
全部で256通りあり、かつ各通りが生じる確率は同じです。そして、うさぎさんが1勝以下となるとおり数は、9通りです。だから、うさぎさんが1勝しかできない事が偶然に起こる確率は、
9÷256=0.035(3・5%)
です。
3.例題1への回答―その2(χ
2値を使う)
全体の通り数とか計算できるのは、うさぎとカメさんが合計1000試合もしてたら、計算が大変です。そこで、もう少しうまく計算する方法は無いのでしょうか?
χ
2値を使うともっと簡単に計算できます。χ
2値は、
期待値:変わらないとした起こるであろう値(8戦ですので、実力が同じならうさぎもかめも4勝です)
実測値:実際に起きた値、うさぎは1、カメは7です。
χ
2値:(実測値-期待値)
2÷期待値
a)うさぎさんは(1-4)
2÷4=2.25
b)カメさんは(7-4)
2÷4=2.25
χ
2和
全てのχ
2値の合計です。この例では、
2.25+2.25=4.5
です。
自由度:前年と今年、うさぎとカメなど2物を比べる場合は1です。
O、A,B、ABのように4つを比べるなら3です。
概ね比べるものの数ー1みたいです。
これだけの数字が分かるとExcelでは、セルに
=CHIDSIT(χ
2和、自由度)
と入れると、簡単に偶然に起こる確率を計算できます(4)。この場合、3.4%になりました。2と殆ど同じです。この計算方法は1000試合でも、同じ方法で計算できます。なお、統計の世界では偶然に起こる確率を「危険率」と呼ぶみたいです。(=^・^=)は、この計算過程を以下のような表にまとめていたりします。なお、(=^・^=)のExcel(バージョン014.0.6115.5003)では、CHIQ。DIST.RTです。
表―1 χ
2和から、偶然に起こる確率を計算した例

4.1000試合したら
①例題2 うさぎさんは2,3の計算結果に満足せず結局、1000試合しました。その結果、うさぎさん450勝、カメさん550勝しました。うさぎさんとカメさんが実力が同じとして、こようなことが偶然に起こる確率を計算してみてください。
②答え 以下の表の通りです。

5.少し複雑な問題
JA伊達みらいは、福島県伊達市および伊達郡を管轄しております(6)。そこで生産では1万6千トン程度のモモが生産されています(7)。日本のモモの生産量は約15万トンなので、10個に1個以上はJA伊達みらいさんのから出荷されています。JA伊達みらいでは、モモの放射性セシウムを以下の通り管理しています。
①7日程度前に検査用サンプル品を農家ごとに集め、検査したのち合格した農家さんのみに出荷を認め、それ以外は出荷できないようにしています。
②50ベクレル/㎏基準を超過した場合、複数サンプル提出にて再検査します。そして100ベクレル/kgが見つかれば出荷自粛を行い、さらに出荷制限の発動を行政に依頼するそうです(対象になるモモは見つかっていません)
③これまで、1963件の検査を行いその97.3%には放射性セシウムが見つかっていません(検出限界は20ベクレル/kg)です。1963件ですので、
20ベクレル未満 1,638件
20ベクレル以上 45件
になると思います。一方、国も福島県が検査したモモの検査結果を発表してます(9)。(=^・^=)の集計では
20ベクレル未満 18件
20ベクレル以上 2件
です。ともに今日(7/30)までのHP掲載分
福島県とJA伊達みらいの検査結果同じとして、このような事が偶然に起こる確率を計算してみます。この確率が極端に小さい(たとえば5%以下)なら、JA伊達みらいと福島県の検査結果が違っていることになります。
計算で難しいのは期待値です。どの数字を比較するかとゆうと
伊達みらいの実測値の
20ベクレル/kg未満
20ベクレル/kg以上
福島県の計測値の
20ベクレル/kg未満
20ベクレル/kg以上
の4つの数字を比較することになると思います。当然、4の数値の期待値を検査しなくてはなりません。
①20ベクレル未満と20ベクレル以上の割合を計算する。
同じものを検査しているのですから、JA伊達みらいも福島県も同じ検査検査結果になるはずです。検査数は大幅に違いますが割合は同じでなければなりません。そこで、20ベクレル/kg未満と20ベクレル以上の割合をJA伊達みらいと福島県の合計してして、割合を出します。
a)20ベクレル/kg未満の合計 1,656件
b)20ベクレル/kg以上の合計 47件
c)全体の合計は、 1.703件
です。ここから割合を計算すると
d)20ベクレル/kg未満の割合 0.972(1656÷1703:97.2%)
f)20ベクレル/kg以上の割合 0.028(47÷1703:2.8%)
になります。すると期待値は、
20ベクレル/kg未満では、検査総数×20ベクレル/kg未満の割合
20ベクレル/kg以上でも、検査総数×20ベクレル/kg以上の割合
で計算しますが、これが福島県、JA伊達みらいにあるので、4つの期待値が出ています。
期待値a)伊達みらい検査で20ベクレル/kg未満 1636.6件( 1,656×0.972)
期待値b)伊達みらい検査で20ベクレル/kg以上 46.4件( 1.656×0.028)
期待値c)福島県検査で20ベクレル/kg未満 19.4件( 20×0.972)
期待値d)福島県検査で20ベクレル/kg以上 0.6件( 20×0.028)
これで、計算はできます。 4つの値から χ
2の合計を計算し、Excelのワークシートに
=CHIDSIT(χ
2和、3)
といれれば偶然に起こる確率が計算できます。以上の結果を踏まえ、偶然の起こる確率の検査表ができました。

偶然に起こる確率は 約27%です。JA伊達みらいと福島県の検査結果があっている確率は27%みたいです。でも、27%の数値をとらえ、27%しかないから間違っていると結論すると、27%は誤った結論になってしまいます。
<余談>
数学が嫌いなみなさん、ややこしい話をしてすいません。なんか、お国の説明に「統計的に明確な差はない」なんてきわめて科学な説明をしているふりをすることががります。(=^・^=)の知る限り、明確な定義があります。「同じと仮定して偶然に起こる確率が5%以下」と結う意味です。もし5.1%なら当然「統計的に明確な差はない」になります。一方、偶然に起こる確率が50%以上なのに、ほんの小さな数値の違いを言い立て、数値上がっと有用なブログも見たことがあります。こうした背景をご理解いただきたくこの記事を書きました。
是非ともご質問、ご意見をお願いします。(=^・^=)はメールアドレスも(=^・^=)のHPでオープンしています。
「私のHPでーす。見てね」
のクリックで飛ぶと思います。
―参考にしたサイト様―
(1)
カイ二乗検定 - Wikipedia(2)
カイ2乗分布,カイ2乗検定(3)
3.3 カイ二乗検定(4)
CHIDIST関数の使い方 初心者のエクセル(Excel)学習・入門(5)
仮説検定 - Wikipedia(6)
政府統計の総合窓口 GL08020103(8)">
全国の桃の産地について:桃の生産量(9)
農林水産省/食品中の放射性物質の検査結果(厚生労働省)
スポンサーサイト
- 2012/07/31(火) 00:12:54|
- -
-
| トラックバック:0
-
| コメント:0