fc2ブログ

めげ猫「タマ」の日記

一寸気になったどうでもいい事を記事に

福島Q&A Q18.統計的な差ってなんですか?

 A.差がないと仮定して、実際に起こった差が偶然に生じる確率を計算し、確率が小さければ「差」あるとします(1)。
 事故後に福島では色々と怪しげな数値が出て来ています。これが偶然なのか、差があるのか見極める必要があります。福島に関する議論をきいていると、統計的な差が無いのにあたかも差がるかのような主張があります。逆に統計的な差あるのに無いと主張する例もあります。こうした主張がデマであることを見抜くには「統計的な差」について知ることが大事だと思います。
 ウサギとカメさんが8回競争をしたとします。結果はカメさん7勝1敗だとします。これについてウサギさんは偶然を主張しました。そこで、ウサギさんとカメさんの実力は同じとします。すると、勝ち負けの確率は等しくなります。そして、この考え(仮定)に基づいて「偶然」に起こる確率を計算します。いろいろな計算方法がありますが、一つは起こり得る場合を全て計算することだと思います。
 勝率が五分五分なら、どの場合(パターン)も全て同じ確率でおきます。そこで、全てのパターンの数と、カメさんが1負け以下のパターンを計算します。
 ①全部の通り数は、ウサギさんとカメさんが、8回勝負したとして、1回戦から8回戦まで、カメさんが勝つかうさぎさんがかつの2通りのパターンしかありません。しかも、どちらもおこる確率は同じです。このようなパターンは
  1回戦2通りで、2回戦2通りで、二回戦までで4通りのパターンがあります。
  3回戦も2通りなので、3回戦まででは8通り、
  4回戦で16通り、5回戦で32通り、6回戦で64通り、7回戦で128通り、
  8回戦で256通り
です。ウサギさんとカメさんの実力が同じなら、この256通りはすべて同じ確率で起きます。
 ②うさぎさんが1勝以下の通り数
  a)全負けは1通り
  b)1勝は、1回戦から8回戦戦のとれか一つで勝ので8通りです。
  c)合計は9通りですね。
 ③うさぎさんが偶然にも1勝しかできない確率
  全部で256通りあり、かつ各通りが生じる確率は同じです。そして、うさぎさんが1勝以下となるとおり数は、9通りです。だから、うさぎさんが1勝しかできない事が偶然に起こる確率は、
  9÷256=0.035(3.5%)
です。
 この計算は7勝1敗程度なら追えますが、70勝10敗になると大変です。そこでカイ自乗検定を使います。
χ2値を使うともっと簡単に計算できます。χ2値は、
  期待値:変わらないとした起こるであろう値(8戦ですので、実力が同じならうさぎもかめも4勝です)
  実測値:実際に起きた値、うさぎは1、カメは7です。
  χ2値:(実測値-期待値)2÷期待値
    a)ウサギさんは(1-4)2÷4=2.25
    b)カメさんは (7-4)2÷4=2.25
 χ2
   全てのχ2値の合計です。この例では、
    2.25+2.25=4.5
 です(2)。
 これだけの数字が分かるとExcelでは、セルに
   =CHIDSIT(χ2和、自由度)
と入れると、簡単に偶然に起こる確率を計算できます(Excelのヘルプより)。この場合、3.4%になりました。2と殆ど同じです。この計算方法は1000試合でも、同じ方法で計算できます。なお、統計の世界では偶然に起こる確率を「危険率」と呼ぶみたいです。(=^・^=)は、この計算過程を以下のような表にまとめていたりします。なお、(=^・^=)のExcel(バージョン014.0.6115.5003)では、CHIDIST.RTです。

 表―1 χ2和から、偶然に起こる確率を計算した例(ウサギとカメ)
brg120730a.gif

以下に今年(2019年)スズキの検査結果を示します。
茨城産や千葉産からは見つかっても福島産からは見つからないスズキのセシウム
 ※1(1)を集計
 ※2 NDは検出限界未満(見つからない事)を示す。
 ※3 福島県は福島県が実施した検査のみ集計
 ※4 日付けは捕獲日
 図―1 スズキの検査結果

 図に示す様に、宮城、茨城、千葉の各県産からはセシウムが見つかっているのですが、福島県が検査した福島産スズキがからは見つかっていません。普通に考えれば、汚染源がある福島産が高く出なくてはなりません。
 どう見ても福島県の検査は他に比べて引くでるようです。まして、スズキ等の福島産農水産物の出荷前検査は厚生労働省の発表(4)を見ると、福島県農林水産部に属する福島県農業総合センター(5)で実施しています。中立性に疑問があります。それでも、福島産は「安全」と強弁したい方は「偶然」主張すると思います。この問題を解決する手法として、偶然に起こる確率を計算し、値が小さければ偶然には起こりえないので福島県の検査は低くでるとの話になります。
 ここで証明したのは「福島県の検査は他に比べ低くでる」です。そこで、これと反対の「福島県の検査は低くでない」と考えます。このように仮定(考え)をしたと時に、図―1のような現象が偶然に起こる確率がどれくらいか計算し、この値が小さければ「福島県の検査は低くでない」とは言えません。残るのは「福島県の検査は他に比べ低くでる」です。この考えは帰無仮説と有意水準(4)を参考に組み立てました。
 「福島県の検査は低くでない」は、別の言い方をすれば「少なくとも同じ」です。そこで、図―1のデータが福島県の検査は他県と同じ値がでると仮定した時に図―1の様なデータが、偶然に起こる確率を計算します。
 数値を数えると
  茨城県産 検査4件中3件でセシウム入り
  福島県産 検査27件全てで検出限界未満
になるます。福島県の検査と茨城県産の検査が同じであれば、最悪でもセシウムが見つかる確率は同じです。そこで、セシウムが見つかる確率は同じとします。確率は合計で31件検査して3件見つかっているので、3÷31です。この割合でセシウムが見つかるとしたら、
 茨城産 0.39( 4×3÷31)
 福島産 2.61(27×3÷31)
になります。これが期待値です。この値を元にカイ自乗(χ2)値を計算し、偶然に起こる確率を計算すると以下のようになります。

 表―2 カイ自乗検定表(茨城vs福島)
有意差検定表(茨城vs福島)

 表に示す通り偶然に起こる確率は0.0007%です。

 以下に千葉との比較を示します。

 表―3 カイ自乗検定表(千葉vs福島)
 有意差検定表(千葉vs福島)

 表に示す通り偶然に起こる確率は0.0006%です。
 福島産スズキの検査が茨城や千葉の検査と同じと仮定(考え)をした時に図―1のようなデータが偶然に生じる確率は極めて小さく、福島の検査が茨城や千葉と同等と考えるのは無理があります。残るのは、福島の検査は茨城や千葉より低く出るです。統計的な差とは差がないと仮定して、実際に起こった差が偶然に生じる確率を計算し、確率が小さければ「差」あるとします(1)。すなわち、統計的な差があると言えます。
 以下に茨城産と千葉産について同様の計算を実施してみました。

 表―4 カイ自乗検定表(茨城vs千葉)
有意差検定表(茨城vs千葉)

 偶然に起こる確率は98%です。茨城と千葉の検査は同等と仮定(考え)たとき、図―1に示す様な事が偶然に起こり得ます。統計的な差はないと言えます。同じ物を検査したら、同じ結果がでるとゆう当たり前です。でも、福島は低くでます。
 福島県郡山市と三春町の合計の死者数は
  事故直前1年(2010年3月~11年2月)3,163人
  事故12年目(2022年3月~23年3月)4,079人
で、29%増えています。一方で相馬・南相馬市の合計の死者数は
  事故直前1年(2010年3月~11年2月)1,294人
  事故12年目(2022年3月~23年3月)1,415人
で、9%しか増えていません。相馬・南相馬市に比べ郡山市・三春町の死者数が大きく増えていると思います。統計的に葬式の増え方に差があると言えるでしょうか。そこで葬式の増え方が同じと仮定(考え)ます。事故直前1年と事故12年目のそれぞれの合計数は
 事故直前1年 4,457(3,163+1,294)人(aとする)
 事故12年目 5,494(4,079+1,415)人(bとする)
 両方の合計  9,951(4,457+5,494)人(iとする)
になります。 事故直前1年と事故12年目の合計の死者数は
 郡山市・三春町 7,242(3,163+4,078)人(gとする)
 相馬・南相馬市 2,709(1,294+1,415)人(hとする)
です。増加の割合が変わらないので両方の合計のうち、死者数の割合は変わりません。死者数の割合は
 事故直前1年 0.488(4,457÷9,951)(jとする)
 事故12年目 0.552(5,494÷9,951)(kとする)
です。
 すると割合(増加率)が変わらないとすると、事故前1年と事故12年目に想定される死者数(期待値)は
 事故直前1年では
  郡山市・三春町 7,242人(事故直前1年と事故12年目の合計)×0.488(事故直前1年の割合)=3,244(aとする)。
  相馬・南相馬市 2,709人(事故直前1年と事故12年目の合計)×0.488(事故直前1年の割合)=1,213(bとする)。
 事故12年目では
  郡山市・三春町 7,242人(事故直前1年と事故12年目の合計)×0.552(事故直前1年の割合)=3,998(aとする)。
  相馬・南相馬市 2,709人(事故直前1年と事故12年目の合計)×0.552(事故直前1年の割合)=1,496(bとする)。
になります。
 以上の結果を以下の表にまとめます。

 表―4 カイ自乗検定表(茨城vs千葉)
 ※1 a~kは各パラメータの記号
 ※2 期待値のある項の計算式は期待値の計算式
有意差検定表(期待値4個)

 そして期待値と実測値からカイ自乗を計算し、合計は13になります。期待値は4個ありますが、合計が固定されいるとすれば、自由度は
「自由度とは、ある代表値や合計値があるときに、自由に値を取れる数」
なので(7)、自由度は「3」です。そこで
 CHIDIST.RT(18,3)
で計算します。結果は0.004(0.4%)でした。

<余談>
 図表が小さいとご不満の方はこちら、図表をクリックしてください。
 2023年4月2日改定(期待値が4つある場合の扱いの追加)しました。現状ではリンク切れもありますがそのままにした。
 福島に対する疑問を「福島Q&A 」にまとめました(8)。よかったら他のQ&Aも見て下さい。
 この議論は数学が嫌いな皆様には異常に分かりにくいと思います。でも、福島を知るには必要な議論と思い敢て記事にしました。
 Q2(9)に示す様に福島県の農水産物の検査には疑義があります。Q3(10)に示すように福島県は過去に放射線測定装置に値が低く出るような人為的操作を加えています。同じような事を食品の検査で実施しても不思議はありません。福島産農水産物の出荷前検査は全てを福島県農業総合センターだけで実施しています。操作をすることは容易です。他県の検査と福島県の検査に差がるか否かは最後は統計的な差の有無を確認する必要があるます。その考え方をご理解いただきたく、あえて本件を記事にしました。そして福島県の検査を疑っているのは(=^・^=)だけではないよです。
 福島を代表する野菜にキュウリがあります(11)。今年も出荷が始まっています(12)。福島のキュウリはおいしいとのことです(13)。福島県は福島産キュウリは「安全」だと主張しています(14)。でも、福島県福島市のスーパーのチラシには福島産キュウリはありません。
他県産はあっても福島産キュウリが無い福島県福島市のスーパーのチラシ
 ※(15)を引用
 図―2 福島産キュウリが無い福島県福島市のスーパーのチラシ

 (=^・^=)も福島県福島市の皆さまを見習い「フクシマ産」は食べません。

-参考にしたサイト様および引用した過去の記事―
(1)有意差(ユウイサ)とは - コトバンク
(2)カイ二乗検定 - Wikipedia
(3)CHIDIST関数の使い方 初心者のエクセル(Excel)学習・入門
(4)報道発表資料 |厚生労働省
(5)農林水産部 - 福島県ホームページ
(6)帰無仮説と有意水準
(7)自由度とは?求め方とカイ二乗検定での例題で統計学での意味をわかりやすく|いちばんやさしい、医療統計
(8)めげ猫「タマ」の日記 福島Q&A 
(9)めげ猫「タマ」の日記 福島Q&A Q2.福島県の野菜・果物の検査は正しいですか?
(10)めげ猫「タマ」の日記 福島Q&A Q3.福島県が発表する放射線測定値は正しいですか?
(11)ふくしまイレブンエッセイ - 福島県ホームページ
(12)トピックス | JAふくしま未来
(13)食の宝庫ふくしま | ふくしま満天堂(ふくしまプライド。)
(14)安全が確認された農林水産物(公開用簡易資料) - 福島県ホームページ
(15)イオン 福島店のチラシ・特売情報 | トクバイ
スポンサーサイト



  1. 2019/06/29(土) 19:43:37|
  2. -
  3. | トラックバック:0
  4. | コメント:0
<<福島Q&A Q19.速やかな避難指示はでましたか? | ホーム | 福島・ピーマン出荷始まる、食べて大丈夫?>>

コメント

コメントの投稿


管理者にだけ表示を許可する

トラックバック

トラックバック URL
http://mekenekotama.blog38.fc2.com/tb.php/2932-083f0ee2
この記事にトラックバックする(FC2ブログユーザー)