5.統計的検定の手順とは(標本から母集団を推定する)
5.統計的検定の手順とは(標本から母集団を推定する)
【重要】統計的検定を考えるとき、「P値を正しく理解する」ことが大前提になります。
本ページでは、統計的検定の基本的な流れについて、まずその概略をまとめています。
P値そのものについて、詳しくはこちらをご覧ください ⇒ P値を正しく理解する
【重要】統計の役割には、大きく分けて2つあります。
それは、データの特徴をつかむことと、母集団を推定することです。
統計的検定は、母集団を推定するために行います(推測統計)。
(データの特徴をつかむことは、記述統計に属します)
⇒ 記述統計:要約統計量とは(データの特徴をつかむ)
(1)統計的仮説検定とは
1)結論は一つ(有意差有り/無しのどちらか一つ)
統計的検定は、母集団に関する仮説を、標本から得た情報に基づいて検証することで、統計的仮説検定とも呼ばれています。
統計的検定は、「有意差有り/有意差無し」という結論を得るために行います。
この結論は、必ず二者択一(有意差の有無のみ)となるべきものです。
「非常に有意」とか「高度に有意」、あるいは「どちらとも決めかねる」などの表現はあり得ません。
ところで、統計的検定では、「差がない」ことは証明できません。
つまり、「差がないことが証明された」という結論を導くことはできません。
したがって、「有意差がなかったのでA群・B群は同じ」という表現は間違っています。
有意差が出なかった場合、「有意差があるとは言えない」という表現しかできません。
つまり、「(A群・B群は)同じという結論を導くことはできなかった」という意味になります。
2)統計的検定の原理(背理法を考える)
統計的検定の原理は、証明法の一つである「背理法」に基づいています。
つまり、差があることを直接証明することは難しい、そこで、
「差がないことを否定」することで、「差がある」と結論付けます。
- 証明法:背理法
- 適用する場合:Bが「・・・でない」形か、上の二つでうまくいかないとき
(注:上の二つとは、前進後進法と対偶法) - 仮定すること:AおよびNOTB
- 導くこと:ある矛盾
- 証明の進め方:AとNOTBから、前向きに推論して、矛盾を導く
(『独学大全』2020,証明法のまとめ,p.735より)
(2)統計的検定の手順
データの種類やその目的によって、様々な検定が考えられます。
しかしながら、「基本的な検定の流れや、結果の読み取り方に関しては、全ての検定で共通です」。
(吉田2019,p.49)
データ解析で最も重要なことは、「データを適切に処理し、適切な解釈をする」ことです。
そのための手順は決まっており、作業途中の各段階ごとの概念を理解することが大切です。
(同2019,pp.50-51、要約)
- 仮説を立てる
・帰無仮説:無に帰したい仮説(あってほしくない仮説)
・対立仮説:本当に証明したい仮説(あってほしい仮説) - 有意水準を設定する
- P値を計算する
- 帰無仮説を棄却する
- 対立仮説を採択する
1)仮説を立てる
帰無仮説(H0):「無に帰したい仮説(あってほしくない仮説)」
対立仮説(H1):「本当に証明したい仮説(あってほしい仮説)」
・対立仮説の設定:
「A群とB群で差がある」ことを証明したいと考えても、
実際には、「A群とB群で差がある」ことを証明するのは、なかなか難しいものです。
・帰無仮説の設定:
そこで、一旦、「A群とB群で差がない」とする仮説(帰無仮説)を立てます。
そして、この仮説が否定(棄却)されれば、「A群とB群で差がある」と結論付けます。
2)有意水準を設定する(例えばα = 0.05)
「有意水準」とは、「有意かどうかを判定する水準(ボーダーライン)」のことです。
つまり、「有意である/有意でない」かは、有意水準をどこに設定するかで決まってきます。
したがって、有意水準は、「P値」を出力する前に事前に定めておく必要があります。
もしそうでないならば、後で結論を操作することが可能となるからです。
実際の有意水準は、P3(第3相)試験などでは、両側5%検定と定められています(ICHガイドライン)。
(しかも、片側検定では、2.5%(5.0%の半分)とすることも明記されている)
したがって、αエラー(第一種の過誤)は、両側5%に設定しておけば間違いありません。
なお、αエラーとは、「真の薬効がないにもかかわらず、検定で有意になる場合」を意味しており、αエラーの数値を小さく設定するほど、患者の不利益は少なくなります。
これに対して、
βエラー(第二種の過誤)「薬効があるにもかかわらず、薬効がないと結論付ける場合」は、
製薬メーカーにとって不利益なエラーと言えます。
βエラー(第二種の過誤)は、試験によって異なりますが、20~10%くらいに設定されることが多いようです。
「あ(α)わてん坊のエラー、ぼ(β)んやり者のエラー」(吉田2019,p.53)
(3)P値を計算する
P値のPとは、Probability(確率)のことです。
ここでP値(p value)とは、「(帰無仮説下で)ある結果が偶然発生する確率」(有意確率)のことです。
P値(有意確率)と、事前に定義しておいた有意水準(例えばα = 0.05)を比較することで、検定が統計的に有意かどうかを判定します。
ところで、P値を求めるためには、検定統計量が必要になります。
検定統計量とは、検定を行うために、何らかの計算をして得られる値(統計量)のことです。
なお、検定統計量は、検定の手法ごとに異なります。
P値は、検定統計量から手計算と統計数値表(例えばt表など)を使って、求めることができる場合もあります。
ただし、通常は、統計解析ソフト(コンピューター)が、検定統計量の選択も含めて、全て自動で行ってくれます。
(4)帰無仮説を棄却する
有意水準(例えばα = 0.05)と、P値(有意確率)を比較します。
有意差有り:P値≦0.05
P値(ある結果が偶然発生する確率)が、有意水準(α = 0.05)より小さい場合、有意差有りとします。
つまり、「A群とB群で差がない」(帰無仮説)と仮定したことが間違っていた、と判断して帰無仮説を棄却します。
有意差無し:P値>0.05
P値(ある結果が偶然発生する確率)が、有意水準(α = 0.05)より大きい場合、有意差無しとします。
つまり、「A群とB群で差があるとは言えない」と結論付けます。
ここで、「差がないことが証明された」とするのは、間違った解釈です。
正しくは、「同じという結論を導くことはできなかった」(有意差があるとは言えない)と結論付けることになります。(既述)
(5)対立仮説を採択する
有意差有りの場合、対立仮説(A群とB群で差がある)を採択します。
- 吉田寛輝著『いちばんやさしい医療統計』アトムス社(2019年)
- 神田善伸著『EZRでやさしく学ぶ統計学』中外医学社(2020年)
- 阿部真人著『統計学入門』ソシム社(2021年)
- 文部省認定社会通信教育『現代統計実務講座 テキスト1』実務教育研究所(1965年)
このページの目次です関連URL及び電子書籍(アマゾンKindle版)
1)サリドマイド事件全般について、以下で概要をまとめています。
⇒サリドマイド事件のあらまし(概要)
上記まとめ記事から各詳細ページにリンクを張っています。
(現在の詳細ページ数、20数ページ)2)サリドマイド事件に関する全ページをまとめて電子出版しています。(アマゾンKindle版)
『サリドマイド事件(第7版)』
世界最大の薬害 日本の場合はどうだったのか(図表も入っています)
www.amazon.co.jp/ebook/dp/B00V2CRN9G/
2015年3月21日(電子書籍:Amazon Kindle版)
2016年11月5日(第2版発行)
2019年10月12日(第3版発行)
2020年05月20日(第4版発行)
2021年08月25日(第5版発行)
2022年03月10日(第6版発行)
2023年02月20日(第7版発行)、最新刷(2023/02/25)本書は、『サリドマイド胎芽症診療ガイド2017』で参考書籍の一つに挙げられています。
Web管理人
山本明正(やまもと あきまさ)
1970年3月(昭和45)徳島大学薬学部卒(薬剤師)
1970年4月(昭和45)塩野義製薬株式会社 入社
2012年1月(平成24)定年後再雇用満期4年で退職
2012年2月(平成24)保険薬局薬剤師(フルタイム)
2023年1月(令和5)現在、保険薬局薬剤師(パートタイム)