5.統計的検定の手順とは(標本から母集団を推定する)

2022年9月12日

5.統計的検定の手順とは(標本から母集団を推定する)

【重要】統計的検定を考えるとき、「P値を正しく理解する」ことが大前提になります。
本ページでは、統計的検定の基本的な流れについて、まずその概略をまとめています。
P値そのものについて、詳しくはこちらをご覧ください ⇒ P値を正しく理解する

【重要】統計の役割には、大きく分けて2つあります。
それは、データの特徴をつかむことと、母集団を推定することです。
統計的検定は、母集団を推定するために行います(推測統計)。
(データの特徴をつかむことは、記述統計に属します)
⇒ 記述統計:要約統計量とは(データの特徴をつかむ)

(1)統計的仮説検定とは

1)結論は一つ(有意差有り/無しのどちらか一つ)

統計的検定は、母集団に関する仮説を、標本から得た情報に基づいて検証することで、統計的仮説検定とも呼ばれています。

統計的検定は、「有意差有り/有意差無し」という結論を得るために行います。
この結論は、必ず二者択一(有意差の有無のみ)となるべきものです。
「非常に有意」とか「高度に有意」、あるいは「どちらとも決めかねる」などの表現はあり得ません。

ところで、統計的検定では、「差がない」ことは証明できません。
つまり、「差がないことが証明された」という結論を導くことはできません。
したがって、「有意差がなかったのでA群・B群は同じ」という表現は間違っています。
有意差が出なかった場合、「有意差があるとは言えない」という表現しかできません。
つまり、「(A群・B群は)同じという結論を導くことはできなかった」という意味になります。

2)統計的検定の原理(背理法を考える)

統計的検定の原理は、証明法の一つである「背理法」に基づいています。
つまり、差があることを直接証明することは難しい、そこで、
「差がないことを否定」することで、「差がある」と結論付けます。

  1. 証明法:背理法
  2. 適用する場合:Bが「・・・でない」形か、上の二つでうまくいかないとき
    (注:上の二つとは、前進後進法と対偶法)
  3. 仮定すること:AおよびNOTB
  4. 導くこと:ある矛盾
  5. 証明の進め方:AとNOTBから、前向きに推論して、矛盾を導く
    (『独学大全』2020,証明法のまとめ,p.735より)

(2)統計的検定の手順

データの種類やその目的によって、様々な検定が考えられます。
しかしながら、「基本的な検定の流れや、結果の読み取り方に関しては、全ての検定で共通です」。
(吉田2019,p.49)

データ解析で最も重要なことは、「データを適切に処理し、適切な解釈をする」ことです。
そのための手順は決まっており、作業途中の各段階ごとの概念を理解することが大切です。
(同2019,pp.50-51、要約)

  1. 仮説を立てる
    ・帰無仮説:無に帰したい仮説(あってほしくない仮説)
    ・対立仮説:本当に証明したい仮説(あってほしい仮説)
  2. 有意水準を設定する
  3. P値を計算する
  4. 帰無仮説を棄却する
  5. 対立仮説を採択する

1)仮説を立てる

帰無仮説(H0):「無に帰したい仮説(あってほしくない仮説)」
対立仮説(H1):「本当に証明したい仮説(あってほしい仮説)」

・対立仮説の設定:

「A群とB群で差がある」ことを証明したいと考えても、
実際には、「A群とB群で差がある」ことを証明するのは、なかなか難しいものです。

・帰無仮説の設定:

そこで、一旦、「A群とB群で差がない」とする仮説(帰無仮説)を立てます。
そして、この仮説が否定(棄却)されれば、「A群とB群で差がある」と結論付けます。

2)有意水準を設定する(例えばα = 0.05)

「有意水準」とは、「有意かどうかを判定する水準(ボーダーライン)」のことです。

つまり、「有意である/有意でない」かは、有意水準をどこに設定するかで決まってきます。
したがって、有意水準は、「P値」を出力する前に事前に定めておく必要があります。
もしそうでないならば、後で結論を操作することが可能となるからです。

実際の有意水準は、P3(第3相)試験などでは、両側5%検定と定められています(ICHガイドライン)。
(しかも、片側検定では、2.5%(5.0%の半分)とすることも明記されている
したがって、αエラー(第一種の過誤)は、両側5%に設定しておけば間違いありません。

なお、αエラーとは、「真の薬効がないにもかかわらず、検定で有意になる場合」を意味しており、αエラーの数値を小さく設定するほど、患者の不利益は少なくなります。

これに対して、
βエラー(第二種の過誤)「薬効があるにもかかわらず、薬効がないと結論付ける場合」は、
製薬メーカーにとって不利益なエラーと言えます。
βエラー(第二種の過誤)は、試験によって異なりますが、20~10%くらいに設定されることが多いようです。

「あ(α)わてん坊のエラー、ぼ(β)んやり者のエラー」(吉田2019,p.53)

(3)P値を計算する

P値のPとは、Probability(確率)のことです。
ここでP値(p value)とは、「(帰無仮説下で)ある結果が偶然発生する確率」(有意確率)のことです。
P値(有意確率)と、事前に定義しておいた有意水準(例えばα = 0.05)を比較することで、検定が統計的に有意かどうかを判定します。

ところで、P値を求めるためには、検定統計量が必要になります。
検定統計量とは、検定を行うために、何らかの計算をして得られる値(統計量)のことです。
なお、検定統計量は、検定の手法ごとに異なります。

P値は、検定統計量から手計算と統計数値表(例えばt表など)を使って、求めることができる場合もあります。
ただし、通常は、統計解析ソフト(コンピューター)が、検定統計量の選択も含めて、全て自動で行ってくれます。

(4)帰無仮説を棄却する

有意水準(例えばα = 0.05)と、P値(有意確率)を比較します。

有意差有り:P値≦0.05
P値(ある結果が偶然発生する確率)が、有意水準(α = 0.05)より小さい場合、有意差有りとします。
つまり、「A群とB群で差がない」(帰無仮説)と仮定したことが間違っていた、と判断して帰無仮説を棄却します。

有意差無し:P値>0.05
P値(ある結果が偶然発生する確率)が、有意水準(α = 0.05)より大きい場合、有意差無しとします。
つまり、「A群とB群で差があるとは言えない」と結論付けます。
ここで、「差がないことが証明された」とするのは、間違った解釈です。
正しくは、「同じという結論を導くことはできなかった」(有意差があるとは言えない)と結論付けることになります。(既述)

(5)対立仮説を採択する

有意差有りの場合、対立仮説(A群とB群で差がある)を採択します。

  • 吉田寛輝著『いちばんやさしい医療統計』アトムス社(2019年)
  • 神田善伸著『EZRでやさしく学ぶ統計学』中外医学社(2020年)
  • 阿部真人著『統計学入門』ソシム社(2021年)
  • 文部省認定社会通信教育『現代統計実務講座 テキスト1』実務教育研究所(1965年)

関連URL及び電子書籍(アマゾンKindle版)

1)サリドマイド事件全般について、以下で概要をまとめています。
サリドマイド事件のあらまし(概要)
上記まとめ記事から各詳細ページにリンクを張っています。
(現在の詳細ページ数、20数ページ)

2)サリドマイド事件に関する全ページをまとめて電子出版しています。(アマゾンKindle版)
『サリドマイド事件(第7版)』
世界最大の薬害 日本の場合はどうだったのか(図表も入っています)

www.amazon.co.jp/ebook/dp/B00V2CRN9G/
2015年3月21日(電子書籍:Amazon Kindle版)
2016年11月5日(第2版発行)
2019年10月12日(第3版発行)
2020年05月20日(第4版発行)
2021年08月25日(第5版発行)
2022年03月10日(第6版発行)
2023年02月20日(第7版発行)、最新刷(2023/02/25)

本書は、『サリドマイド胎芽症診療ガイド2017』で参考書籍の一つに挙げられています。

Web管理人

山本明正(やまもと あきまさ)

1970年3月(昭和45)徳島大学薬学部卒(薬剤師)
1970年4月(昭和45)塩野義製薬株式会社 入社
2012年1月(平成24)定年後再雇用満期4年で退職
2012年2月(平成24)保険薬局薬剤師(フルタイム)
2023年1月(令和5)現在、保険薬局薬剤師(パートタイム)