8.t検定(母平均に関する検定)

2022年9月15日

8.t検定(母平均に関する検定)

(1)t検定は、「母平均に関する検定」を行う

t検定は、「母平均に関する検定」を行います。
要約統計量の一つである平均値に関する検定であり、
解析対象(アウトカム)は、連続変数ということになります。

t検定は、パラメトリック(何らかの分布に従う)検定に分類され、
その中でも、正規分布に従うことを仮定しています。

1)検定統計量Tは、t分布にしたがう

検定統計量T(t検定のための統計量)は、Zスコア(標準正規分布)を参考にして、次のように求められます。
注)下記は、「1標本の平均値」のt検定の場合であり、
2標本では、検定統計量Tの計算はもう少し複雑になります。

Z(スコア)=(x-μ)/σ ⇒ 《偏差》/《標準偏差》

  • 《偏差》→「標本平均の《偏差》」を代入
  • 《標準偏差》→「標本平均の《標準偏差》」を代入

以上から、統計量T=標本平均の《偏差》/標本平均の《標準偏差》となります。
つまり、統計量T=「標本平均-母平均」/「標準誤差」です。

標準誤差とは、標本平均の標準偏差のことです。
(標準誤差(SE)=標準偏差(SD)/√データ数(n))

この検定統計量Tは、自由度n-1(データ数-1)のt分布に従います。
なお、この分布のことを、特にスチューデント(Student)のt分布と呼びます。
この件に関して、初めて論文を発表したゴセットのペンネームにちなんだものです。

2)t分布と標準正規分布を比べてみる

t分布のグラフを標準正規分布のそれと比べると、分布の形(釣り鐘型)には、ほとんど違いはありません。
ただし、t分布の方がピークの位置が低く、両裾がやや厚くなっていることが分かります。
その分、裾が左右に少し広がっています。

その理由は、統計量Tでは、母分散(未知)の代わりに標本分散を用いて計算しているため、確率的にバラつきが大きくなるためです。

t分布は、データ数が多くなるにつれて、標準正規分布に収束します。
つまり、データ数が無限大の場合、標準正規分布と全く同じになります。
データ数nが60程度で、ほぼ標準正規分布と変わりなくなることから、
t検定は、データ数が少ない場合の検定として、非常に有用です。

3)統計解析には統計解析ソフト(コンピューター)を使う

現在では、統計解析には統計解析ソフトを使うことが一般的になっています。
統計解析ソフトは、検定統計量TからP値まで、自動で計算してくれます。
検定に必要なサンプル数も、様々なケースについて、簡単に計算することができます。
したがって、必要最小限のサンプル数さえそろっているならば、サンプル数の大小にかかわらず、t検定をそのまま使うという考え方も成り立ちます。

(2)1標本の平均値のt検定(群の数は1つ)

「母平均」と「比較したい値」との差の検定になります。

例えば、製品の内容量としての規格(母平均)が定められている場合に、
出来上がった製品の実際の内容量(比較したい値)が、規格から外れていないかどうかを調べるために行います。

検定の手順は、以下のようになります。
(実際の手順は、次の「2標本の平均値のt検定」の場合を参照のこと

  • 母集団から無作為抽出したサンプルから、標本平均や標準偏差を算出する。
  • 標本平均や標準偏差から、統計量Tを算出する。
  • t分布表からt値を求める。
  • 統計量Tとt値を比較する。
  • 有意差有り/無しを判定する。
    つまり、「母平均」と「比較したい値」が異なるかどうかを判定する。

(3)2標本の平均値のt検定(群の数は2つ、対応無し)

2つの母集団から無作為抽出したサンプルの標本平均や標本標準偏差から、2群の母平均が異なるかどうか、P値を使って調べる方法になります。

例として、対応のない2群(A群とB群)のt検定を考えてみます。

なお、以下では、t検定の手順を再確認するため、t分布表を使った有意差判定を行っています。
ただし、現在では、統計解析ソフトを使用して、統計量TからP値(有意確率)までを自動で計算します。
そして、P値(有意確率)と有意水準(例えば、両側確率α=0.05)を比べることによって、有意差判定をします。

1)帰無仮説と対立仮説は、次のようになります。

  • 帰無仮説H0:A群の母平均=B群の母平均 ⇒(A群の母平均-B群の母平均=ゼロ)
  • 対立仮説H1:A群の母平均≠B群の母平均 ⇒(A群の母平均-B群の母平均≠ゼロ)
    (A群のデータ数:m、B群のデータ数:n)

2)各群の平均値と標準偏差を算出する
3)統計量Tを算出する

統計量Tは、「1標本の平均値のt検定」の場合と比べて、少し複雑になります。
ただし、
現在では、検定統計量TからP値まで、統計解析ソフトで自動的に求めることができます。
(ここでは、統計量Tの計算は省略します)

4)t分布表からt値を求める(自由度が必須)

t分布表を読み取ると、
例えば、自由度f=18の場合、両側確率α=0.05に対応する値は、t値(18,0.05)=2.101となります。
つまり、自由度によって、t分布の形が異なるので、
それに伴ってt値は変化します。

ここで自由度とは、以下のようにして計算します。

A群の自由度:(m-1)← データ数-1
B群の自由度:(n-1)← データ数-1
A群+B群の自由度:(m-1)+(n-1)→(m+n-2)

それぞれの群の平均値が決まっているならば、それぞれの群のデータ数よりも一つ少ない数のデータが決まれば、おのずと最後の一つは決まってきます。
つまり、選択の余地はなくなります。
したがって、それぞれの群の自由度は、(データ数-1)となります。

5)統計量Tとt値を比較する(有意差判定)

有意差有り:|統計量T|> 2.101(ただし、自由度f=18、両側確率α=0.05の場合)
つまり、「A群とB群の母平均には差がある」と結論付ける。

有意差無し:|統計量T|≦ 2.101(ただし、自由度f=18、両側確率α=0.05の場合)
つまり、「A群とB群の母平均には差があるとは言えない」と結論付ける。

ここで大切なことは、「"差がある"ことの反対は、"差があるとは言えない"」ということである。
検定で差が出なかったとしても、決して"差がない"ことが証明されたわけではない。

(4)その他

1)t検定(対応無し)について

t検定では、データのバラつき具合が、正規分布に従っていることが前提になります。
2標本の平均値のt検定(群の数は2つ、対応無し)を用いるときは、次の条件も関わってきます。

  • 2つの群のサンプルは独立に得られたものであること
  • 2つの群の両方に正規性のあること
  • 2つの群で分散が等しいこと(等分散性があること)

t検定(対応無し)の考え方として、初めから等分散性を考慮しないことに決めておき、常にWelch検定を実行する、という方法もあります。(Welch検定:2つの群の分散が異なる場合でも使用できる)

2)ノンパラメトリック(対応無し)について

母集団が正規分布に従うという前提が、全く成立しない場合には、ノンパラメトリック検定を用います。
例えば、「Wilcoxonの順位和検定」があり、その他「Mann-WhitneyのU検定」も同等な手法です。

2)対応有りの場合について

対応のあるデータとは、例えば、同じ患者グループから得られたデータについて、ベースラインの血圧と、2週間後の血圧を比較する場合などを言います。

「対応のあるt検定」(パラメトリックな検定)に対応する形で、「Wilcoxonの符号順位検定」(ノンパラメトリックな検定)があります。

なお、ノンパラメトリック検定には、Wilcoxonの順位和検定(対応のない場合)とWilcoxonの符号順位検定(対応のある場合)の2つがあることには注意が必要です。

4)3群の比較は可能か?

t検定は、1群または2群の検定法であり、3群以上の検定には使用できません。
3群以上の母平均の検定には、分散分析があります。

  • 吉田寛輝著『いちばんやさしい医療統計』アトムス社(2019年)
  • 神田善伸著『EZRでやさしく学ぶ統計学』中外医学社(2020年)
  • 阿部真人著『統計学入門』ソシム社(2021年)
  • 文部省認定社会通信教育『現代統計実務講座 テキスト1』実務教育研究所(1965年)

関連URL及び電子書籍(アマゾンKindle版)

1)サリドマイド事件全般について、以下で概要をまとめています。
サリドマイド事件のあらまし(概要)
上記まとめ記事から各詳細ページにリンクを張っています。
(現在の詳細ページ数、20数ページ)

2)サリドマイド事件に関する全ページをまとめて電子出版しています。(アマゾンKindle版)
『サリドマイド事件(第7版)』
世界最大の薬害 日本の場合はどうだったのか(図表も入っています)

www.amazon.co.jp/ebook/dp/B00V2CRN9G/
2015年3月21日(電子書籍:Amazon Kindle版)
2016年11月5日(第2版発行)
2019年10月12日(第3版発行)
2020年05月20日(第4版発行)
2021年08月25日(第5版発行)
2022年03月10日(第6版発行)
2023年02月20日(第7版発行)、最新刷(2023/02/25)

本書は、『サリドマイド胎芽症診療ガイド2017』で参考書籍の一つに挙げられています。

Web管理人

山本明正(やまもと あきまさ)

1970年3月(昭和45)徳島大学薬学部卒(薬剤師)
1970年4月(昭和45)塩野義製薬株式会社 入社
2012年1月(平成24)定年後再雇用満期4年で退職
2012年2月(平成24)保険薬局薬剤師(フルタイム)
2023年1月(令和5)現在、保険薬局薬剤師(パートタイム)