14.共分散分析(ANCOVA:分散分析に回帰分析を応用した手法)

2022年9月18日

14.共分散分析(ANCOVA:分散分析に回帰分析を応用した手法)

  • 分散分析(ANOVA:ANalysis OVAriance)
  • 共分散分析(ANCOVA:ANalysis of COVAriance)

(1)共分散分析(ANCOVA)は、分散分析(ANOVA)と同じく「分散を使った母平均の検定」を行う

共分散分析(ANCOVA)は、分散分析(ANOVA)と同じように、
基本的には、「群間比較」(平均値の比較)を目的としたパラメトリックな解析手法です。

  • 帰無仮説 H0:群間の主効果が同じ(平均に差がない)
  • 対立仮設 H1:群間の主効果に差がある(平均に差がある)

1)共分散分析(ANCOVA)は、共変量の影響を取り除いた「群間比較」(平均値の比較)を行う

共分散分析(ANCOVA)は、説明変数の中に、共変量(平均値に影響を与える補助的な変数(体重や年齢など))があった場合には、その共変量の影響を取り除いて、「群間比較」(平均値の比較)を行うことができる解析手法になります。

ここで、「平均値に影響を及ぼすデータ(共変量)が群間で異なっていれば、それがいわゆる交絡因子になります」。(吉田2019,p.161)
つまり、共分散分析(ANCOVA)は、交絡因子(共変量)の影響を小さくすることにつながる手法であるため、統計的検定を行う上で大きなアドバンテージとなります。

2)共分散分析(ANCOVA)では、共変量(連続変数)を説明変数(X軸)とした回帰直線を引く

共分散分析(ANCOVA)は、分散分析(ANOVA)と回帰分析を組み合わせた手法とも言われます。

分散分析(ANOVA)の説明変数は、集団(例えば、A群、B群、そしてC群)などのカテゴリー変数(要因)のみです。
これに対して、共分散分析(ANCOVA)の説明変数には、カテゴリー変数(要因)に加えて、連続変数(共変量)が必須です。

そして、この連続変数(共変量:X軸)と目的変数(Y軸)との関係を、回帰直線で表します。
つまり、全てのデータを含む散布図の中に、横軸を共変量とする各群ごとの回帰直線を複数引きます。
その上で、各群ごとの回帰直線の差を検定します。(ただし、以下のような条件がある) 

  • 群間で回帰直線が平行であること
  • 回帰係数がゼロでないこと
    (回帰係数がゼロならば、共変量を含めず、通常の分散分析を行う)

なお、共分散分析(ANCOVA)のカテゴリ変数の数(群の数)は、2群または3群以上です。
したがって、2群の場合には、t検定に共変量の要素を加えた分析ということになります。
注)分散分析(ANOVA)は、2群の場合も可能であり、その結果はStudentのt検定と一致する。

(2)A社とB社の年収差には、それぞれの社の平均年齢が影響を与えているか

一般的には、日本国内では、未だ年齢が上がるにつれて、それなりに年収アップすると考えられています。
(以下、吉田2019,pp.162-168参照)

【例:A社とB社の年収を比較する】

  • A社の平均年収:500万円(SD:50万円)、平均年齢:35歳(SD:5歳)
  • B社の平均年収:550万円(SD:50万円)、平均年齢:40歳(SD:5歳)

A社とB社の平均年収の差は、
本当に、A社とB社の会社の違い(給与水準の違い)のみによるものなのか、
それとも、両者の従業員の平均年齢の違い(年齢という交絡因子の違い)によるものなのか。

  • 年収=a1×会社+a2×年齢+b+誤差(共分散分析)
    (共分散分析では、カテゴリカル変数+連続変数)
  • Y(体重)=a×X1(身長)+c×X2(年齢)+b+誤差(重回帰分析)
    (重回帰分析では、複数の連続変数のみでカテゴリカル変数無し)

共分散分析は、分散分析(あるいはt検定)と回帰分析を合わせたような分析手法と考えることができる。
ここでは、単純なt検定の結果と共分散分析の結果を比べてみる。
(実際には、上記条件に当てはまるような乱数を発生させて、解析をしている)

  • A社とB社の差 :平均年収の差58.8万円、P値<0.0001(t検定の結果)
  • 同上、年齢で調整後:平均年収の差23.0万円、P値0.0951 (共分散分析の結果)

t検定では、A社とB社の平均年収を単純に比較している。
つまり、x軸(年齢)は全く考慮せず、Y軸のみの比較になる。
両社の平均年収の差は、単純に50万円(58.8万円)である。

共分散分析(ANCOVA)では、年齢(共変量)で調整をする。
X軸(共変量:年齢)、Y軸(目的変数:年収)として、
それぞれの群ごとに平行な直線(回帰直線)を引く。
その上で、同じ共変量同士(同じ年齢同士)のY(年収)の差を比較する。

年齢(共変量)で調整すると、両群の平均年収の差が小さくなり、逆にP値が大きくなっている。
ここでは、平均年収の差は、23.0万円となる。
t検定の場合の58.8万円と比べて、その差が小さくなっていることが分かる。

その結果、例えば、有意水準α=0.05とするならば、
有意差有り(P値<0.0001)だったものが、有意差無し(P値0.0951)になるという結論の違いが出てくる。
(両社の社員の平均年齢を考慮すると、両社の平均年収の差に有意差があるとは言えない)

  • 吉田寛輝著『いちばんやさしい医療統計』アトムス社(2019年)
  • 神田善伸著『EZRでやさしく学ぶ統計学』中外医学社(2020年)
  • 阿部真人著『統計学入門』ソシム社(2021年)
  • 文部省認定社会通信教育『現代統計実務講座 テキスト1』実務教育研究所(1965年)

 

関連URL及び電子書籍(アマゾンKindle版)

1)サリドマイド事件全般について、以下で概要をまとめています。
サリドマイド事件のあらまし(概要)
上記まとめ記事から各詳細ページにリンクを張っています。
(現在の詳細ページ数、20数ページ)

2)サリドマイド事件に関する全ページをまとめて電子出版しています。(アマゾンKindle版)
『サリドマイド事件(第6版)』
世界最大の薬害 日本の場合はどうだったのか(図表も入っています)

www.amazon.co.jp/ebook/dp/B00V2CRN9G/
2015年3月21日(電子書籍:Amazon Kindle版)
2016年11月5日(第2版発行)
2019年10月12日(第3版発行)
2020年05月20日(第4版発行)
2021年08月25日(第5版発行)
2022年03月10日(第6版発行)、最新刷(2022/05/03)

本書は、『サリドマイド胎芽症診療ガイド2017』で参考書籍の一つに挙げられています。

Web管理人

山本明正(やまもと あきまさ)

1970年3月(昭和45)徳島大学薬学部卒(薬剤師)
1970年4月(昭和45)塩野義製薬株式会社 入社
2012年1月(平成24)定年後再雇用満期4年で退職
2012年2月(平成24)保険薬局薬剤師(フルタイム)
2022年4月(令和4)現在、保険薬局薬剤師(パートタイム)