7.検定手法はデータの種類によって異なる(連続変数、カテゴリカル変数など)

2022年9月16日

7.検定手法はデータの種類によって異なる(連続変数、カテゴリカル変数など)

(1)統計解析手法を決める要素

比較したいデータの種類(アウトカム)ごとに、群の数、対応有り/無し、そして正規性有り/無しを確認すれば、検定の手法は自ずから決まってきます。

  • アウトカムは、通常、連続変数、カテゴリカル変数、そして生存時間に大別します。
  • 群の数は、通常は、2群又は3群以上が大多数です。
  • 対応有り/無しとは、対応のあるデータ(同一のサンプルから得られたデータ)か、または、対応のないデータ(異なるサンプルから得られたデータ)かに分かれます。
  • 正規性有り/無しとは、正規性がある(データが正規分布から得られたと見なせる)場合と、正規性がない場合に分かれます。

対応のあるデータとは、例えば、
A群のベースラインの血圧と、A群の2週間後の血圧を比較する場合などを言います。
対応のないデータとは、例えば、
A群のベースラインの血圧と、B群のベースラインの血圧を比較する場合などを言います。

パラメトリック検定とは、「母集団が数学的に扱える(パラメータで記述できる)特定の分布に従っているという仮定を置いた仮説検定」のことです。(阿部2021,p.133)
注)パラメータ:平均値、分散や標準偏差など。

パラメトリック検定は、あくまでも、"ある分布"を対象としたものです。
したがって、パラメトリック=正規分布に限定されるものではありません。
ただし、「(パラメトリック検定)の多くは、母集団の分布が正規分布の場合です」。(同,p.133)

1)連続変数

  • 要約:ヒストグラム、箱ひげ図、散布図
  • 2群(対応無し):t検定、ウィルコクソンの順位和検定*(マン・ホイットニーのU検定*)
  • 2群(対応有り):対応のあるt検定、ウィルコクソンの符号順位検定*
  • 3群以上(対応無し):分散分析(ANOVA)、クラスカル・ウォリス検定*
  • 3群以上(対応有り):反復測定分散分析、フリードマン検定*
    (*印:ノンパラメトリック検定)

2)カテゴリカル変数

  • 要約:分割表
  • 2群(対応無し):カイ二乗検定、フィッシャーの正確確率検定
  • 2群(対応有り):マクネマー検定
  • 3群以上(対応無し):カイ二乗検定
  • 3群以上(対応有り):コクランのQ検定
    (全てノンパラメトリック検定)

3)生存時間

  • 要約:カプランマイヤー曲線
  • 2群(対応無し):ログランク検定、一般化ウィルコクソン検定
  • 3群以上(対応無し):ログランク検定
    (全てノンパラメトリック検定)

4)(多変量)回帰分析、相関について

  • 目的変数が連続変数:単回帰・重回帰(共分散分析:ANCOVAなど)
  • 目的変数がカテゴリカル変数(2値データ):ロジスティック回帰
  • 目的変数が生存時間データ:Cox比例ハザードモデル
  • (相関について:ピアソンの積率相関係数 r(パラメトリック)、スピアマンの順位相関係数 ρ(ノンパラメトリック))

(2)比較したいデータの種類(アウトカム)/連続変数、カテゴリカル変数、そして生存時間など

統計においては、対象となるデータが、連続変数なのかカテゴリカル変数なのか、あるいは、それ以外なのかを把握することがまず第一に重要です。

吉田2019「検定を選択する際のポイント」(p.95)では、アウトカム(比較したいデータ)を、次の3つに分類しています。
つまり、連続変数、カテゴリカル変数、そして生存時間です。
なお、カテゴリカル変数に属する順序尺度(下記)に関しては、そもそも「順序尺度でデータを取らない工夫」をした方がいいかな、とのこと。(吉田さんコメント)

神田2020「EZR(Easy R)のオフィシャル解説書」では、統計解析の対象を、次の3つに大別しています。
つまり、名義変数、連続変数、そして生存期間です。

また、「扱うデータの種類によって統計解析手法が異なる」(神田2020,p.6)として、扱うデータの種類を、次の3つに分類しています。
つまり、二値変数、連続変数、そして生存期間です。
ここで、名義変数には順序の関係がなく、性別(男・女)や判断(有効・無効)などのように二値だけを持つ場合を、特に二値変数としています。

要するに、EZRによる分類も、カテゴリカル変数(名義変数=>二値変数)、連続変数、そして生存期間の3分類と理解されます。(注:順序尺度は対象とされていない)

  • 扱うデータの種類によって統計解析手法が異なる(神田2020,p.6)
  • 検定を選択する際のポイント(吉田2019,p.95)
    対応の有無、アウトカム、正規性とは、群の数
  • 吉田寛輝著『いちばんやさしい医療統計』アトムス社(2019年)
  • 神田善伸著『EZRでやさしく学ぶ統計学』中外医学社(2020年)
  • 阿部真人著『統計学入門』ソシム社(2021年)
  • 文部省認定社会通信教育『現代統計実務講座 テキスト1』実務教育研究所(1965年)

関連URL及び電子書籍(アマゾンKindle版)

1)サリドマイド事件全般について、以下で概要をまとめています。
サリドマイド事件のあらまし(概要)
上記まとめ記事から各詳細ページにリンクを張っています。
(現在の詳細ページ数、20数ページ)

2)サリドマイド事件に関する全ページをまとめて電子出版しています。(アマゾンKindle版)
『サリドマイド事件(第7版)』
世界最大の薬害 日本の場合はどうだったのか(図表も入っています)

www.amazon.co.jp/ebook/dp/B00V2CRN9G/
2015年3月21日(電子書籍:Amazon Kindle版)
2016年11月5日(第2版発行)
2019年10月12日(第3版発行)
2020年05月20日(第4版発行)
2021年08月25日(第5版発行)
2022年03月10日(第6版発行)
2023年02月20日(第7版発行)、最新刷(2023/02/25)

本書は、『サリドマイド胎芽症診療ガイド2017』で参考書籍の一つに挙げられています。

Web管理人

山本明正(やまもと あきまさ)

1970年3月(昭和45)徳島大学薬学部卒(薬剤師)
1970年4月(昭和45)塩野義製薬株式会社 入社
2012年1月(平成24)定年後再雇用満期4年で退職
2012年2月(平成24)保険薬局薬剤師(フルタイム)
2023年1月(令和5)現在、保険薬局薬剤師(パートタイム)