【初心者向け】第一種の過誤と第二種の過誤とは?統計的仮説検定のワナを徹底解説

はじめに:判断に潜む「間違い」

何かを判断するとき、私たちは常に正しい結論を出せるとは限りません。特に、データに基づいて「効果があるか、ないか」「異常があるか、ないか」などを判断する統計的仮説検定の世界では、意図せず間違った結論を導いてしまう可能性があります。 このような判断の誤りを「過誤(エラー)」と呼びます。

過誤には大きく分けて2つの種類があり、それぞれ「第一種の過誤」「第二種の過誤」と呼ばれています。 これらは、何かを見つけるためのテストや検査において、どのような間違いを犯したかを示しています。この記事では、この2種類の過誤について、初心者の方にも分かりやすく解説していきます。

第一種の過誤 (Type I Error) とは?

第一種の過誤は、別名「偽陽性(ぎようせい、False Positive)」や「あわてんぼうの誤り」とも呼ばれます。 これは、「本当は差や効果がないのに、あると判断してしまう間違い」のことです。

統計的仮説検定では、まず「差はない(効果はない)」という仮説(帰無仮説)を立てます。 第一種の過誤は、この帰無仮説が正しいにもかかわらず、それを誤って棄却(否定)してしまうケースです。

第一種の過誤の具体例

  • 医療診断: 健康な人なのに、検査で「病気の疑いあり(陽性)」と誤って診断してしまう。
  • 迷惑メールフィルタ: 大事なメールなのに、迷惑メールだと誤って判断し、スパムフォルダに入れてしまう。
  • 品質管理: 問題のない製品なのに、「不良品だ」と誤って判定し、廃棄してしまう。
  • A/Bテスト: 新しいデザインに変更しても売上は変わらないのに、「効果があった」と誤って結論づけてしまう。

第一種の過誤が起こる確率を有意水準 (α, アルファ) と呼び、通常は5% (0.05) や1% (0.01) といった低い値に設定されます。 つまり、有意水準を5%に設定するということは、「本当は差がなくても、100回に5回は『差がある』と間違ってしまう可能性を許容する」という意味になります。

第二種の過誤 (Type II Error) とは?

第二種の過誤は、別名「偽陰性(ぎいんせい、False Negative)」や「ぼんやりさんの誤り」とも呼ばれます。 これは、「本当は差や効果があるのに、それを見逃してしまう(ないと判断してしまう)間違い」のことです。

つまり、本来は棄却されるべき誤った帰無仮説(「差はない」という仮説)を、誤って採択してしまう(受け入れてしまう)ケースを指します。

第二種の過誤の具体例

  • 医療診断: 病気にかかっているのに、検査で「異常なし(陰性)」と誤って診断され、病気が見逃されてしまう。
  • 迷惑メールフィルタ: 明らかに迷惑メールなのに、通常のメールだと判断し、受信トレイに入れてしまう。
  • 品質管理: 不良品なのに、「問題なし」と判断してしまい、市場に出荷してしまう。
  • サイバーセキュリティ: システムに脆弱性が存在するのに、スキャンで「脆弱性なし」と報告されてしまい、攻撃のリスクが残る。

第二種の過誤が起こる確率をβ (ベータ) と呼びます。 そして、第二種の過誤を犯さずに、正しく「差や効果がある」ことを見つけ出す確率 (1 – β) を検出力 (Power) といいます。 検出力が高いほど、見逃しの少ない、精度の高い検定と言えます。

違いのまとめとトレードオフの関係

第一種の過誤と第二種の過誤の違いを、裁判の例えを使って表にまとめてみましょう。ここでの帰無仮説は「被告人は無罪」です。

真実:無罪真実:有罪
判決:無罪正しい判断 (真陰性)第二種の過誤 (偽陰性)
(有罪の人を見逃す)
判決:有罪第一種の過誤 (偽陽性)
(無実の人を罰する)
正しい判断 (真陽性)

トレードオフの関係

重要なのは、第一種の過誤と第二種の過誤はトレードオフの関係にあるということです。 つまり、片方の過誤を減らそうとすると、もう片方の過誤が増える傾向にあります。

例えば、裁判で「絶対に冤罪(第一種の過誤)を出さないようにしよう」と考え、有罪の証拠を非常に厳しくすると、本当に有罪の人物(真犯人)を無罪としてしまう(第二種の過誤)可能性が高まります。

逆に、病気のスクリーニング検査で「一人でも病気の人を見逃したくない(第二種の過誤を減らしたい)」と考え、少しでも怪しければ陽性とするように基準を緩めると、健康な人を誤って「陽性」と判断してしまう(第一種の過誤)ことが増えます。

どちらの過誤を避けるべきか?

どちらの過誤がより深刻かは、状況によって全く異なります。

  • 第一種の過誤を避けたいケース:

    誤った判断(偽陽性)が重大なコストや副作用を伴う場合です。例えば、副作用の強い新薬の承認審査では、「効果がないのに『効果あり』と判断する(第一種の過誤)」ことは、多くの人に健康被害を与えるリスクがあるため、絶対に避けなければなりません。

  • 第二種の過誤を避けたいケース:

    見逃し(偽陰性)が致命的な結果につながる場合です。例えば、がんの早期発見スクリーニングや、工場の致命的な欠陥の検査では、「がんや欠陥があるのに『ない』と判断する(第二種の過誤)」ことは、命に関わったり、大事故につながったりする可能性があるため、何としても避けたいと考えます。

このように、検定の目的や、誤った判断がもたらすリスクを考慮して、どちらの過誤をより重視するかを決定することが重要です。

まとめ

今回は、統計的仮説検定における「第一種の過誤」と「第二種の過誤」について解説しました。

  • 第一種の過誤 (偽陽性): 本当はないのに「ある」と間違える。「あわてんぼうの誤り」。
  • 第二種の過誤 (偽陰性): 本当はあるのに「ない」と見逃す。「ぼんやりさんの誤り」。
  • 両者はトレードオフの関係にあり、片方を減らすともう一方が増えやすい。
  • どちらを避けるべきかは、その判断がもたらす結果の重大さによって異なる。

データに基づいた意思決定がますます重要になる現代において、これらの「過誤」の概念を理解することは、データを正しく解釈し、より良い判断を下すための第一歩となります。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です