ノンパラメトリック検定とは何ですか?
ノンパラメトリック検定は、正規分布を前提としない統計的仮説検定の一種です。 このため、ノンパラメトリックテストは、配布なしと呼ばれることがあります。 ノンパラメトリック検定は、標準検定よりも堅牢であり、通常、より小さなサンプルが必要であり、外れた観測による影響を受ける可能性が低く、より少ない仮定で適用できます。 一方、ノンパラメトリック検定は、特に母集団が本当に正規分布している場合、標準の検定よりも効率が低下する可能性があります。 ノンパラメトリックテストは、頻度と割合を扱う質問に特に効果的です。
標準的な仮説検定では、検定母集団のサンプルと対照母集団のサンプルを比較して、検定母集団が統計的に対照母集団に匹敵するかどうかを判断します。 1つまたは複数のサンプルパラメーターの差(通常は平均および/または分散)が十分に大きい場合、テストサンプルは対照母集団とは異なると判断できます。 このようなパラメトリックテストでは、パラメーターが正規分布からのものであることが必要です。
30以上のサンプルサイズがほぼ正規分布のように動作することが数学的に証明されているため、この要件は一般に想定されています。 ただし、仮定が正当化されない場合、テストの結果は有効ではない可能性があります。 ノンパラメトリックテストは、この仮定を回避します。
代わりに、ノンパラメトリック仮説検定では、一般的にデータを分類または順序付けして調べます。 サンプル母集団と対照母集団が同じで、データが正しく収集された場合、それらのカテゴリーまたはランキングの違いは、厳密に偶然の結果です。 これらの差が偶然に発生する可能性がある確率(P値とも呼ばれる)が、選択された有意確率(通常5パーセントまたは1パーセント)よりも小さい場合、テスターは、サンプルとコントロールの母集団が同じであり、それらは異なると結論付けます。
一般的なノンパラメトリック検定の1つは、観測された頻度または割合を比較するために使用されるカイ2乗検定です。 1セットの周波数のみを検査する場合、これはしばしば適合度テストと呼ばれ、観測された周波数が期待される範囲内に収まるかどうかを判断するために使用されます。 たとえば、適合度テストを使用して、テーブルの結果を確率理論が予測する結果と比較することでルーレットテーブルがリグされたかどうかを判断したり、頭痛のある人の割合を比較して頭痛薬が有効かどうかを判断したりできます彼らはプラセボを服用したときに頭痛が改善した人々の割合に薬を改善しました。 2つの周波数を調べる場合、カイ2乗ノンパラメトリック検定を使用して、因子間の相関または独立性を検定できます。 政治投票者は、社会的、経済的、人口統計学的要因と政治的信念の間の相関関係を探すことがよくあります。
別のノンパラメトリック検定はウィルコクソンのランクサム検定です。これは一般に、標準のパラメトリック仮説検定と同じ状況で使用されます。 ただし、ウィルコクソン検定では、各サンプルの平均を調べる代わりに、2つのサンプルが最小から最大の順に並べられている場合、各値のランクを調べます。 2つのサンプルが同じ場合、各グループはランキング全体に均等に散らばっている必要があります。 1つのグループがランキングの下限または上限でクラスター化されている場合、これは2つのグループが異なることを示します。
たとえば、アニメーション化された映画がアニメーション化されていない映画よりも長いか短いかを判断したいとします。 標準的なテストでは、アニメーション映画のサンプルと実写映画のサンプルの平均時間を決定し、その差をサンプルの分散と比較します。 Wilcoxonノンパラメトリックテストの場合、映画の時間は最小から最大の順に並べられ、アニメーション化された映画の時間のランクが合計されます。
人は、所定のランク合計と可能な順序付けの合計数で可能な順序付けの数を決定することにより、ランク合計がそのサイズ以下になる確率を計算できます。 それぞれ6つの映画の2つの小さなサンプルで、すでに924の可能なランキングの配置があり、映画が追加されるにつれて急速に大きくなる数があります。 または、特定のサンプルサイズの特定のランクサムに対応する確率を示す公開されたテーブルがあります。 これらは、統計テキストまたはオンラインで見つけることができます。
ノンパラメトリックテストは成長分野です。 より一般的な統計が使用されているあらゆる分野にも適用できます。 ただし、特に正規分布が適用できない場合、社会科学と医学では特に適用が一般的です。