ノンパラメトリックテストとは何ですか?
ノンパラメトリックテストは、正規分布を想定していない統計的仮説テストの一種です。 このため、ノンパラメトリックテストは分布のないものと呼ばれることがあります。 ノンパラメトリックテストは標準テストよりも堅牢であり、一般に小さなサンプルが必要であり、観測の際に影響を受ける可能性が低く、より少ない仮定で適用できます。 一方、ノンパラメトリックテストは、特に母集団が本当に正常に分布している場合、標準の対応物よりも効率が低くなります。 ノンパラメトリックテストは、頻度と割合を扱う質問に特に効果的です。
標準仮説テストでは、テスト母集団からサンプルを対照集団のサンプルと比較して、テスト母集団がコントロール母集団に統計的に匹敵するかどうかを判断します。 サンプルパラメーターまたはパラメーター(通常は平均および/または分散)の違いが十分に大きい場合、テストサンプルは、対照集団とは異なると判断できます。 このようなパラメトリックテストでは、パラメーターが正規分布から来る必要があります。
30以上のサンプルサイズが正規分布のように動作することが数学的に証明されているため、この要件は一般的に想定されています。 ただし、仮定が正当化されない場合、テストの結果は有効ではない可能性があります。 ノンパラメトリックテストは、この仮定を回避します。
代わりに、ノンパラメトリック仮説検定では、一般に、それを分類するか、注文することによってデータを調べます。 サンプルとコントロールの個体群が同じであり、データが正しく収集された場合、そのカテゴリまたはランキングの違いは厳密に偶然の結果です。 これらの違いがランダムなチャンスによって発生した可能性がp値とも呼ばれた可能性が、選択された重要な確率よりも少ない場合Ty、通常5%または1%のいずれかで、テスターはサンプルとコントロールの集団が同じであるという仮説を拒否し、それらが異なると結論付けます。
一般的なノンパラメトリックテストの1つは、観測された周波数または比率を比較するために使用されるカイ2乗検定です。 周波数のセットのみが調べられた場合、これはしばしば適合度テストと呼ばれ、観測された周波数が予想される範囲内に適合するかどうかを判断するために使用されます。 たとえば、適切なテストを使用して、ルーレットテーブルがテーブルの結果を予測する結果と比較することによって装備されたかどうかを判断することができます。 2つの周波数を調べると、カイ二乗ノンパラメトリックテストを使用して、相関または独立性をテストできます要因間。 政治的世論調査員は、社会、経済、または人口統計学的要因と、人の教育との相関があるかどうか、選出された役人がどのようにパフォーマンスしているかを承認するかどうかを見るなど、政治的信念の間の相関関係を求めてしばしば探します。
もう1つのノンパラメトリックテストは、Wilcoxonランク合計テストです。これは、通常、標準パラメトリック仮説検定と同じ状況で使用されます。 ただし、各サンプルの平均を調べる代わりに、Wilcoxonテストは、2つのサンプルが最小から最大まで順序付けられる場合、各値のランクを調べます。 2つのサンプルが同じ場合、各グループはランキングを通して均等に散在する必要があります。 1つのグループがランキングの下端または上端にクラスター化されている場合、これは2つのグループが異なることを示します。
たとえば、アニメーション映画がアニメーションされていない映画よりも長くて短いかどうかを誰かが決定したかったとします。 標準テストのために、彼または彼女はアニメーション映画のサンプルと実写ムービーのサンプルの平均期間は、違いをサンプルの分散と比較します。 Wilcoxonノンパラメトリックテストの場合、映画の時間は少なくとも整然と整理され、アニメーションの映画時間のランクが合計されます。
その人は、特定のランク合計で可能な順序付けの数を決定することにより、ランク合計がそのサイズ以下になる可能性を計算することができます。 それぞれ6本の映画の2つの小さなサンプルがあるため、ランキングの可能性のあるアレンジがすでに924個あり、映画が追加されるにつれて急速に大きくなる数があります。 あるいは、特定のサンプルサイズの特定のランク合計に対応する確率を与える公開されたテーブルがあります。 これらは統計テキストまたはオンラインで見つけることができます。
ノンパラメトリックテストは成長分野です。任意のものに適用できますより多くの従来の統計も同様に使用されている分野。 ただし、特に正規分布が適用できない場合は、社会科学と医学では特に一般的です。