誤発見率とは何ですか?
誤検出率(FDR)は、偽陽性であると予想される結果の数の統計的予測です。 これにより、研究者はデータを分析して、統計的に意味があるか価値がないかを判断できます。 プロジェクトの種類によっては、他の調査結果がまだ有効で有用である可能性があるため、高い誤検出率に対する高い許容度があります。 研究者は通常、調査結果の統計分析を提示し、研究のプレゼンテーションでこれについて議論します。
この概念は、意味のある有効な結果が得られる確率の推定値であるp値に関連しています。 p値が小さいということは、データが一意であるという統計的確率が低いため、データがそれほど意味がないことを示しています。 たとえば、誰かが3色のボールが入っている袋から色の付いたボールを引き出している場合、その人は各色のほぼ同じ数を引き出すと予想します。 20個のボールが描かれ、そのうちの10個が同じ色である場合、これは統計的に考えられないでしょう。 p値を見つけるために、研究者は統計分析を実行して、20ボールの引き分けで同じ色の10個のボールを引く可能性を判断できます。
誤検出率の場合、p値よりも寛容です。 結果が実際に一意であるという統計的確率を調べるのではなく、結果で見つかる可能性のある誤検知の数を調べます。 多数の誤検知が依然として有用なデータをもたらす可能性があります。 研究者は、偽陽性を特定して結果から除外できる必要がありますが、残りの情報は非常に重要です。
多数の計算を使用して、誤検出率を決定できます。 研究者が実験を設定したときにこの割合が高いことがわかった場合、それを制御するためにいくつかの調整を行うことがあります。 これには、より多くのサンプルを取得して誤検出の数を減らすなど、研究の方法論の変更が含まれる場合があります。 このプロセスのエラーが実験に問題を引き起こす可能性があるため、綿密な研究デザインが非常に重要です。
誤検出率の計算を支援するコンピュータープログラムが利用可能です。 それらを手作業で実行することもできます。 研究方法論を開発する過程で、実験を進める前に、研究者はいくつかの計算を行って設計の明らかな欠陥を特定する場合があります。 これは、彼らが弱点を見つけ、それらに対処して、実験を可能な限り強力かつ有用にするために役立ちます。