ANOVA: これらの秘密を無視しないでください
ANOVA の秘密は、観測値の独立性、正規性、均一分散性といった仮定にあります。 有効な結果を得るには、ANOVA タイプの適切な選択、正確なサンプル サイズの計算、および注意深い事後分析が重要です。
ANOVA を含む統計検定の誤った適用は私たちが想定しているよりも蔓延しており、誤った結論に導く可能性があることをご存知ですか? 誤った発見が誤った決定をもたらす可能性があるため、これは憂慮すべきことです。 したがって、この罠に陥らないように、この記事をよく読んでください。
ハイライト
- ANOVA は、XNUMX つ以上のグループの平均を比較するために使用される統計検定です。
- 一元配置分散分析と反復測定分散分析は、最も一般的に使用されるタイプの分散分析です。
- 観察の独立性が損なわれると、分析に偏りが生じ、誤解を招く結果が生じる可能性があります。
- ANOVA の p 値が有意な場合、事後検定によりどのグループが異なるかを特定できます。
- ANOVA の誤用は一般的であり、多くの研究結果に疑問が生じます。
問題
この記事を読んで既視感を感じませんか? おそらく私たちの記事を読んだからでしょう。学生 T 検定: これらの秘密を無視しないでくださいに設立された地域オフィスに加えて、さらにローカルカスタマーサポートを提供できるようになります。」
平均値を比較するために使用されるこれら XNUMX つの検定には、多くの類似点があります。
前回の記事をまだ読んでいない場合は、この記事を読み終えた後に開いて、必要な比較を行うことをお勧めします。 読んだことがありましたら、この記事を比較とレビューの基礎として使用してください。
t 検定と同様に、ANOVA の可用性の広さとシンプルさは、理解しやすさと応用のしやすさと相まって、世界中で最も頻繁に使用される推論統計検定の XNUMX つとなっています。
しかし、この「普及」は、t検定と同様に、分析の誤った使用などの問題を引き起こしました。
最近のいくつか 体系的なレビュー記事 特定の種類の研究で出版された論文のほぼ 80% に、統計分析に誤りがあることが明らかになりました。
人類の問題の解決策がこれらの研究に依存していることが多いことを考えると、そのかなりの部分が誤って分析され、誤った結論につながる可能性があると考えると不安になります。
ANOVA を正しく実行するための「秘密」は複雑ではありません。
必要なのは、分析のいくつかの基本的な特性を理解することだけです。
ソリューション
ANOVA は分散分析の頭字語で、本質的には平均を比較するテストであり、3 つ以上のグループの平均が等しいかどうかを推測します。
通常、XNUMX つ以上のグループを比較するには ANOVA を使用し、XNUMX つのグループを比較するには t 検定を使用します。
ANOVA を適切かつ明確に適用するには、次の XNUMX つの手順が重要であるため、細心の注意を払ってください。
1. 適切な種類の ANOVA を特定する
最も頻繁に使用される ANOVA のタイプは次のとおりです。
一元配置分散分析
これは最も一般的なタイプで、XNUMX つ以上の独立したグループから取得したサンプルの平均が等しいかどうかを評価します。
より技術的に言えば、連続従属変数に対するカテゴリ独立変数の影響をチェックします。
たとえば、XNUMX 種類の異なる鳥の翼幅の平均が等しいかどうかを確認するために使用できます。
一元配置反復測定分散分析
このタイプは一元配置分散分析と同等ですが、XNUMX つ以上のグループ間のサンプルは依存しています。 つまり、サンプルはペアになっているか、関連しています。
たとえば、ある都市に住む年配の女性の平均血圧が変わらないかどうかを確認したいとします。
- 薬を飲んでからXNUMX時間後
- 薬を飲んでからXNUMX時間後
- 薬を飲んでからXNUMX時間後
ここでは、各女性の血圧が薬を服用してから XNUMX 時間後、XNUMX 時間後、XNUMX 時間後の XNUMX 回測定されるため、各サンプル単位のペアリングが行われます (被験者内測定値)。
その他の種類
この記事では、二元配置分散分析や二元配置反復測定分散分析などの他のタイプの分散分析については詳しく説明しません。
これら XNUMX つの分析の主な違いは、反復測定 ANOVA ではサンプルがペアになることです。
これらは一元配置分散分析の拡張を表し、連続従属変数に対する XNUMX つの独立したカテゴリ変数の影響をチェックします。
2. ANOVA のサンプル サイズの計算
使用する ANOVA の種類を決定したら、次のステップでは、研究に必要な被験者の数を決定します。
多くの場合、適切なサンプル サイズを達成すると、多くの統計的問題が軽減されます。
テストに適切なサンプル サイズを確認するには、統計テストによって異なる特定の計算を実行する必要があります。
ANOVA の場合は、調査対象の各母集団の平均値と標準偏差の概算または推定値が必要になります。
これらの値は、選択した ANOVA タイプに合わせて、統計ソフトウェア内のサンプル サイズ計算機に入力されます。
次に、ソフトウェアは収集する最適な被験者数を提供します。
しかし、これらの平均値と標準偏差はどこから来たのでしょうか?
通常、それらは以前のパイロット研究または同様の研究活動から得られます。
プロヒント: G*Power は、サンプル サイズの計算に使用できる優れた無料の統計ソフトウェアです。
3. 観察は独立している必要があります。
観測値の独立性は統計上の最も重要な仮定ですが、見落とされがちです。
この仮定に違反すると、偏った分析や誤解を招く結果が生じる可能性があるため、この仮定は ANOVA を含むすべての統計検定にとって重要です。
独立性を維持するには、サンプルの各要素が独立していることを確認してください。
ここではランダム性の概念が重要です。 研究に適した母集団からデータをランダムに収集すると、この仮定を支持するのに役立ちます。
たとえば、都市内の個人の無作為サンプルを使用して、都市の遺伝的プロファイルを特定する必要があります。 たとえば、XNUMX つの家族からのみサンプリングすると、それらの遺伝的プロファイルが密接に関連しているため、独立性の仮定に違反します。
4. 残差の正規性
ANOVA を含むすべてのパラメトリック推論分析では、残差 (誤差) の正規性の仮定が必要です。
残差は正規分布 (またはガウス分布) に従う必要があります。
Shapiro-Wilk 検定、Anderson-Darling 検定、Kolmogorov-Smirnov 検定などの統計検定は、残差がこの分布に適合するかどうかを確認するのに役立ちます。
これらのテストの結果を解釈するときは注意してください。 正規性の仮定の違反を示している場合は、次のオプションを検討してください。
-
サンプルサイズが適切であれば、正規性からの逸脱に対して堅牢であることを主張して、ANOVA を続行します。
-
データを変換し、正規性を再テストします。
-
t 検定と同等のノンパラメトリックを選択します。
最初のオプションは便利に見えるかもしれませんが、一般的にはお勧めできません。
通常、XNUMX 番目のオプションが追求されます。 正規性の仮定が違反され続ける場合は、XNUMX 番目のオプションをお勧めします。
パラメトリック テストとそれに相当するノンパラメトリックテスト:
- 一元配置分散分析 = クラスカル・ウォリス H検定。
- 一元配置反復測定 ANOVA = フリードマン検定
5. 残差の等分散性
このステップは、残差が正規性の仮定に適合した後にのみ必要になります。
均一分散性とは、サンプリングされた母集団間の分散が類似または均一であるという要件を指します。
F、Bartlett、Levene のテストなどのさまざまなテストで、この仮定の違反をチェックできます。
ただし、この前提に違反しても、通常は対処可能です。
データに不均一分散性 (不等分散) がある場合は、微調整 (Welch) を加えて ANOVA を実行できます。
ほとんどの統計プログラムの分析レポートは、この調整された ANOVA 結果を自動的に提供します。
6. ANOVA と事後テスト
ANOVA における有意な p 値は、少なくとも XNUMX 組の異なる平均を示します。
ただし、どのペアが異なるかは指定されていません。
事後テスト (事後 テスト) は、どのグループが大きく異なるかを判断するために使用されます。
分散が等しい(等分散)か不等(不分散)かに応じて、異なる事後検定が使用されます。
等しい分散を仮定する場合、一般的に使用される検定には、Tukey 検定 (HSD)、Bonferroni 検定、Scheffe 検定、および Duncan 検定が含まれます。
Games-Howell 検定、Tamhane の T2 検定、Dunnet の T3 検定、および Dunnet の C 検定は、不等分散に対してよく使用されます。
おすすめ記事
統計学と データ分析? 当社のブログで、関連トピックに関するその他の有益な記事をご覧ください。貴重な洞察と専門家のヒントを探究することで、知識を広げ、スキルを磨きましょう。ここをクリックして、今すぐ学習の旅を始めましょう。
よくある質問(FAQ)
Q1: 分散分析とは何ですか? これは、XNUMX つ以上のグループの平均を比較する統計検定です。
Q2: 最も一般的な ANOVA の種類は何ですか? 最も一般的なタイプは、一元配置分散分析と反復測定分散分析です。
Q3: ANOVA のサンプル サイズはどのように決定されますか? それには、統計ソフトウェアを通じて計算された、調査対象の各母集団からの推定平均値と標準偏差が必要です。
Q4: ANOVA における観測値の独立性の重要性は何ですか? これは ANOVA における重要な仮定です。 これに違反すると、分析に偏りが生じ、誤解を招く結果が生じる可能性があります。
Q5: ANOVA における残差の正規性とは何を意味しますか? これは、残差 (誤差) が正規分布に従う必要があることを意味します。 これはパラメトリック推論分析に必要です。
Q6: 残差の正規性はどのように確認できますか? これは、Shapiro-Wilk、Anderson-Darling、Kolmogorov-Smirnov などの正規性検定を使用して検証できます。
Q7: ANOVA における等分散性とは何ですか? これは、標準的な ANOVA を適用するには、サンプリングされた母集団の分散が類似している必要があることを意味します。
Q8: ANOVA の p 値が有意な場合はどうなりますか? 事後テストでは、有意な場合、どのグループが異なっているかを特定できます。
Q9: ANOVA を使用する際によくある間違いは何ですか? ANOVA の誤用は一般的であり、多くの場合、疑わしい研究結果につながります。
Q10: ANOVA を適切に使用するにはどうすればよいですか? XNUMX つの手順に従います: ANOVA タイプの選択、サンプル サイズの計算、ランダム サンプリングの実行、残差の正規性の確認、等分散性の確認、事後検定による ANOVA の実行。