비모수통계(Nonparametric Statistics)

비모수통계(Nonparametric Statistics)는 데이터의 분포에 대해 특정한 가정을 하지 않고 분석하는 통계 방법입니다. 비모수 통계는 데이터가 정규 분포를 따르지 않거나, 데이터의 분포를 알 수 없는 경우에 유용합니다. 이러한 분석 방법은 데이터의 순위나 범위를 이용하여 통계적 검정을 수행합니다.

비모수 통계 분석 방법

중앙값 검정 (Median Test)

  • 두 그룹의 중앙값이 같은지 비교하는 검정 방법입니다.
  • 예: Mann-Whitney U 테스트, Wilcoxon 순위합 검정.

분산 분석 (ANOVA) 대신 사용하는 방법

  • 여러 그룹 간의 차이를 비교할 때 사용합니다.
  • 예: Kruskal-Wallis H 검정.

일치성 검정 (Test of Concordance)

  • 순위 데이터 간의 일치성을 평가합니다.
  • 예: Kendall의 순위 상관계수, Spearman의 순위 상관계수.
  1. 독립성 검정 (Test of Independence)
  • 두 범주형 변수 간의 독립성을 검정합니다.
  • 예: Chi-square 테스트, Fisher의 정확 검정.

주요 비모수 검정 방법

Mann-Whitney U 테스트 (Wilcoxon Rank-Sum Test)

  • 두 독립적인 샘플의 중앙값을 비교하는 데 사용됩니다.
  • 정규성을 가정하지 않으며, 두 그룹의 데이터가 동일한 분포를 가지는지 검정합니다.

Wilcoxon 부호 순위 검정 (Wilcoxon Signed-Rank Test)

  • 두 관련 샘플(쌍으로 된 데이터)의 차이에 대한 중앙값을 비교합니다.
  • 정규성을 가정하지 않으며, 쌍으로 된 데이터의 차이가 중앙값 0인지 검정합니다.

Kruskal-Wallis H 검정

  • 세 개 이상의 독립적인 그룹의 중앙값을 비교하는 데 사용됩니다.
  • 정규성을 가정하지 않으며, ANOVA의 비모수 대안입니다.

Friedman 검정

  • 세 개 이상의 관련 샘플의 차이를 비교하는 데 사용됩니다.
  • 반복 측정된 데이터를 분석할 때 유용하며, 분산 분석의 비모수 대안입니다.

Chi-square 테스트

  • 두 범주형 변수 간의 독립성을 검정합니다.
  • 관찰된 빈도와 기대된 빈도를 비교하여 변수 간의 연관성을 평가합니다.

Spearman의 순위 상관계수

  • 두 변수 간의 단조 관계를 측정합니다.
  • Pearson 상관계수의 비모수 대안으로, 데이터가 정규 분포를 따르지 않을 때 사용됩니다.

비모수 분포

비모수 통계에서는 데이터의 분포를 가정하지 않지만, 자주 사용되는 비모수 분포는 다음과 같습니다:

균등 분포 (Uniform Distribution)

  • 데이터가 동일한 확률로 발생하는 분포입니다.
  • 예: 주사위 던지기 결과.

이항 분포 (Binomial Distribution)

  • 두 가지 가능한 결과(성공/실패) 중 하나를 나타내는 분포입니다.
  • 예: 동전 던지기 결과.

포아송 분포 (Poisson Distribution)

  • 일정 시간 동안 발생하는 사건의 수를 나타내는 분포입니다.
  • 예: 일정 시간 동안 도착하는 전화의 수.

비모수 통계 방법은 데이터의 분포에 대한 가정이 필요 없기 때문에, 다양한 실제 데이터 분석에서 유용하게 사용됩니다. 특히, 데이터가 정규 분포를 따르지 않거나 샘플 크기가 작을 때 강력한 도구가 됩니다.

위 그림은 비모수 통계 분석과 관련된 다양한 분포와 검정 결과를 시각화한 것입니다.

  • 균등 분포 (Uniform Distribution): 왼쪽 위 그래프는 0에서 10 사이의 균등 분포를 따르는 데이터를 시각화한 것입니다.
  • 이항 분포 (Binomial Distribution): 오른쪽 위 그래프는 10번의 시도에서 성공 확률이 0.5인 이항 분포를 따르는 데이터를 시각화한 것입니다.
  • 포아송 분포 (Poisson Distribution): 왼쪽 아래 그래프는 평균이 3인 포아송 분포를 따르는 데이터를 시각화한 것입니다.
  • Mann-Whitney U Test: 오른쪽 아래 그래프는 두 그룹의 데이터를 비교한 결과입니다. Group 1은 0에서 10 사이의 균등 분포를 따르고, Group 2는 5에서 15 사이의 균등 분포를 따릅니다. Mann-Whitney U 테스트의 통계량과 p-값도 그래프 제목에 표시되어 있습니다.

이 시각화는 비모수 통계 분석에서 다양한 분포와 두 그룹 간의 차이를 평가하는 방법을 잘 보여줍니다.