논문을 교정하고, 통계분석을 하는 에디터 업무를 하다보면,
이 논문의 내용이 제대로 된 것인지,
이 논문의 통계 방법이 적합한 것이 확인하기 위해 다양한 전공의 논문을 읽어야 한다.
그렇기 때문에,
논문을 최대한 빨리, 내가 원하는 내용을 찾아 읽어내야 한다.
그러기 위해서는 논문의 결과표만 보고도 전반적인 연구설계나 통계방법을 파악해내는 연습이 많이 필요한 것 같다.
오늘은 논문통계에서 가장 많이 사용하는 카이제곱 검정, 아노바, 로지스틱 회귀분석을 이용한 논문을 리뷰하면서 결과표를 해석하는 연습을 해보고자 한다.
오늘 리뷰해 볼 논문의 주제,
분유를 먹은 아기가 모유를 먹은 아기보다 비만이 될 위험이 높은가?
이러한 국가적인 보건 이슈들은 이러한 질문에 대한 답을 찾기 위해 연구를 설계한다.
사실, 이러한 문제는 매우 민감하고 중요한 영유아의 건강에 대한 이슈이므로 국가 기관에서 체계적인 자료를 수집하여 보고서나 논문을 발표하는 것이 일반적이다.
연구자들이라면 어떠한 이슈에 대하여 단순한 기사가 아닌 검증된 논문 결과를 보고, 정확한 통계 해석을 통하여 적절한 이슈인지 확인하는 과정이 필요하다.
오늘은 위의 문제에 대하여 전 국민을 대상으로 한 2008-2011년 국민건강영양조사자료를 이용하여 식약처와 한국보건산업진흥원에서 함께 발표한 논문을 소개하고자 한다.
(수유와 비만에 대한 연구들은 이미 2000년대 후반에 많이 이루어졌다)
이 연구에서는 모유 수유와 아동 비만의 상관 관계를 알아보기 위해 WHO의 모유 수유 권장 기간이 24개월을 넘어선 유아 674명의 모유 수유 여부와 기간에 따른 유아기 비만 양상을 분석했다.
Yon, M., Lee, H. S., Kim, D., Lee, J., Nam, J., Moon, G. I., ... & Kim, C. I. (2013). Breast-eeding and Obesity in Early Childhood-Based on the KNHANES 2008 through 2011. Korean Journal of Community Nutrition, 18(6), 644-651.
https://me2.do/FfMPkFja
<통계방법>
위의 연구에서 모유수유 여부, 수유형태, 수유기간 에 따른 과체중 및 비만 여부는 카이제곱 검정(χ2)으로 분석했고, 체중군과 모유 수유 기간의 관계를 보기 위해 분산분석 (ANOVA)과 로지스틱 회귀분석을 실시했다.
<결과>
이 연구에서는 그냥 모유 수유한 그룹과 아닌 그룹의 출생 체중은 모두 약 3.3Kg으로 유의적인 차이가 없다는 것을 확인하고, 영유아의 체중에 따른 평균 모유 수유 기간을 비교했다.
위의 그림에서 초록색 화살표를 보면, 비만군 유아의 평균 모유 수유 기간이 5.5개월로 정상체중이나 과체중 유아보다 통계적으로 유의하게 짧았다(p < 0.05).
이러한 세개 이상인 그룹의
평균치(이 연구에서는 모유 수유 기간의 평균값)를 비교할 때 사용하는 통계방법이 분산분석이고,
ANOVA에서는 독립변수인 그룹에 따라 종속변수의 평균에 차이가 있는지 분석하는 방법이다.
(평균비교에서 ANOVA를 사용했다는 것은 정규성을 검정하여 모두검정을 했다는 것을 전제로 함)
그리고 ANOVA에서 p value가 0.05이하로 유의적인 결과가 도출되었을때,
3개 이상의 그룹 간에 각각 어떠한 차이가 있는지 확인하는 분석이 사후검정이다.
하늘색 화살표를 보면, 이 연구에서는 사후검정으로 Duncan 을 사용했고,
그 결과를 막대그래프의 수치 옆에 위첨자(superscript)로 나타냈다. 여기서 서로 다른 알파벳은 통계적으로 유의적인 차이가 있다는 것으로써,
여기에서 위첨자로 a가 표시된 과체중과 정상체중군의 수유기간이 위첨자로 b가 표시된 비만군보다 길다고 해석한다.
그렇다면, 모유 수유의 기간이 비만과 매우 연관성이 있다는 의미이고,
연구자들은 실제 수유 유형별로 모유 수유 기간을 비교해 보았다.
그 결과, 평균적으로 완전모유 수유군 15.9 개월, 혼합 수유군에서는 7.0개월이었다.
구체적으로는 위의 그림에서,
하늘색 화살표로 표시한 완전 모유 수유군에서는 12~14개월까지 수유하는 비율이 가장 높고,
초록색 화살표로 표시한 혼합 수유군에서는 영아기 전반부까지 모유 수유를 하다가 이후 중단하고 있었다.
하늘색 화살표에 표시된 모유 수유군의 비만 유병률은 5.4%,
조제유 수유군은 11.8%로 모유수유를 경험한 유아의 ‘비만’ 유병률이
유의하게 낮았다는 것을 의미한다(p = 0.0277).
(로지스틱 회귀분석은 종속변수가 종속변수가 이분형이나 그 이상으로 나누어지는 범주형 변수일 때 사용하는 회귀분석으로, 독립변수에서 1인 범주가 기준(Reference)일 때의 종속변수에 대한 범주의 위험도를 상대적인 수치(Odds ratio)로 표현하는 것이다.
예를 들어, “지금 모유수유군은 그렇지 않은 군보다 비만일 #오즈비 가 0.43배 낮다.”라고 해석할 수 있다.
그리고 초록색 화살표를 보면, 모유 수유군을 완전모유 수유군과 혼합수유군으로 구분했을 때는 조제유 수유아에 비해 완전 모유 수유아에서 유의하게 ‘과체중 및 비만’과 ‘비만’ 유병률이 낮았으며(CI에 기준인 1이 포함되지 않았음으로 유의적임), 혼합수유군은 조제유 수유군과 차이가 없었다(CI에 기준이 1이 포함되어 유의적인 차이 없음).
그리고 마지막으로 모유수유 기간이 길어질수록 ‘과체중 및 비만’과 ‘비만’ 유병률이 낮아지는 것으로 나타났다. 그리고 결과표를 가져오진 않았으나, 모유를 12개월 미만 섭취한 경우에 비하여 12개월 이상 섭취한 유아에서는 비만 위험 오즈비가 0.29(95% CI 0.13~0.65)로 유의하게 낮았고, 그 중 완전 모유 수유 기간이 12개월 이상인 유아에서는 0.28(95%CI 0.11~0.73)로 매우 낮은 결과가 있었다.
결과적으로 위의 논문에서는 우리나라에서 모유수유 여부와 모유 수유 기간 모두가 유아기 비만에 영향을 미치는 인자로 판단된다고 보고했다. 그래서 현재 ‘한국인을 위한 식생활지침’ 에서 ‘생후 6개월까지는 반드시 모유를 먹이자’와 ‘생후 2년까지 모유를 먹이면 더욱 좋습니다’라는 내용이 적절하다고 발표했다.
이렇게 논문의 결과표를 보고 통계 결과를 해석하는 연습을 꾸준히 한다면,
연구 설계나 논문통계에 대한 많이 경험이 쌓이게 되고,
실제 본인의 논문을 쓰거나, 누군가의 논문을 검토하는데 큰 도움이 되는 것 같다.
https://me2.do/FfMPkFja
[SPSS 논문통계] 일원배치 분산분석(one-way ANOVA)과 사후검정_분석 해석 예시 (8) | 2023.10.14 |
---|---|
[SPSS 논문통계] 생존분석 (COX regression)_생존율에 영향을 미치는 요인 (2) | 2023.10.13 |
[논문통계 SPSS] ROC 커브 (Receiver Operating Characteristic curve)_AUC 판정기준 (0) | 2023.10.13 |
[논문통계] 논문에서 유의수준 P값의 의미가 도대체 뭘까? (0) | 2023.10.11 |
[설문지 입력/코딩] 논문통계 준비하기_엑셀로 설문결과 코딩하기 (0) | 2023.10.11 |