[논문읽기/논문해석] One-way ANOVA, Logistic regression 논문통계 논문결과해석_일원배치 분산분석과 로지스틱 회귀분석
문은 왜 쓸까? 우리는 왜 연구를 할까?
연구자들을 질문에 대한 답을 찾기 위해 연구를 설계하고 논문을 쓴다.
모유수유와 비만에 상관관계가 있을까?
정말, 분유를 먹은 아기가 모유를 먹은 아기보다 비만이 될 위험이 높은가?
사실, 이러한 문제는 매우 민감하고 중요한 영유아의 건강에 대한 이슈이므로 국가기관에서 체계적인 자료를 수집하여 보고서나 논문을 발표하는 것이 일반적이다. 연구자들이라면 어떠한 이슈에 대하여 단순한 기사가 아닌 검증된 논문결과를 보고, 정확한 통계해석을 통하여 적절한 이슈인지 확인하는 과정이 필요하다.
오늘은 위의 문제에 대하여 전 국민을 대상으로 한 2008-2011년 국민건강영양조사자료를 이용하여 식약처와 한국보건산업진흥원에서 함께 발표한 논문을 소개하고자 한다. 이 연구에서는 모유 수유와 아동 비만의 상관관계를 알아보기 위해 WHO의 모유수유 권장기간이 24개월을 넘어선 유아 674명의 모유 수유 여부와 기간에 따른 유아기 비만 양상을 분석했다.
Yon, M., Lee, H. S., Kim, D., Lee, J., Nam, J., Moon, G. I., ... & Kim, C. I. (2013). Breast-feeding and Obesity in Early Childhood-Based on the KNHANES 2008 through 2011. Korean Journal of Community Nutrition, 18(6), 644-651.
<통계방법>
위의 연구에서 모유수유 여부, 수유형태, 수유기간 에 따른 과체중 및 비만 여부는 카이제곱검정(χ2)으로 분석했고, 체중군과 모유 수유 기간의 관계를 보기 위해 분산분석(ANOVA)과 로지스틱 회귀분석을 실시했다.
<결과>
이 연구에서는 그냥 모유수유한 그룹과 아닌 그룹의 출생 체중은 모두 약3.3Kg으로 유의적인 차이가 없다는 것을 확인하고, 영유아의 체중별로 평균 모유 수유 기간을 비교했다.
영아의 체중에 따른 모유수유 기간
위의 그림에서 보면, 비만군 유아의 평균 모유 수유 기간이 5.5개월로 정상체중이나 과체중 유아보다 통계적으로 유의하게 짧았다(p < 0.05).
이러한 세 가지 이상의 그룹의 평균치(이 연구에서는 모유 수유 기간의 평균값)를 비교할 때 사용하는 통계방법이 분산분석 (ANOVA) 이고, ANOVA에서는 독립변수인 그룹에 따라 종속변수의 평균에 차이가 있는지 분석하는 방법이다. (평균비교에서 ANOVA를 사용했다는 것은 정규성을 검정하여 모두검정을 했다는 것을 전제로 함)
그리고 ANOVA에서 p value가 0.05이하로 유의적인 결과가 도출되었을때, 3개 이상의 그룹 간에 각각 어떠한 차이가 있는지 확인하는 분석이 사후검정 이다.
이 연구에서는 사후검정으로 Duncan을 사용했고, 그 결과를 막대그래프의 수치 옆에 위첨자(superscript)로 나타냈다. 여기서 서로 다른 알파벳은 통계적으로 유의적인 차이가 있다는 것으로써, 여기에서 위첨자로 a가 표시된 과체중과 정상체중군의 수유기간이 위첨자로 b가 표시된 비만군보다 길다고 해석한다.
완전모유와 혼합수유의 모유수유기간 차이
그렇다면, 모유 수유의 기간이 비만과 매우 연관성이 있다는 의미이고,
연구자들은 실제 수유 유형별로 모유 수유 기간을 비교해 보았다.
그 결과, 평균적으로 완전모유 수유군 15.9 개월, 혼합 수유군에서는 7.0개월이었다. 구체적으로는 위의 그림에서 하늘색 화살표로 표시한 완전 모유 수유군에서는 12~14개월까지 수유하는 비율이 가장 높고, 혼합 수유군에서는 영아기 전반부까지 모유 수유를 하다가 이후 중단하고 있었다.
로지스틱 회귀분석을 통한 결과를 확인해보면,
모유 수유군의 비만 유병률은 5.4%, 조제유 수유군은 11.8%로 모유수유를 경험한 유아의 ‘비만’ 유병률이 유의하게 낮았다는 것을 의미한다(p = 0.0277).
(로지스틱 회귀분석은 종속변수가 종속변수가 이분형이나 그 이상으로 나누어지는 범주형 변수일 때 사용하는 회귀분석으로, 독립변수에서 1인 범주가 기준(Reference)일 때의 종속변수에 대한 범주의 위험도를 상대적인 수치(Odds ratio)로 표현하는 것이다. 예를 들어, “지금 모유수유군은 그렇지 않은 군보다 비만일 #오즈비 가 0.43배 낮다.”라고 해석할 수 있다.
그리고 모유 수유군을 완전모유 수유군과 혼합수유군으로 구분했을 때는 조제유 수유아에 비해 완전 모유 수유아에서 유의하게 ‘과체중 및 비만’과 ‘비만’ 유병률이 낮았으며(CI에 기준인 1이 포함되지 않았음으로 유의적임), 혼합수유군은 조제유 수유군과 차이가 없었다(CI에 기준이 1이 포함되어 유의적인 차이 없음).
[논문읽기/통계해석] 일원배치 분산분석과 로지스틱 회귀분석 결과표 해석하기_분유를 먹은 아기가 모유를 먹은 아기보다 비만이 될 위험이 높은가?
그리고 마지막으로 모유수유 기간이 길어질수록 ‘과체중 및 비만’과 ‘비만’ 유병률이 낮아지는 것으로 나타났다.
그리고 결과표를 가져오진 않았으나, 모유를 12개월 미만 섭취한 경우에 비하여 12개월 이상 섭취한 유아에서는 비만 위험 오즈비가 0.29(95% CI 0.13~0.65)로 유의하게 낮았고, 그 중 완전 모유 수유 기간이 12개월 이상인 유아에서는 0.28(95%CI 0.11~0.73)로 매우 낮은 결과가 있었다.
결과적으로 위의 논문에서는 우리나라에서 모유수유 여부와 모유 수유 기간 모두가 유아기 비만에 영향을 미치는 인자로 판단된다고 보고했다. 그래서 현재 ‘한국인을 위한 식생활지침’ 에서 ‘생후 6개월까지는 반드시 모유를 먹이자’와 ‘생후 2년까지 모유를 먹이면 더욱 좋습니다’라는 내용이 적절하다고 발표했다.
이렇듯 국가적인 보건 이슈들은 이를 검증하기 위한 연구들이 수행된다. 연구자들이라면 어떠한 이슈에 대하여 단순한 기사가 아닌 검증된 연구결과를 참고하여 적절한 기준을 찾는 것이 중요하다.
앞으로도 이러한 이슈에 대해 논문을 통해 알아보는 시간이 더 있었으면 좋겠다.
그리고 혼자 논문에 대해 공부하기에 너무 기초가 부족하다고 생각되면,
기초 논문읽기와 해석 수업을 들어보라고 추천한다.
클래스유 '논문의 모든 것' 클래스(5만원/1개월 수강권)에서는
논문에 대한 클래식한 기본 꿀팁부터 논문관련 인공지능에 대한 최신 강의까지 들을 수 있다.
그리고 통계 방법별로 논문결과를 해석하는 방법을 알 수 있도록 에이앤피랩 연구소 박사들이 만든 커리큘럼이기 때문에 대학원 신입생이나 연구원들에게 추천 한다.
그리고 논문은 본인 전공과 경험에 따라서 읽고 해석하는데에 필요한 수업이 다르니, 많이 찾아보고 책이나 수업을 선택해보면 좋을 것 같다.
[통계청 통계교육원] 논문통계를 위한 엑셀 통계, SAS, SPSS, R, 파이썬 통계 무료 수업듣고 수료증 받기 (0) | 2024.03.13 |
---|---|
[논문통계 회귀분석 해석] 다중 로지스틱 회귀분석, 라오스콧 카이제곱 검정, t-test_아동비만 영향요인에 대한 다중 Logistic regr (0) | 2023.10.14 |
[SPSS 논문통계] 비모수검정_윌콕슨 부호순위 검정 (Wilcoxon signed ranks test) 결과해석_재활치료 실험연구 (0) | 2023.10.14 |
[SPSS 논문통계] 일원배치 분산분석(one-way ANOVA)과 사후검정_분석 해석 예시 (8) | 2023.10.14 |
[SPSS 논문통계] 생존분석 (COX regression)_생존율에 영향을 미치는 요인 (2) | 2023.10.13 |