[논문통계 회귀분석 해석] 다중 로지스틱 회귀분석, 라오스콧 카이제곱 검정, t-test_아동비만 영향요인에 대한 다중 Logistic regr
오늘은 아동과 부모의 어떠한 요인이 아동 비만에 영향을 줄 수 있는지 알아본 연구를 통하여,
로지스틱 회귀분석을 포함한 몇 가지 통계 분석 방법별 결과 해석을 살펴보고자 한다.
어떤 특성을 가진 아동이 비만의 위험이 높은가?
그리고 아동 비만에 영향을 미치는 요인이 무엇인가?
로지스틱 회귀분석은 선형 회귀분석과 함께
논문통계에서 최종결과를 도출하는 방법으로 가장 많이 사용되는 통계기법이다.
로지스틱 회귀분석은
종속변수가 이분형(Yes or No)이나 그 이상으로 나누어지는 범주형 변수(level 1, 2, 3)일 때 사용하는 회귀분석으로,
독립변수에서 1인 범주가 기준(Reference)일 때의 종속변수에 대한 범주의 위험도를 상대적인 수치(Odds ratio)로 표현하는 것이다.
그래서 그 결과 해석을 아래와 같이 할 수 있다.
예문)
"OO을 적게 먹는 아동의 비만 발생 위험이 OO을 많이 먹는 사람보다 보다 2.78배(95% CI: 1.27-6.09, p =.011) 높다"
"OO아 1씩 증가할수록 아동의 비만 발생 위험은 1.18배(95% CI: 1.09-1.28, p <.001) 높아진다"
이전에 유아의 모유수유와 비만에 대해서 포스팅 할 때에도 이러한 문제는 매우 민감하고 중요한 보건 이슈이므로 국가 기관에서 체계적인 자료를 수집하여 보고서나 논문을 발표하는 것이 일반적이라고 언급했다.
https://blog.naver.com/privatalab/221870780385
오늘은 아동의 비만 문제에 대하여 서울대학교 간호학과에서 전국민을 대상으로 한 2013-2014년 국민건강영양조사자료를 이용하여 분석한 논문을 소개하고자 한다.
Hwang, I., Bang, K. S., Hwang, I., & Bang, K. S. (2016). Factors affecting obesity and overweight in Korean preschool children: Based on the Korea national health and nutrition examination survey 2013-2014. Child Health Nursing Research, 22(4), 237-246.
국민건강영양조사 지침서와 자료는 아래의 홈페이지에서 확인해볼 수 있다.
https://www.seoulnutri.co.kr/food-db/108.do?curPage=3
이 연구에서는 정상체중 이하인 집단과 과체중 이상인 집단으로 나누어 아동의 특성들을 비교해 보았다. 그 결과, 아침식사 빈도, 출생 시 체중, 수유 형태와 아동의 특성 중 가구 특성에 해당하는 가구의 소득, 주택 형태, 식생활 형편은 정상체중 이하 인 집단과 과체중 이상인 집단 사이에는 유의한 차이가 없었다.
초록색 화살표에 표시된 라오-스콧(Rao-Scott) 카이제곱 검정 결과, 아동의 주관적 건강상태(p =.002), 알레르기성 질환(아토피피부염, 알레르기비염, 천식 중 하나 이상 질환) 진단 여부(p =.034), 외식 횟수(p =.049)에서 유의한 차이를 보였다.
그리고 이 연구에서는 Rao-Scott Chi-Square test는 교차검정의 한 종류로써,
어떠한 요인의 교차검정에 있어서 자료를 단순임의추출분석과 단일표본분석을 통하여 분석하는 경우에는 우리가 잘 알고있는 피어슨카이제곱 검정(Pearson chi-square test)을 사용하고, 이 연구와 같은 복합표본 분석에서는 라오-스콧카이제곱 검정(Rao-scott chi-square test)으로 분석하는 것이 일반적이다.
그것은 단순임의표본분석과 복합표본분석에 사용되는 통계기법에는 차이가 있기 때문으로, 복합표본설계에 의한 범주형 자료의 경우 피어슨 카이제곱검정에 필요한 조건을 만족하지 못하여 검정력을 증가시키므로 라오-스콧(Rao-Scott) 카이제곱검정을 해야 한다.
그리고 t-test로 과체중 이상인 아동 그룹과 정상체중 이하인 그룹의 식품섭취를 확인해 보았을 때,
초록색 화살표에 표시된 1일 칼슘섭취량(p =.023), 티아민섭취량(p =.004)과 나트륨섭취량 (p =.038)이 정상체중 이하인 집단보다 유의하게 높았다.
그 외에 식품섭취량, 에너지섭취량, 탄수화물섭취량, 단백질섭취량, 지방섭취량의 평균은 과체중 이상인 군이 정상체중 이하인 군보다 높았지만, 통계적으로 유의한 차이를 없었다.
이렇게 두 그룹의 평균치(이 연구에서는 식품섭취 평균값)를 비교할 때 사용하는 통계방법이 t-test이고, 독립변수인 두 그룹에 따라 종속변수의 평균에 차이가 있는지 분석하는 방법이다.
(평균비교에서 t-test를 사용했다는 것은 종속변수의 정규성을 검정했다는 것을 전제로 함)
마지막으로 로지스틱 회귀분석의 결과를 살펴보면,
이 연구에서는 학령전기 아동의 비만에 영향을 미치는 요인을 확인하기 위해 단변량 분석에서 통계적으로 유의한 차이를 보인 변수들을 이용해 다중로지스틱 회귀분석을 실시하고자 했다. 그런데 부모의 허리둘레와 체질량지수의 상관계수가 높아(아버지: r=.89, p <.001, 어머니: r=.86, p <.001) 다중공선성의 문제가 발생되는 점과 비만 유병 여부는 체질량 지수를 이용하여 생성된 변수임을 고려하여, 통계적으로 유의했던 부모 특성 변수들 중에서 부모의 허리둘레는 제외하고 아버지 체질량지수, 어머니의 교육수준, 흡연여부, 체질량지수만을 포함시킨 모델을 이용해 최종적으로 다중로지스틱 회귀분석을 실시했다고 한다.
여기서 말하는 #다중공선성 은 회귀분석에서 독립변수들 사이에 강한 상관관계가 나타나는 문제인데, 회귀분석에서는 종속변수를 설명하는 독립변수들 사이의 독립성이 전제 되어야 한다. 그러므로 다중공선성이 높다는 것은 회귀분석의 전제 가정을 위배하는 것이므로 적절한 회귀분석을 위해 해결해야 하는 문제이다. 그래서 이 연구에서도 서로 상관관계가 높은 독립변수인 허리둘레와 체질량지수 중 하나를 선택하여 회귀모델에 넣었다는 것이다.
또한, 로지스틱 회귀분석은 종속변수가 이분형(Yes or No)이나 그 이상으로 나누어지는 범주형 변수(level 1, 2, 3)일 때 사용하는 회귀분석으로, 독립변수에서 1인 범주가 기준(Reference)일 때의 종속변수에 대한 범주의 위험도를 상대적인 수치(Odds ratio)로 표현하는 것이다.
아동비만 영향요인에 대한 다중로지스틱 회귀분석
최종적인 결과를 보면, 하늘색 화살표로 표시된 아토피피부염, 알레르기비염, 천식 중 한 가지 질환이라도 진단받은 아동이 과체중 및 비만 발생 위험이 2.78배(95% CI: 1.27-6.09, p =.011) 높고, 초록색 화살표로 표시된 아버지의 체질량지수가 1씩 증가할수록 학령전기 아동의 비만 발생 위험은 1.18배(95% CI: 1.09-1.28, p <.001), 어머니의 체질량지수가 1씩 증가할수록 아동의 비만 발생 위험은 1.09배 (95% CI: 1.04-1.15, p <.001) 높아졌다.
그리고 이전에 포스팅했던 영아비만에 대한 연구도 다중로지스틱 회귀분석으로 결과를 도출했고, 해석방법에 대해 좀더 자세히 설명했으니, 참고하기 바란다.
https://blog.naver.com/privatalab/221870780385
결과적으로 오늘 본 논문에서는 우리나라에서 아동의 아토피피부염, 알레르기비염, 천식 진단 여부와 1일 티아민 섭취량, 부모의 체질량지수가 학령전기 아동의 과체중 및 비만 발생에 영향을 미치는 요인이라고 보고했다.
이렇듯 연구를 하고 논문을 쓰는 연구자들이라면 어떠한 이슈에 대하여 단순한 기사가 아닌 이러한 검증된 연구결과를 참고하여 본인의 기준점을 갖는 것이 중요하다.
[논문읽기/논문해석] One-way ANOVA, Logistic regression 논문통계 논문결과해석_일원배치 분산분석과 로지스틱 회귀분석 (0) | 2024.08.19 |
---|---|
[통계청 통계교육원] 논문통계를 위한 엑셀 통계, SAS, SPSS, R, 파이썬 통계 무료 수업듣고 수료증 받기 (0) | 2024.03.13 |
[SPSS 논문통계] 비모수검정_윌콕슨 부호순위 검정 (Wilcoxon signed ranks test) 결과해석_재활치료 실험연구 (0) | 2023.10.14 |
[SPSS 논문통계] 일원배치 분산분석(one-way ANOVA)과 사후검정_분석 해석 예시 (8) | 2023.10.14 |
[SPSS 논문통계] 생존분석 (COX regression)_생존율에 영향을 미치는 요인 (2) | 2023.10.13 |