표본의 표집은 편향될 수 있다?

[김윤수 기자 @이코노미톡뉴스] 통계치를 사용함에 있어서, 해당 통계를 어떠한 기준으로 볼 것인가에서부터 해석의 차이가 크게 벌어질 수 있다. 이 책은 통계를 애용하는 뉴스 매체, 통계를 생성하고 해석하는 기관 및 단체에게 작성자의 목적과 의도에 따라 통계의 해석이 꽤 달라질 수도 있다는 것을 말하고 있다.

숫자는 수학으로 정확하다는 장점이 때로는 단점이 될 수 있다는 것이다.

표본 추출의 중요성, '심슨의 역설'


저자는 숫자로 이루어진 통계를 해석함에 있어서 의도적이진 않지만, 오해와 혼란을 유발할 수 있으며, 이는 정치인과 뉴스에서 특히 자주 사용하고 있으며 민주주의 참여 능력에 영향을 미친다고 서문을 통해서 적시하고 있다.

이 책은 통계를 해석함에 있어서 상당히 통계적인, 말하자면 수학적인 근거를 설명하면서 이를 글로 표현할 때 나타날 수 있는 오해 등을 실제의 예를 들어 설명하고 있다.

코로나 확진자 수에 대한 R 값에 대한 영국 기사, 임금 중앙값이 1% 올랐다는 미국 기사, 흑인과 백인의 흡연 비율 기사 등을 통해 저자는 통계를 통한 생태적 오류(Ecological fallacy) 등을 지적하고 있다.

표본 추출의 크기의 중요성은, 특히 정치적 여론조사는, 2019년도 영국의 총선거에 관한 기사를 인용해 설명하고 있다. 표본 표집의 편향이다. 

새 연구에 대한 뉴스는 메타분석 맥락 필요


통계의 오해에 빠지지 않으려면 통계 자제적 해석도 중요하고, 이슈에 대한 맥락도 중요하다. 저자는 새로움(news)을 찾는 것은, 특히 새로운 연구는 (지금까지 종합 연구, 메타분석) 맥락 안에서 살펴봐야 한다고 조언한다. 

여러 기사 사례 속에서 다양한 통계적 실증 분석을 한 저자는 최근 이슈인 코로나19에 관한 통계를 인용한 기사를 많은 예로 활용하면서 통계적 해석의 오류와 오해를 다양하게 설명하고 있다.

이 책의 말미에는 기자 생활을 했던 저자도 느꼈듯이 숫자나 통계를 다루는 뉴스, 기관들에게 이러한 통계 해석의 오류가 생기지 않기 위해서 기자들에게 권고하는 11가지의 통계 스타일 가이드를 제공하고 있다.

결론적으로 이 책은 가짜뉴스를 판별하는 방법이라 든지 뉴스에서 사용하는 통계가 허위라는 것 등을 밝히는 책이 아니고, 통계를 접하는 모든 이로 하여금 통계라는 수치를 어떻게 이해하고 해석해야 하는지를 좀더 정확한 방법을 통해 제시해 주는 책이라 할 것이다. (지은이 톰 치버스·데이비드 치버스, 옮긴이 김성훈, 김영사 출판, 2022-03-30)

톰 치버스 (Tom Chivers)

영국의 과학 저술가로, <텔레그래프>와 <버즈피드>에서 일하다가 프리랜서 작가로 전향했다. 2017년에 심리과학협회 미디어상을 받았으며, 2018년, 2020년에는 왕립통계학회로부터 ‘저널리즘 통계 우수상’을 수상했다. 2021년 영국 과학저술가협회가 선정한 올해의 과학작가로 뽑혔으며, 영국 최고의 저널리즘을 기념하는 ‘영국 언론상’과 <가제트>에서 주관하는 ‘영국 저널리즘상’의 과학저술 분야 후보로 올랐다. 첫 책 《합리주의자의 은하계 안내서》는 2019년 <더 타임스>가 선정한 ‘올해의 과학책’에 뽑혔다.

데이비드 치버스 (David Chivers)

더럼대학교 경제학과 조교수. 옥스퍼드대학교 강사로 재직했으며, 경제사회연구위원회ESRC의 지원을 받아 맨체스터대학교에서 박사학위를 받았다. <경제역학비평> <경제이론> <경제행동·조직저널> 등의 학술지에 논문을 발표했다. 불평등, 성장, 발달의 거시경제학을 연구하고 있다.

이코노미톡뉴스, ECONOMYTALK

(이톡뉴스는 여러분의 제보·제안 및 내용수정 요청를 기다리고 있습니다.
pr@economytalk.kr 로 보내주세요. 감사합니다.
저작권자 © 이코노미톡뉴스(시대정신 시대정론) 무단전재 및 재배포 금지