숫자가 포함된 정보들을 올바르게 비교하려면 두가지 원칙을 확인해야 한다.
첫째,비교를 할 때 비교되는 특성이 같아야 하고 둘째,비교되는 특성 이외의 것들에 대해서는 서로 비슷해야 한다는 것이다.
이들 원칙이 중요한 이유는 비교를 하는 경우 두 원칙이 지켜지지 않으면 어떤 요인 때문에 차이가 생기는지를 파악하기 어렵기 때문이다.
첫 번째 원칙이 지켜지지 않은 예부터 들어보자.
우리나라에서는 교통사고 사망자에 대한 경찰의 피해 집계와 정부의 대외적 공식 자료인 통계청 집계가 크게 달라 혼선이 빚어지고 있다는 뉴스를 접하곤 한다.
올 들어서도 경찰은 교통사고 사망자가 92년 이후 지속적으로 감소 추세에 있다며 교통안전캠페인이 효과를 내고 있다고 발표했으나 통계청의 자료에 따르면 오히려 증가 추세에 있는 것으로 나타나고 있다.
특히 94년의 교통사고 사망자는 경찰 자료는 1만87명인 데 반해 통계청 자료는 1만4773명으로 4686명이나 차이가 난다.
이렇게 사망자 수가 차이나는 이유는 간단하다.
경찰은 사고 발생 72시간 이내의 피해만을 통계 대상으로 하고 있는 반면 통계청은 전국 행정 기관에 접수된 1년간의 주민 사망 신고를 원인별로 분석해 집계한다.
따라서 통계청의 숫자가 항상 클 수밖에 없다.
경찰 인력이나 업무 과다를 고려할 때 경찰에게 교통사고로 인한 피해를 사고 몇 달 이후까지 추적해 통계를 요구하는 것은 무리일 것이다.
따라서 교통사고로 인한 사망자 수는 혼선 논란을 빚을 필요 없이 통계청 자료를 이용하면 된다.
통계청 수치와 경찰 수치의 차이는 교통 사고로 인한 부상의 정도가 심해 사고 직후에 사망하지 않아도 사고로 인해 1년 이내에 사망하는 사람이 많다는 의미로 해석하면 된다.
또 다른 예를 보자.미국 안전협회에 따르면 가장 사고를 잘 내는 운전자는 20대다.
사고자를 연령별로 분석한 자료를 보면 20대 운전자가 전체 사고의 31.6%를 차지해 가장 높았으며 △30대 23.3% △40대 16.2% △50대 9.4% △60대 11.0% △20대 이하 8.5% 등이 뒤를 이었다.
이 수치만 놓고 보면 10대 동생보다는 20대 형들이 자동차 사고뭉치처럼 보인다.
하지만 이런 분석에 따른 비교는 연령층별로 운전자 숫자가 같다는 가정 하에서만 가능하다.
실제로 운전면허를 가진 사람들의 수는 연령별로 크게 다르며 전체 사고에서 차지하는 비율이 연령층별로 차이가 나는 주 원인도 운전자의 숫자가 연령층별로 다르기 때문이다.
우리나라의 경우에는 전체 사고 중에서 30대 운전자가 차지하는 비율이 32.0%로 가장 높고,10대는 4.5%,20대는 26.8%,40대는 22.2%,50대는 9.4%,그리고 60대 이상은 4.9%로 나타난다.
이 비율만 갖고 30대 운전자가 가장 사고를 잘 낸다고 비교할 수 없는 이유는 역시 연령대별로 실제로 운전하는 사람들의 수가 다르기 때문이다.
올바른 결론을 끄집어내기 위해 지켜야 할 두 번째 원칙은 위에서도 말했듯 비교되는 특성 이외의 조건은 크게 다르지 않아야 한다는 것이다.
