표본의 크기,즉 몇 개의 표본을 뽑아야 모집단을 대표할 수 있는가는 매우 중요한 문제다.
표본의 수가 너무 적다면 모집단에 대한 잘못된 추정을 하기 쉽고,반대로 표본의 수가 필요 이상으로 많으면 시간과 비용을 쓸데없이 낭비하는 것이 된다.
그러면 적당한 표본의 크기를 좌우하는 요인은 무엇일까? 그 기준은 모집단이 얼마나 다양한가(variability)와 조사가 어느 정도의 정확도를 요구하는가에 달려 있다.
피검사의 예를 들어 보자.의사는 피검사에서 아주 소량의 피만 뽑아 검사한다.
왜일까? 피가 몸 안의 어느 곳에 있더라도 그 질(質)이 균등하다고 생각하기 때문일 것이다.
마찬가지로 사람들의 평균 몸무게를 조사한다면 수십 명으로도 충분하지만 다양한 의견이 있을 수 있는 여론조사에서는 그보다도 많은 사람이 필요하다.
좀 더 정확한 조사를 위해서는 표본 수를 증가시켜야 한다.
일반적으로 50명 미만의 표본 수는 적은 것이고,전체 모집단의 10% 이상이 되면 필요 이상으로 많은 것이다.
조사의 성격과 목적에 따라 표본의 수가 달라지므로 표본의 대표성을 갖추기 위해서는 조사자의 경험과 판단에 크게 의존할 수밖에 없다.
적은 표본으로부터 큰 결론을 내린 예를 몇 가지 들어 보자.
'강현욱 학생층-유종근 블루칼라' 강세
1995년의 6·27 지방선거 한 달여 전인 5월19일자 조선일보의 기사 제목이다.
전북 도지사 후보 중에 강현욱 후보는 학생층에서,유종근 후보는 블루칼라 층에서 강세를 보이고 있다고 여론조사 결과를 근거로 분석하고 있다.
그러나 내용을 살펴보면 강현욱 후보는 학생층 31명 중에서 10명으로부터 지지를,유종근 후보는 블루칼라 40명 중 15명에게서 지지를 얻은 것이다.
내용은 소표본에서 얻은 결과로 별 뜻이 없는데 기사제목은 확신있는 결과처럼 발표하고 있다.
그러나 이런 예가 예외적인 것이 아니라 우리들이 종종 마주하게 된다는데 문제가 있다.
표본의 수가 적은 조사나 실험에서는 별 의미도 없는 희한한 결과가 일어날 수 있다는 것이 통계학의 상식이다.
다시 말해 만일 표본의 수가 너무 적다면 모집단에 대한 잘못된 추정을 하기 쉽다는 것이다.
더욱이 표본의 수가 하나인 경우에는 말할 필요도 없다.
담배골초인 내 친구에게 건강을 생각해서 담배를 끊으라고 했더니 "담배는 건강에 좋아,왜냐하면 우리 할아버지는 진짜 골초이신데 90세까지 장수하시고 있어"라고 대답한다.
한 개의 표본으로부터 자기가 믿고 싶은 결과가 나왔으니 더 이상 표본의 수를 늘릴 필요가 없다는 것일까? 이렇게 적은 표본으로부터 얻은 결과를 침소봉대하는 현상은 어떤 고집스런 개인의 전유물이 아니라 우리 주위에서 종종 볼 수 있는 수문맹의 한 현상이다.
다음의 신문기사를 보자.
이집트 거지 시간당 100불 벌어 ★공무원 평균 월급의 2배에 달해


