서로 다른 경계 상자에서 같은 종류의 객체가 탐지될 수 있다. 이때는 각 경계 상자가 하나의 대상에 중복되어 표시된 것인지, 서로 다른 대상에 표시된 것인지를 판단하여 이미지 속의 각 대상별로 가장 정확한 경계 상자 하나만 표시하는 과정을 거치는데, 이를 ‘비최댓값 억제(NMS, Non-Max Suppression)’라고 한다. NMS는 두 경계 상자의 교집합을 합집합으로 나눈 값인 IoU를 기준으로 이루어진다. IoU 값은 두 경계 상자의 위치가 일치할수록 1에 가까운 값이 나오며, 이 값이 설정된 임곗값보다 크면 두 경계 상자가 동일한 대상에 표시된 것으로 판단하고 둘 중 신뢰도 점수가 낮은 상자를 삭제한다.
그리고 IoU 값이 설정된 임곗값보다 작으면 경계 상자가 서로 다른 대상에 표시된 것으로 판단하여 두 경계 상자 모두 그대로 둔다. 이러한 방법으로 한 가지 종류의 객체에 대해 그려진 모든 경계 상자들 중 가장 높은 신뢰도 점수를 가진 경계 상자를 기준으로 다른 경계 상자들을 하나씩 삭제해 나간다. 이후 IoU 값이 설정된 임곗값보다 작아서 지워지지 않고 남겨진 경계 상자 중에서 가장 높은 신뢰도 점수를 가진 경계 상자를 다음 기준으로 정하여 동일한 과정을 반복한다. 그리고 이러한 과정을 다른 모든 대상에 표시된 경계 상자들에 대해서도 순차적으로 반복한다.
이렇게 해서 결국 이미지 속의 각 대상별로 가장 높은 신뢰도 점수를 가진 경계 상자 하나씩만 남게 된다.
-2022학년도 7월 교육청 전국연합학력평가-
서로 다른 경계 상자에서 같은 종류의 객체가 탐지…각 경계 상자가 하나의 대상에 중복되어 표시… 서로 다른 대상에 표시… 각 대상별로 가장 정확한 경계 상자 하나만 표시하는 과정
‘문제 발생의 원인-문제 상황-문제 해결 방법-문제 해결 결과’ 등으로 나눠 글을 이해하는 연습을 많이 하라 했다. 지문에서도 ‘서로 다른 경계 상자에서 같은 종류의 객체가 탐지’된 것이 해결할 문제 상황이다. 이 문제를 해결한 결과는 ‘각 대상별로 가장 정확한 경계 상자 하나만 표시하’는 것인데, 이를 위해 ‘과정’이라는 해결 방법을 거친다.
그런데 지문에는 문제 상황을 구체화하고 있다. 즉 ‘각 경계 상자가 하나의 대상에 중복되어 표시’된 경우와 ‘서로 다른 대상에 표시’된 경우를 말하고 있는데, 해결 결과를 고려할 때 앞의 경우만 문제가 되는 것이다.
경우의 수를 따지는 수학적 사고가 있다. 옆의 도식처럼 ‘같은 종류의 객체’에 ‘하나의 대상’인 경우와 ‘서로 다른 대상’인 경우가 있다는 것을 떠올리는 것이 그 사례다. 이런 경우의 수를 생각할 때 구체화하며 글을 읽을 수 있다는 것을 명심해야 한다.
두 경계 상자의 교집합을 합집합으로 나눈 값 … 두 경계 상자의 위치가 일치할수록 1에 가까운 값
집합, 대수(代數), 함수, 기하와 관련한 수학적 사고를 복합적으로 하며 읽어야 하는 글이 있다. 지문에 ‘교집합’과 ‘합집합’ ‘나눈 값’ ‘두 경계 상자의 위치가 일치할수록 1에 가까운’ 등은 그 사례다.
집합, 기하 개념을 활용해 위 그림과 같이 이해하고, 대수 개념을 활용해 다음과 같은 식을 떠올려야 한다. 이제 우리가 떠올려야 할 것이 함수다. 경계 상자1과 경계 상자2의 크기에 변화가 없다면, 교집합 A의 크기가 클수록 상자가 겹치는 부분이 커진다. 이후 우리는 기하학적 사고를 해야 한다. 겹치는 부분의 크기는 얼마가 최대일까? 작은 경계 상자의 크기까지만 커진다. 그때까지는 분모와 분자의 크기에 차이가 줄어들어 IoU 값은 1에 가까워지는 것이다.
동일한 과정을 반복
모르는 수 5개가 적힌 공이 주머니 안에 있다고 하자. 그 공을 꺼내 책상 위에 순서대로 놓는다면 어떻게 할까?
먼저 하나의 공을 책상 위에 놓고 다른 공 하나를 꺼내 차이를 알아본다. 작은 수가 적힌 공을 다른 주머니에 넣는다. 그렇게 네 번을 하면 가장 큰 수가 책상 위에 남는다. 다시 주머니에 넣은 네 개의 공을 가지고 위와 같은 과정을 세 번 반복하면 다음으로 큰 수를 놓게 된다. 그런 식으로 과정을 반복하면 5개의 공이 적힌 수 순서대로 책상 위에 배열되고 주머니에는 공이 줄어들다가 마침내는 남아 있지 않게 된다.
