본문 바로가기
컴퓨터과학

[논문읽기] Use HiResCAM instead of Grad-CAM for faithful explanations of convolutional neural networks

by 홈카페주인 2023. 9. 19.

1. 개요 및 연구동기

 

GradCAM의 제한사항을 설명한다. GradCAM 은 때때로 모델이 실제로 사용하지 않은 위치를 강조표시한다. 

이 문제를 해결하기 위해 새로운 클래스별 설명방법인 HiResCAM을 제안한다. HiResCAM 이 CAM의 일반화임을 증명하고 HiResCAM과 다른 그라데이션 기반 설명방법 간의 관계를 탐구한다. 

 

기존의 설명방법을 2가지로 분류한다.

1. 입력 수준 gradient 기반 설명방법 [5,6,7,8,9]

2. 출력 수준 gradient 기반 설명방법 [10,11]

 

GradCAM의 경우 기울기를 평균화하는 단계로 인해 예측에 사용된 모델의 위치만 알려주는 것을 보장하지 않는다. 이 문제를 해결하기 위해 우리는 CAM 기반의 HiResCAM을 개발했다.  그림 1로 결과를 비교한다. 

기여는 다음과 같다. 

1. GradCAM 은 모든 CNN에 사용된 모델의 위치를 반영하지 않는다는 것을 증명한다. 

2. HiResCAM 이 CAM 의 일반화라는 것을 증명한다.

3. 자연이미지에서 GradCAM 이 HiResCAM 보다 더 크고 둥글다는 것을 정성적으로 보여준다.

 

2. Related Work

제안하는 HiResCAM은 gradient 기반 설명방법의 일부이다.

 

2.1. Input-level approaches

Saliency mapping[5], DeconvNets[6], Guided Backpropagation[7] 은 입력이미지에 대한 클래스의 기울기를 계산하여 중요한 이미지 영역을 시각화한다. Gradient * Input[8] 은 입력과 gradient를 요소별로 곱하는 방법이다. 이러한 접근방식들의 한계는 white noise 현상이 나타나는 것이다[20,19].

 

2.2 Output-level approaches

CAM[10] global average pooling 및 하나의 최종 완전 연결 레이어로 구성된 신경망에 대한 설명방법이다.  

 

 

3. Methods

 

3.1 Problem setup

입력 이미지 X 를 받아들이는 CNN 을 생각해보자. [0,1] 사이의 값을 가지고 있고 클래스 m 에대한 모델 점수를 높일 것이다. 출력수준 CNN 설명 접근방식은 고정된 매개변수가 있는 훈련된 CNN 에 이미지를 입력하여 이 목표를 달성한다. 그런 다음 시각화를 위해 시각화결과가 업샘플링되고 X위에 겹쳐진다.

 

 

 

 

 

728x90

댓글