1. 개요 및 연구동기
GradCAM의 제한사항을 설명한다. GradCAM 은 때때로 모델이 실제로 사용하지 않은 위치를 강조표시한다.
이 문제를 해결하기 위해 새로운 클래스별 설명방법인 HiResCAM을 제안한다. HiResCAM 이 CAM의 일반화임을 증명하고 HiResCAM과 다른 그라데이션 기반 설명방법 간의 관계를 탐구한다.
기존의 설명방법을 2가지로 분류한다.
1. 입력 수준 gradient 기반 설명방법 [5,6,7,8,9]
2. 출력 수준 gradient 기반 설명방법 [10,11]
GradCAM의 경우 기울기를 평균화하는 단계로 인해 예측에 사용된 모델의 위치만 알려주는 것을 보장하지 않는다. 이 문제를 해결하기 위해 우리는 CAM 기반의 HiResCAM을 개발했다. 그림 1로 결과를 비교한다.
기여는 다음과 같다.
1. GradCAM 은 모든 CNN에 사용된 모델의 위치를 반영하지 않는다는 것을 증명한다.
2. HiResCAM 이 CAM 의 일반화라는 것을 증명한다.
3. 자연이미지에서 GradCAM 이 HiResCAM 보다 더 크고 둥글다는 것을 정성적으로 보여준다.
2. Related Work
제안하는 HiResCAM은 gradient 기반 설명방법의 일부이다.
2.1. Input-level approaches
Saliency mapping[5], DeconvNets[6], Guided Backpropagation[7] 은 입력이미지에 대한 클래스의 기울기를 계산하여 중요한 이미지 영역을 시각화한다. Gradient * Input[8] 은 입력과 gradient를 요소별로 곱하는 방법이다. 이러한 접근방식들의 한계는 white noise 현상이 나타나는 것이다[20,19].
2.2 Output-level approaches
CAM[10] global average pooling 및 하나의 최종 완전 연결 레이어로 구성된 신경망에 대한 설명방법이다.
3. Methods
3.1 Problem setup
입력 이미지 X 를 받아들이는 CNN 을 생각해보자. [0,1] 사이의 값을 가지고 있고 클래스 m 에대한 모델 점수를 높일 것이다. 출력수준 CNN 설명 접근방식은 고정된 매개변수가 있는 훈련된 CNN 에 이미지를 입력하여 이 목표를 달성한다. 그런 다음 시각화를 위해 시각화결과가 업샘플링되고 X위에 겹쳐진다.
'컴퓨터과학' 카테고리의 다른 글
[대회참가기록] MAIC ECG AI Challenge 2023 (0) | 2023.09.27 |
---|---|
Image Segmentation 을 위한 이미지 분할 손실 함수 모음 (0) | 2023.09.24 |
[논문읽기] On Merging Feature Engineering and Deep Learning for Diagnosis, Risk-Prediction and Age Estimation Based on the 12-Lead ECG (0) | 2023.09.15 |
article 모으는 페이지 (0) | 2023.09.11 |
[트러블슈팅] git repository 특정 폴더가 업로드가 제대로 되지 않고 github에서 화살표로 보이는 현상 (0) | 2023.06.30 |
댓글