모델이 학습 이후에 모든 입력에 대해 동일한 출력을 내는 문제

DL&ML/code.data.tips

모델이 학습 이후에 모든 입력에 대해 동일한 출력을 내는 문제

식피두 2021. 5. 3. 20:53

유사도 판단을 위한 임베딩을 얻기 위해

pretrained model을 가져다 fine-tuning을 통해 태스크에 좀 더 적합한 임베딩을 만들기 위해서

Arcface Loss를 학습을 했는데, 학습 후에 모든 입력에 대해 동일한 출력을 내는 기이한 현상을 겪었다.

Loss는 줄어드는 것을 보고 학습은 되고 있는게 아닌가 싶었는데...

아래 글에서 힌트를 얻어 확인해보니, 결국 Learning Rate이 너무 높은게 문제였다.

아마 이 때, ArcFace에 속한 FC Layer에 높은 LR을 부여하다가,

너무 큰 LR을 할당해버리는 바람에 학습이 이상하게 된 듯 싶다.

https://discuss.pytorch.org/t/outputs-from-a-simple-dnn-are-always-the-same-whatever-the-input-is/14969

Outputs from a simple DNN are always the same whatever the input is

I have built a DNN with only one hidden layer, the following are the parameters: input_size = 100 hidden_size = 20 output_size = 2 def init(): self.linear1 = nn.Linear() self.linear2 = nn.Linear() def forward(): x1 = F.leaky_relu() return F.leaky_relu() #u

discuss.pytorch.org

'DL&ML > code.data.tips' 카테고리의 다른 글

Kaggle Shopee 대회 top-solution 정리 (1)	2021.05.13
모델 학습이 잘 되는지 여부를 판단할 수 있는 지표 (1)	2021.04.27
Kaggle TSE 2020 대회 top-solution 정리 (0)	2021.04.15
분류 문제 관련 torch loss (BCEWithLogitsLoss, CrossEntropyLoss, LogSoftmax, NLLLoss) (0)	2021.04.14
torch amp mixed precision (autocast, GradScaler) (0)	2021.04.13

현재글모델이 학습 이후에 모든 입력에 대해 동일한 출력을 내는 문제

Docker, Graph, MLE, queue, summarization, React Native, gaussian mixture, Zookeeper, nginx, string, seq2seq, Likelihood, tree, flask, dp, CrossEntropy, gunicorn, stack, docker-compose, Dynamic Programming,

250x250

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

sji