
자연어 처리4 - LTSM, LTSM+CNN, Attention 비교
·
카테고리 없음
세 가지 신경망 모델(LSTM, LSTM-CNN, LSTM-Attention)의 시각화 결과에 대한 해석 각 모델의 학습 과정에서 생성된 손실(loss) 그래프를 분석하여 모델의 성능과 특성을 비교해 보겠습니다. 1. LSTM 모델 (로이터 뉴스 다중 분류) LSTM 모델은 로이터 뉴스 데이터셋을 46개 카테고리로 분류하는 작업을 수행합니다. 그래프 해석: • 학습 손실(파란색)은 에폭이 증가함에 따라 지속적으로 감소하는 경향을 보입니다. • 검증 손실(빨간색)은 초기에 감소하다가 특정 지점 이후에는 증가하거나 정체되는 경향이 있습니다. • 학습 손실과 검증 손실 간의 격차가 점차 벌어지는 것은 과적합(overfitting)의 징후입니다. • 조기 중단(early stopping)이..