[논문리뷰] T5: Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer
1. Active Learning
> 새로운 질문이 주어졌을 때 기존의 질문들과 가장 유사한 질문을 얻기 위해서 어떤 방법을 사용해야 할까 고민하다가 도달한 논문입니다.
한국어 기술문서 분석을 위한 BERT 기반의 분류모델_황상흠, 김도현
Reward: scalar feedback signal. 보상은 지연될 수 있고, 장기적 보상을 위해서 즉각적 보상을 희생할 수도 있음
이 게시물은
LEC1 환경과의 상호작용 강화학습이 필요한 영역인지 생각해봐야 함(명확한 해결방법이 있으면 강화학습 사용하지 않아도 됨) Major Components of an RL Agent -Policy -Value function -Model
GPT 논문 리뷰
RoBERTa 논문 리뷰
전이학습 신경망의 일부 도는 젗네 신경망 가중치 파라미터를 MLE를 통해 학습데이터에 본격적으로 훈련시키기에 앞서, 다른 데이터셋이나 목적함수를 사용해 미리 훈련한 후, 이를 바탕으로 본격적으로 학습에서 신경망 가중치 파라미터를 더 쉽게 최적화하게 하는 것
활성화 함수 인공신경망에서 입력받은 데이터를 다음층으로 어떻게 출력할지를 결정
추천시스템의 종류