-
GPT (다음단어맞추기가 핵심)practice_최신트랜드 논문 2024. 10. 7. 14:38
Transformer의 decoder부분만 쌓음
pretrain: 다음 token예측 -> GPT1
'practice_최신트랜드 논문' 카테고리의 다른 글
T5 (1) 2024.10.12 RoBERTa (0) 2024.10.12 Bert 이후 모델 (Transfomer-XL, GPT2, XLNet) (2) 2024.10.12 Bert (0) 2024.10.04