챗GPT 3.5? 4.0? 이거 왜 갑자기 3.5부터 시작하는거야?
GPT-1: 1.17억개, 18년 6월 11일 출시 GPT-2: 15억개, 19년 2월 14일 출시 GPT-3: 1,750억개, 20년 6월 11일 출시 GPT-3.5는 파라미터 개수는 동일한데 사람의 의견을 받아서 추가적인 학습을 하는 (RLHF, Reinforcement Learning from Human Feedback 기술을 도입된 것이 큰 특징이다. 강화학습은 ‘알파고’를 이긴 ‘알파고제로’에서 사용하면서 주목받은 기술이다. 우리가 자전거를 배우는 과정과 비슷하다. 자전거를 배울 때 책으로 배우는 경우는 없다. 왼쪽으로 쓰러질 것 같으면 오른쪽으로 핸들을 돌리고, 오른쪽으로 쓰러지면 왼쪽으로 돌린다는 내용의 책을 독파한 후 자전거를 배우는 사람은 없다. 그냥 단순 무식하게 수십 번, 수백 번 넘..