LLM1 LG Aimers | LLM (Large Language Models; 초거대 언어모델) 📌 LLM 모델 발전 상황 GPT - 3 (Generative Pre-trained Transformer)Open AI 모델General-purpose algorithm (일반 인공지능)▶ 요약, 번역 등 정해진 Task만 수행하는 Model이 아닌 언어 이해 & 생성 관련 모든 질문에 응답1750억 Parameter로 이루어진 초거대 언어 모델 언어 이해는 잘 했으나 사용자의 지시를 잘 따르지 못 함 InstructGPT언어 이해가 잘되는 GPT-3를 활용해서 사람의 지시를 유용하게 & 안전하게 응답 생성 RLHF (Reinforcement Learning from Human Feedback) ▶ 사람의 피드백으로 강화학습 ➕ RLAIF 도 있음 사람의 지시 이행을 위해 1) 특정 질문에 대한 응.. 2024. 7. 24. 이전 1 다음