728x90
반응형
02 LLM - Large Language Models
- LLM 에 대한 정의
- LLM 사용처에 관하여
- prompt tuning 과 구글 생성형 AI 개발 툴에 대한 설명
LLM 은 딥러닝의 하위 집합이다.
- LLM 은 특정한 목적을 위해서는 미리 학습되거나 파인튜닝 될 수 있는 크고, 일반적인 목적의 언어 모델이다.
- LLM 의 핵심 내용
- Large
- Large training dataset
- Large number of parameters
- 즉 큰 데이터를 학습시키고 다양한 파라미터를 활용한다는 것
- General purpose
- 사람 언어와의 공통점
- 리소스 제한
- 이미 있는 다양한 데이터 셋을 통해 fundamental language models 를 만들어 쓰게 하는 것은 어떨까?
- Pre-trained and fine-tuned
- 범용 LLM 을 대규모 데이터 셋으로 선행 학습시킨 후 더 작은 데이터 셋으로 특정 목적에 맞춰 세부 조정하는 방식
- Large
- LLM 의 사용 사례
- 하나의 LLM 으로 다양한 용도로 사용할 수 있다.
- 최소한의 학습 데이터로도 모델을 조정할 수 있다. 즉, 학습 데이터가 별로 없어도 괜찮음
- few shot(최소한의 데이터 학습), zero shot(처음보는거)
- 데이터와 파라미터가 추가될수록 성능이 상승한다.
- Transformer 모델을 기반으로 한다.
- LLM 개발자가 기존 ML 학습 개발자와 다른점은?
- pre-trained API 를 사용하는 LLM development 에서
- ML 전문성이 필요 없다.
- 학습시킬 필요도 없다.
- 그냥 프롬프트 디자이닝을 생각하면 된다.
- ML쪽은 훨씬 많은 요구사항이 있음
- QA(Question Answering) 은 자연어 처리의 하위 분야인데 자연어 질문에 대답하는 작업을 수행한다.
- QA System은 대량의 텍스트와 코드로 학습되며 다양한 질문에 답할 수 있다.
- 여기서 중요한 것은, 이 경우는 분야별로 지식이 필요하다는 것이다.
- pre-trained API 예를들어 제미나이같은거 쓰면 프롬프트만으로 가져올 수 있다.
- 프롬프트 디자인
- 시스템에서 수행해야 하는 작업에 맞게 조정된 프롬프트 만드는 과정
- 예를 들어 영어를 프랑스어로 바꿔달라 할 때 프롬프트는 영어로, 번역된 출력은 프랑스어로
- 프롬프트 엔지니어링
- 성능 개선을 위해 설게된 프롬프트를 만드는 과정
- 분야별 지식이나 원하는 출력 예시 제공, 특정 시스템 별 효과적인 키워드 등
- 둘을 비교하면 프롬프트 디자이닝은 일반적으로 꼭 필요한 개념이고 엔지니어링의 경우는 전문적인 과정(정확성이나 성능을 요하는 시스템에 필요)
- 프롬프트 디자인
- pre-trained API 를 사용하는 LLM development 에서
- LLM에는 3개의 카테고리가 있다.
- Generic language, Instruction-tuned, Dialog-tuned
- Generic Language Models
- 학습 데이터에 의거해서 다음 단어를 추론한다.
- Instruction-tuned Models
- 입력으로 주어진 지시사항을 통해 응답을 예측하도록 학습된 모델
- dialog-tuned Models
- Instruction-tuned model 의 특별한 분야이다.
- 긴 대화가 오가는 맥락에서 이루어진다. 생각의 연쇄 추론이 관련이 있다.
- 다만 모든 걸 다 할 수 있는 모델에는 현실적으로 한계가 존재한다.
- 조정을 하면 신뢰성을 높일 수 있다.
- Vertex AI는 작업 별 파운데이션 모델을 제공한다.
- 이걸 쓰면 따로 지식이 없어도 ㄱㅊ ㅇㅇ
- 조정을 하면 신뢰성을 높일 수 있다.
반응형
'이론 정리 > AI' 카테고리의 다른 글
2025구글스터디잼 추천과정 - 03 Introduction to Resposible AI (1) | 2025.03.11 |
---|---|
2025구글스터디잼 추천과정 - 01 Introduction to Generative AI 간략정리 (3) | 2025.03.09 |