이론 정리/AI

2025구글스터디잼 추천과정 - # 02 LLM - Large Language Models

철매존 2025. 3. 10. 07:38

728x90

02 LLM - Large Language Models

LLM 에 대한 정의
LLM 사용처에 관하여
prompt tuning 과 구글 생성형 AI 개발 툴에 대한 설명

LLM 은 딥러닝의 하위 집합이다.

LLM 은 특정한 목적을 위해서는 미리 학습되거나 파인튜닝 될 수 있는 크고, 일반적인 목적의 언어 모델이다.
LLM 의 핵심 내용
- Large
  - Large training dataset
  - Large number of parameters
  - 즉 큰 데이터를 학습시키고 다양한 파라미터를 활용한다는 것
- General purpose
  - 사람 언어와의 공통점
  - 리소스 제한
    - 이미 있는 다양한 데이터 셋을 통해 fundamental language models 를 만들어 쓰게 하는 것은 어떨까?
- Pre-trained and fine-tuned
  - 범용 LLM 을 대규모 데이터 셋으로 선행 학습시킨 후 더 작은 데이터 셋으로 특정 목적에 맞춰 세부 조정하는 방식
LLM 의 사용 사례
- 하나의 LLM 으로 다양한 용도로 사용할 수 있다.
- 최소한의 학습 데이터로도 모델을 조정할 수 있다. 즉, 학습 데이터가 별로 없어도 괜찮음
  - few shot(최소한의 데이터 학습), zero shot(처음보는거)
- 데이터와 파라미터가 추가될수록 성능이 상승한다.
  - Transformer 모델을 기반으로 한다.
LLM 개발자가 기존 ML 학습 개발자와 다른점은?
- pre-trained API 를 사용하는 LLM development 에서
  - ML 전문성이 필요 없다.
  - 학습시킬 필요도 없다.
  - 그냥 프롬프트 디자이닝을 생각하면 된다.
- ML쪽은 훨씬 많은 요구사항이 있음
  - QA(Question Answering) 은 자연어 처리의 하위 분야인데 자연어 질문에 대답하는 작업을 수행한다.
  - QA System은 대량의 텍스트와 코드로 학습되며 다양한 질문에 답할 수 있다.
  - 여기서 중요한 것은, 이 경우는 분야별로 지식이 필요하다는 것이다.
- pre-trained API 예를들어 제미나이같은거 쓰면 프롬프트만으로 가져올 수 있다.
  - 프롬프트 디자인
    - 시스템에서 수행해야 하는 작업에 맞게 조정된 프롬프트 만드는 과정
    - 예를 들어 영어를 프랑스어로 바꿔달라 할 때 프롬프트는 영어로, 번역된 출력은 프랑스어로
  - 프롬프트 엔지니어링
    - 성능 개선을 위해 설게된 프롬프트를 만드는 과정
    - 분야별 지식이나 원하는 출력 예시 제공, 특정 시스템 별 효과적인 키워드 등
  - 둘을 비교하면 프롬프트 디자이닝은 일반적으로 꼭 필요한 개념이고 엔지니어링의 경우는 전문적인 과정(정확성이나 성능을 요하는 시스템에 필요)
LLM에는 3개의 카테고리가 있다.
- Generic language, Instruction-tuned, Dialog-tuned
- Generic Language Models
  - 학습 데이터에 의거해서 다음 단어를 추론한다.
- Instruction-tuned Models
  - 입력으로 주어진 지시사항을 통해 응답을 예측하도록 학습된 모델
- dialog-tuned Models
  - Instruction-tuned model 의 특별한 분야이다.
  - 긴 대화가 오가는 맥락에서 이루어진다. 생각의 연쇄 추론이 관련이 있다.
다만 모든 걸 다 할 수 있는 모델에는 현실적으로 한계가 존재한다.
- 조정을 하면 신뢰성을 높일 수 있다.
  - Vertex AI는 작업 별 파운데이션 모델을 제공한다.
  - 이걸 쓰면 따로 지식이 없어도 ㄱㅊ ㅇㅇ

'이론 정리 > AI' 카테고리의 다른 글

2025구글스터디잼 추천과정 - 03 Introduction to Resposible AI (1)	2025.03.11
2025구글스터디잼 추천과정 - 01 Introduction to Generative AI 간략정리 (3)	2025.03.09

현재글2025구글스터디잼 추천과정 - # 02 LLM - Large Language Models

Golang, jpa, java, 백준, BOJ, 오블완, 위클리, 차이, 자바, spring boot, 고, 후기, solution, cos pro, Go, 풀이, 알고리즘, 티스토리챌린지, spring, 프로그래머스,

Today :
Yesterday :

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Hello backEnd

2025구글스터디잼 추천과정 - # 02 LLM - Large Language Models

02 LLM - Large Language Models

LLM 은 딥러닝의 하위 집합이다.

'이론 정리 > AI' 카테고리의 다른 글

'이론 정리/AI'의 다른글

티스토리툴바

2025구글스터디잼 추천과정 - # 02 LLM - Large Language Models

02 LLM - Large Language Models

LLM 은 딥러닝의 하위 집합이다.

'이론 정리 > AI' 카테고리의 다른 글

'이론 정리/AI'의 다른글

관련글

티스토리툴바