이론 정리/AI

2025구글스터디잼 추천과정 - # 02 LLM - Large Language Models

철매존 2025. 3. 10. 07:38
728x90
반응형

02 LLM - Large Language Models

  • LLM 에 대한 정의
  • LLM 사용처에 관하여
  • prompt tuning 과 구글 생성형 AI 개발 툴에 대한 설명

LLM 은 딥러닝의 하위 집합이다.

  • LLM 은 특정한 목적을 위해서는 미리 학습되거나 파인튜닝 될 수 있는 크고, 일반적인 목적의 언어 모델이다.
  • LLM 의 핵심 내용
    • Large
      • Large training dataset
      • Large number of parameters
      • 즉 큰 데이터를 학습시키고 다양한 파라미터를 활용한다는 것
    • General purpose
      • 사람 언어와의 공통점
      • 리소스 제한
        • 이미 있는 다양한 데이터 셋을 통해 fundamental language models 를 만들어 쓰게 하는 것은 어떨까?
    • Pre-trained and fine-tuned
      • 범용 LLM 을 대규모 데이터 셋으로 선행 학습시킨 후 더 작은 데이터 셋으로 특정 목적에 맞춰 세부 조정하는 방식
  • LLM 의 사용 사례
    • 하나의 LLM 으로 다양한 용도로 사용할 수 있다.
    • 최소한의 학습 데이터로도 모델을 조정할 수 있다. 즉, 학습 데이터가 별로 없어도 괜찮음
      • few shot(최소한의 데이터 학습), zero shot(처음보는거)
    • 데이터와 파라미터가 추가될수록 성능이 상승한다.
      • Transformer 모델을 기반으로 한다.
  • LLM 개발자가 기존 ML 학습 개발자와 다른점은?
    • pre-trained API 를 사용하는 LLM development 에서
      • ML 전문성이 필요 없다.
      • 학습시킬 필요도 없다.
      • 그냥 프롬프트 디자이닝을 생각하면 된다.
    • ML쪽은 훨씬 많은 요구사항이 있음
      • QA(Question Answering) 은 자연어 처리의 하위 분야인데 자연어 질문에 대답하는 작업을 수행한다.
      • QA System은 대량의 텍스트와 코드로 학습되며 다양한 질문에 답할 수 있다.
      • 여기서 중요한 것은, 이 경우는 분야별로 지식이 필요하다는 것이다.
    • pre-trained API 예를들어 제미나이같은거 쓰면 프롬프트만으로 가져올 수 있다.
      • 프롬프트 디자인
        • 시스템에서 수행해야 하는 작업에 맞게 조정된 프롬프트 만드는 과정
        • 예를 들어 영어를 프랑스어로 바꿔달라 할 때 프롬프트는 영어로, 번역된 출력은 프랑스어로
      • 프롬프트 엔지니어링
        • 성능 개선을 위해 설게된 프롬프트를 만드는 과정
        • 분야별 지식이나 원하는 출력 예시 제공, 특정 시스템 별 효과적인 키워드 등
      • 둘을 비교하면 프롬프트 디자이닝은 일반적으로 꼭 필요한 개념이고 엔지니어링의 경우는 전문적인 과정(정확성이나 성능을 요하는 시스템에 필요)
  • LLM에는 3개의 카테고리가 있다.
    • Generic language, Instruction-tuned, Dialog-tuned
    • Generic Language Models
      • 학습 데이터에 의거해서 다음 단어를 추론한다.
    • Instruction-tuned Models
      • 입력으로 주어진 지시사항을 통해 응답을 예측하도록 학습된 모델
    • dialog-tuned Models
      • Instruction-tuned model 의 특별한 분야이다.
      • 긴 대화가 오가는 맥락에서 이루어진다. 생각의 연쇄 추론이 관련이 있다.
  • 다만 모든 걸 다 할 수 있는 모델에는 현실적으로 한계가 존재한다.
    • 조정을 하면 신뢰성을 높일 수 있다.
      • Vertex AI는 작업 별 파운데이션 모델을 제공한다.
      • 이걸 쓰면 따로 지식이 없어도 ㄱㅊ ㅇㅇ
반응형