이론 정리 165

2025구글스터디잼 추천과정 - 03 Introduction to Resposible AI

03 Introduction to Resposible AIAI Responsibly 의 책임이라는 것이 무엇일까?왜 구글은 AI principles 을 넣었을까?조직 내에서 책임감 있는 AI principles의 필요성 파악프로젝트의 모든 과정에서의 결정에 책임감 있는 AI 가 얼마나 영향을 주는지 인식한다.조직이 비즈니스의 요구와 가치에 맞게 AI 도구를 설계할 수 있는지 인ㄱ식한다.이유와 내용AI는 빠르게 발전하고 있지만 완벽하지 않다.잠재적인 문제, 한계나 의도하지 않은 결과에 대한 이해가 필요하다.모범 사례가 없다면 AI는 기존의 문제나 편향을 복제하여 증폭시킬 수 있다.AI의 개발의 각 측면에 사람이 관려한다.사람이 모델이 학습할 데이터를 수집하고 생성한다.AI배포와 AI가 주어진 상황에 적용되..

이론 정리/AI 2025.03.11

2025구글스터디잼 추천과정 - # 02 LLM - Large Language Models

02 LLM - Large Language ModelsLLM 에 대한 정의LLM 사용처에 관하여prompt tuning 과 구글 생성형 AI 개발 툴에 대한 설명LLM 은 딥러닝의 하위 집합이다.LLM 은 특정한 목적을 위해서는 미리 학습되거나 파인튜닝 될 수 있는 크고, 일반적인 목적의 언어 모델이다.LLM 의 핵심 내용LargeLarge training datasetLarge number of parameters즉 큰 데이터를 학습시키고 다양한 파라미터를 활용한다는 것General purpose사람 언어와의 공통점리소스 제한이미 있는 다양한 데이터 셋을 통해 fundamental language models 를 만들어 쓰게 하는 것은 어떨까?Pre-trained and fine-tuned범용 LLM ..

이론 정리/AI 2025.03.10

2025구글스터디잼 추천과정 - 01 Introduction to Generative AI 간략정리

https://www.cloudskillsboost.google/paths/118/course_templates/536이거 정리. 영어를 듣고 한국어로 정리한거라 오역이 많을 수 있음01 Introduction to Generative AI 간략정리배우는 것어떻게 generative AI를 정의하는가어떻게 generative AI가 동작하는가generative AI 타입들에 대한 설명generative AI 어플리케이션들에 대한 설명어떻게 generative AI 를 정의하는가인공지능의 일종으로 다양한 종류의 컨텐츠(텍스트, 이미지, 오디오, 합성데이터)를 생성할 수 있다.그래서 인공지능이 뭘까?몇 가지 설명이 있어야 한다.2가지 자주 나오는 질문이 무엇이 인공지능(AI)인지, 그리고 AI랑 머신러닝(M..

이론 정리/AI 2025.03.09

Pod 기본 정리

PodLifeCyclepod 가 있고, Status 안에 파드 전체 상태를 대표하는 phase 속성pendingInitContainer 라고 본 컨테이너 기동 전에 초기에 수행해야 할 내용이 있는 경우 그 내용을 담는 컨테이너가 있다.요게 본 컨테이너 생성보다 먼저 수행되어야 한다.파드 생성 전에 해야하는 작업들 수행 과정running참고로 이거 pod는 running 인데 내부 container 들이 running 이 아닐 수도 있다.모든 contidion 이 true 이도록 유지하는게 좋다.컨테이너 상태의 모니터링도 필요함!파드가 더이상 일을 하지 않는다면 succeeded 나 failed 로 간다.succeeded컨테이너 모두가 다 작업을 잘 마치고 성공하면 일로감.failed컨테이너 중 하나라도 ..

Kubernetes Controller 기본 정리

Controller쿠버네티스의 컨트롤러는 서비스 관리와 운영에 도움을 준다.Auto Healing노드 위에 파드가 있는데, 파드가 다운되거나 노드가 다운되면 컨트롤러가 이를 즉각적으로 인지하고 파드를 다른 노드 위에 즉시 만들어 준다.Auto Scaling파드의 리소스가 limit 상태가 되었을 때 파드를 하나 더 만들어 줌으로써 부하를 분산시켜 준다.성능 장에 없이 안정적인 운영 가능Software Update파드 업그레이드를 한번에 쉽게 하도록 해주고, 롤백도 쉽게 해준다.Job일시적으로 특정 작업을 해야할 때에 이를 위한 파드를 만들어준 후에 사용 후 삭제효율적인 자원 활용이 가능해진다.Replication Controller, RelicaSetReplication Controller (Deprec..

kubernetes Object 기본 정리

Object 기본 정리Pod - Container, Label, Node ScheduleContainer하나의 독립적인 서비스 구동 가능한 컨테이너가 하나 이상의 포트를 가질 수 있지만 중복되는 포트는 가질 수 없다.한 컨테이너에서 다른 컨테이너로 접근할 떄에 포트를 통해 접근 가능참고로 파드 IP 는 쿠버네티스 클러스터 내에서만 접근 가능하고, 휘발성이 있다(재생성시 변경)Label모든 오브젝트에 달 수 있는데, 파드에서 가장 많이 사용된다.목적에 따라 오브젝트를 분류하고 그 분류된 오브젝트들만 따로 골라서 연결하기 위함key - value 쌍이고 한 파드에는 여러개의 라벨을 달 수 있다.뭐 type-web / io-dev 이런 식으로 구분 가능하도록 할 수 있음Node Schedule파드는 결국 여러..

쿠버네티스 기본 개념 간략정리

쿠버네티스 기본 개념노드의 개념마스터 노드클러스터를 관리한다.워커 노드파드가 실행된다.인그레스 노드클러스터 외부에서 클러스터 내부의 파드에 접근할 때 로드밸런서의 역할을 해준다.여기서 받아서 어떤 endpoint 로 가야할지를 판단해서 보내준다.쿠버네티스 리소스크게 오브젝트와 컨트롤러로 구성되어 있다.오브젝트네임스페이스, 파드, 서비스 등이 있다.네임스페이스클러스터 내부를 논리적 단위로 구분하여 사용할 수 있도록 해준다.네임스페이스를 사용하면 pod, controller, service, ingress 등 용도에 따라 실행해야 하는 애플리케이션을 하나의 클러스터 내에서 구분해서 사용할 수 있게 된다.클러스터를 실행하면 기본적으로 kube-system(시스템에서 관리하는 네임스페이스), default(사용..

배민 Kafka를 활용한 이벤트 기반 아키텍처 구축 보고 정리

https://www.youtube.com/watch?v=DY3sUeGu74M 이거 보고 정리이벤트 기반 아키텍처를 왜 구축했냐?배달 + 알림, 통계 등등...근데 알림이나 통계는 배달이랑 강한 일관성을 가지지는 않는다.둘을 같이 동시에 만족할 필요는 없음. (준 실시간성으로도 ㄱㅊ)즉 이는 결과적 일관성으로 만족할 수 있다. (이벤트를 통해 변경사항을 처리)그래서 이벤트는 어떤 정보를 가지고 있어야 했는가?여기서는 배달의 변경 사항을 잘 알려주는 것이다.4가지 구성요소 - 대상, 행동, 정보, 시간대상 : 식별자 정보 제공(배달이 A라이더에게 11시에 배차되었다)행동 : 이미 벌어진 사건이므로 과거형으로 표현(배달이 A라이더에게 11시에 배차되었다)정보 : 행위와 관련된 값들을 표현 (배달이 A라이더에..

L4, L7

L4, L7둘 다 네트워크에서 패킷을 처리하는 방법을 나타낸다.OSI 7계층을 알면 좋음.L4기능전송 계층에 해당한다.주로 TCP, UDP 를 사용해서 데이터를 전송한다.송신자와 수신자의 IP주소 및 포트 번호를 기반으로 네트워크 트래픽을 전달한다.로드 밸런싱L4 로드 밸런서는 트래픽을 IP주소와 포트 번호를 기준으로 분산한다.그래서 요청을 여러 서버에 고르게 분산시킬 수는 있지만 요청의 내용은(헤더나 데이터를 통한 확인) 검사하지 않는다.장점속도가 빠르고 비교적 간단한 처리다양한 종류의 트래픽(TCP/UDP 등) 처리 가능제한위에서 보듯 포트 번호를 기준으로 분산하고 헤더나 데이터 분석을 하지 않아서 애플리케이션 상태 혹은 사용자 세션에 기반한 로드 밸런싱은 어렵다.L7기능애플리케이션 계층에 해당한다...

쿠버네티스에서 말하는 Stateless가 뭘까?

쿠버네티스에서 말하는 Stateless가 뭘까?데이터 독립성상태가 없다 == 자체적으로 데이터를 저장하지 않는다.즉, 모든 트랜잭션이나 요청을 독립적으로 처리하며 이전 요청의 데이터를 보존하지 않는다.데이터는 주로 외부 DB, cache 혹은 다른 저장소에 저장된다.따라서 애플리케이션 파드는 재시작되거나 스케일 아웃되더라도 데이터 손실에 영향을 받지 않는다.수평 확장이 용이하다.파드간 상태 공유가 필요없기 때문에 오토스케일링이 쉽다.각각 파드의 요청 처리도 독립적으로 가능하다.유연한 배포 및 업그레이드애플리케이션 배포 및 업그레이드 시, 파드의 교체 시 유저에게 영향이 없다.간단하게 말하면 데이터 저장이나 이전 상태 유지를 하지 않는 애플리케이션을 의미한다.위의 장점을 정리하면독립성 : 이전 요청과의 연..