강화학습
Reinforcement Learning, RL 기초 개념에이전트가 환경과 상호작용하며 보상을 최대화하는 방향으로 학습하는 방법입니다. 시행착오를 통해 최적의 행동을 찾습니다.
알파고, 게임 AI, 로봇 제어, 자율주행 등에 사용됩니다.
AI, 머신러닝, 딥러닝 핵심 용어를 쉽게 이해하세요.
초보자부터 전문가까지 참고할 수 있는 가이드입니다.
에이전트가 환경과 상호작용하며 보상을 최대화하는 방향으로 학습하는 방법입니다. 시행착오를 통해 최적의 행동을 찾습니다.
알파고, 게임 AI, 로봇 제어, 자율주행 등에 사용됩니다.
노이즈를 점진적으로 제거하며 이미지를 생성하는 모델입니다. 현재 가장 고품질의 이미지 생성을 가능하게 합니다.
Stable Diffusion, DALL-E 3, Midjourney 등이 디퓨전 모델 기반입니다.
여러 층의 인공신경망을 사용하는 머신러닝의 한 분야입니다. 이미지, 텍스트, 음성 등 복잡한 데이터에서 뛰어난 성능을 보입니다.
얼굴 인식, 음성 인식, 자연어 처리 등 현대 AI의 핵심 기술입니다.
명시적으로 프로그래밍하지 않고 데이터로부터 패턴을 학습하는 AI의 한 분야입니다. 경험(데이터)을 통해 성능이 향상됩니다.
스팸 메일 필터, 넷플릭스 추천 시스템, 신용카드 사기 탐지 등에 사용됩니다.
텍스트, 이미지, 오디오, 비디오 등 여러 종류의 데이터를 함께 처리하는 AI입니다. 다양한 입출력 형태를 지원합니다.
GPT-4o, Gemini, Claude 3는 이미지와 텍스트를 함께 이해합니다.
정답 없이 데이터의 숨겨진 패턴이나 구조를 찾는 학습 방법입니다. 군집화, 차원 축소 등에 사용됩니다.
고객 세분화, 이상 탐지, 토픽 모델링 등에 활용됩니다.
새로운 콘텐츠(텍스트, 이미지, 코드, 음악 등)를 생성할 수 있는 AI입니다. 2023년 이후 AI 붐의 핵심입니다.
ChatGPT, Midjourney, Suno, Runway 등이 생성형 AI입니다.
인간 뇌의 뉴런 구조를 모방한 컴퓨터 시스템입니다. 입력층, 은닉층, 출력층으로 구성되며 가중치를 조절하며 학습합니다.
이미지 분류, 언어 번역 등 다양한 AI 작업의 기반 구조입니다.
모델의 가중치를 더 적은 비트로 표현하여 크기와 연산량을 줄이는 기술입니다. 성능은 유지하면서 효율성을 높입니다.
32비트 모델을 4비트로 양자화하면 크기가 1/8로 줄어듭니다.
입력 데이터의 중요한 부분에 더 집중하도록 하는 메커니즘입니다. 문장에서 관련 단어 간의 관계를 파악하는 데 핵심적입니다.
"The cat sat on the mat"에서 "sat"과 "cat"의 관계를 파악합니다.
자율적으로 작업을 계획하고 실행하는 AI 시스템입니다. 도구를 사용하고, 웹을 탐색하고, 코드를 실행할 수 있습니다.
Devin(AI 개발자), AutoGPT, Claude의 Computer Use 등이 AI 에이전트입니다.
클라우드가 아닌 기기 내에서 직접 AI를 실행하는 것입니다. 개인정보 보호와 빠른 응답이 장점입니다.
아이폰의 Siri, 갤럭시 AI, 픽셀의 음성 인식 등이 온디바이스 AI입니다.
인간의 학습, 추론, 인식, 판단 등의 지적 능력을 컴퓨터로 구현한 기술입니다. 넓은 의미에서 규칙 기반 시스템부터 최신 딥러닝까지 포함합니다.
ChatGPT, 자율주행 자동차, 음성 비서(시리, 알렉사) 등이 AI 기술을 활용합니다.
텍스트, 이미지 등을 숫자 벡터로 변환하는 것입니다. 유사한 의미는 가까운 벡터로 표현됩니다.
"왕"과 "여왕"의 임베딩 벡터는 서로 가�게 위치합니다.
컴퓨터가 인간의 언어를 이해하고 생성하는 AI 분야입니다. 번역, 요약, 질의응답, 감정 분석 등을 포함합니다.
ChatGPT, 구글 번역, 스마트 스피커의 음성 인식 등이 NLP 기술입니다.
정답(레이블)이 있는 데이터로 모델을 학습시키는 방법입니다. 입력과 정답 쌍을 통해 패턴을 학습합니다.
고양이/개 사진 분류, 집값 예측, 스팸 메일 분류 등에 사용됩니다.
대화형 인터페이스로 사용자와 소통하는 AI 프로그램입니다. 고객 서비스, 정보 제공 등에 활용됩니다.
ChatGPT, Claude, 카카오톡 챗봇, 은행 상담 챗봇 등이 있습니다.
AI 모델이 한 번에 처리할 수 있는 최대 토큰 수입니다. 길수록 더 긴 대화나 문서를 다룰 수 있습니다.
GPT-4 Turbo는 128K, Claude 3는 200K 토큰의 컨텍스트를 지원합니다.
컴퓨터가 이미지나 영상을 이해하고 분석하는 AI 분야입니다. 객체 인식, 얼굴 인식, 이미지 생성 등을 포함합니다.
자율주행 차량의 도로 인식, 스마트폰 얼굴 잠금 해제 등에 사용됩니다.
AI가 텍스트를 처리하는 기본 단위입니다. 단어, 부분 단어, 또는 문자가 토큰이 될 수 있습니다. 한글은 보통 1글자가 1-2토큰입니다.
"Hello world"는 2토큰, "인공지능"은 약 3-4토큰으로 처리됩니다.
2017년 구글이 발표한 신경망 아키텍처입니다. 어텐션 메커니즘을 사용하여 순차적 처리 없이 병렬 처리가 가능합니다. 현대 AI의 핵심 기반 기술입니다.
GPT, BERT, Claude, Gemini 등 거의 모든 최신 LLM이 트랜스포머 기반입니다.
사전 학습된 모델을 특정 작업이나 도메인에 맞게 추가 학습시키는 것입니다. 적은 데이터로도 전문화된 모델을 만들 수 있습니다.
의료 용어에 특화된 챗봇을 만들기 위해 의료 데이터로 파인튜닝합니다.
AI 모델에게 주는 입력 텍스트나 지시문입니다. 프롬프트의 품질이 AI 응답의 품질을 좌우합니다.
"다음 글을 요약해줘", "Python으로 정렬 알고리즘을 작성해줘" 등이 프롬프트입니다.
AI로부터 원하는 결과를 얻기 위해 최적의 프롬프트를 설계하는 기술입니다. AI 활용의 핵심 역량으로 떠오르고 있습니다.
역할 부여, 예시 제공, 단계별 지시 등의 기법을 사용합니다.
AI가 사실이 아닌 정보를 마치 사실인 것처럼 생성하는 현상입니다. LLM의 주요 한계점 중 하나입니다.
존재하지 않는 논문을 인용하거나, 틀린 역사적 사실을 말하는 경우가 환각입니다.
단순 응답을 넘어 목표를 달성하기 위해 자율적으로 행동하는 AI입니다. 2024-2025년 AI 업계의 핵심 트렌드입니다.
리서치 에이전트가 스스로 검색하고, 분석하고, 보고서를 작성하는 것이 예시입니다.
인간 수준의 범용 지능을 가진 AI입니다. 현재의 AI는 특정 작업에 특화된 "좁은 AI"이며, AGI는 아직 달성되지 않은 목표입니다.
SF 영화에 등장하는 인간처럼 사고하는 AI가 AGI의 예시입니다.
코드 작성을 돕는 AI 도구입니다. 자동완성, 코드 생성, 디버깅, 설명 등을 지원합니다.
GitHub Copilot, Cursor, Codeium, Amazon Q 등이 있습니다.
구글이 개발한 양방향 언어 모델입니다. 문맥을 양쪽 방향에서 이해하여 언어 이해 작업에 뛰어난 성능을 보입니다.
구글 검색 엔진의 검색 품질 향상에 BERT가 사용됩니다.
AI가 단계별로 추론 과정을 보여주며 답하도록 하는 프롬프트 기법입니다. 복잡한 문제 해결 능력을 향상시킵니다.
"단계별로 생각해서 풀어줘"라고 하면 추론 과정을 보여줍니다.
사용자와 함께 작업하는 AI 어시스턴트를 지칭하는 용어입니다. 마이크로소프트가 대중화시켰습니다.
GitHub Copilot(코딩), Microsoft Copilot(오피스) 등이 있습니다.
NVIDIA GPU에서 범용 연산을 수행하기 위한 플랫폼입니다. 대부분의 AI 프레임워크가 CUDA를 사용합니다.
PyTorch, TensorFlow 등이 CUDA를 통해 GPU 가속을 지원합니다.
소수의 예시만으로 새로운 작업을 수행하는 학습 방식입니다. 프롬프트에 몇 개의 예시를 포함하여 AI를 가이드합니다.
번역 예시 2-3개를 보여주고 새로운 문장을 번역하게 하는 방식입니다.
LLM이 외부 함수나 API를 호출할 수 있게 하는 기능입니다. AI가 실제 작업을 수행할 수 있게 해줍니다.
날씨 API를 호출해 현재 날씨를 알려주거나, 예약 시스템에 접근하는 것이 예시입니다.
생성자와 판별자가 경쟁하며 학습하는 모델입니다. 생성자는 진짜 같은 데이터를 만들고, 판별자는 진위를 구별합니다.
딥페이크 영상, 가상 얼굴 생성, 스타일 변환 등에 사용됩니다.
OpenAI가 개발한 생성형 언어 모델 시리즈입니다. 대규모 텍스트로 사전 학습 후 다양한 작업에 활용됩니다.
ChatGPT는 GPT-3.5, GPT-4, GPT-4o 등의 모델을 기반으로 합니다.
원래 그래픽 처리용이지만, 병렬 연산에 뛰어나 AI 학습과 추론에 핵심적으로 사용됩니다.
NVIDIA H100, A100, RTX 4090 등이 AI 학습에 사용되는 GPU입니다.
수십억~수조 개의 파라미터를 가진 대규모 언어 모델입니다. 방대한 텍스트 데이터로 학습하여 다양한 언어 작업을 수행합니다.
GPT-4, Claude, Gemini, LLaMA 등이 대표적인 LLM입니다.
적은 파라미터만 학습하여 효율적으로 파인튜닝하는 기법입니다. 메모리와 시간을 크게 절약할 수 있습니다.
Stable Diffusion 모델에 특정 스타일을 학습시킬 때 LoRA를 사용합니다.
Anthropic이 개발한 AI와 외부 도구 연결 표준 프로토콜입니다. AI가 다양한 도구와 데이터에 접근할 수 있게 합니다.
Claude가 파일 시스템, 데이터베이스, API 등에 접근할 때 MCP를 사용합니다.
AI 연산에 특화된 프로세서입니다. 스마트폰, PC 등에서 온디바이스 AI를 가능하게 합니다.
애플 뉴럴 엔진, 퀄컴 헥사곤, 인텔 AI Boost 등이 NPU입니다.
외부 지식을 검색하여 LLM의 응답에 활용하는 기술입니다. 환각을 줄이고 최신 정보를 반영할 수 있습니다.
회사 내부 문서를 검색하여 질문에 답하는 사내 챗봇에 RAG가 사용됩니다.
인간 피드백을 활용한 강화학습입니다. AI 응답에 대한 인간 평가를 통해 모델을 개선합니다.
ChatGPT가 유해한 응답을 피하고 유용한 답변을 하도록 RLHF로 학습됩니다.
상대적으로 적은 파라미터를 가진 경량 언어 모델입니다. 모바일 기기나 엣지 디바이스에서 실행할 수 있습니다.
Phi-3, Gemma, Llama 3.2 등이 SLM에 해당합니다.
음성을 텍스트로 변환하는 기술입니다. 음성 인식, 받아쓰기, 자막 생성 등에 사용됩니다.
Whisper, 구글 음성 인식, 네이버 클로바 노트 등이 STT 기술을 사용합니다.
구글이 개발한 AI 전용 칩입니다. 텐서 연산에 최적화되어 구글 클라우드와 서비스에 사용됩니다.
구글 검색, 지메일, 유튜브 추천 등이 TPU를 활용합니다.
텍스트를 음성으로 변환하는 기술입니다. AI 발전으로 자연스러운 음성 생성이 가능해졌습니다.
ElevenLabs, OpenAI TTS, 네이버 클로바 등이 TTS 서비스입니다.
예시 없이 작업 설명만으로 새로운 작업을 수행하는 능력입니다. LLM의 강력한 일반화 능력을 보여줍니다.
"이 리뷰가 긍정적인지 부정적인지 분류해줘"라고만 해도 분류가 가능합니다.
검색 결과가 없습니다.
추가되었으면 하는 용어가 있다면 알려주세요. 계속해서 업데이트하고 있습니다.
용어 제안하기