[카테고리:] IT

RAGOps: 차세대 AI 운영의 새로운 패러다임

검색 증강 생성(Retrieval Augmented Generation, RAG)은 생성형 AI와 대규모 언어 모델(LLM) 기반 애플리케이션 분야에서 가장 널리 적용되는 기술 중 하나입니다. Databricks 보고서에 따르면, LLM 기반 애플리케이션의 60% 이상이 어떤 형태로든 RAG를 사용하고 있습니다. 연간 약 40%의 성장률을 보이는 글로벌 LLM 시장에서 RAG는 반드시 숙달해야 할 핵심 기술 중 하나입니다. 인공지능이 비즈니스 운영의 핵심으로 자리잡으면서, 단순히…

2025년 07월 03일
RAG 완벽 가이드: 대형 언어 모델의 한계를 극복하는 검색 증강 생성

들어가며 ChatGPT, GPT-4, Gemini 등의 대형 언어 모델(LLM)이 놀라운 성능을 보여주고 있지만, 여전히 중요한 한계점들이 존재합니다. 최신 정보에 대한 지식 부족, 잘못된 정보 생성(할루시네이션), 그리고 도메인별 전문 지식의 부족 등이 그것입니다. 이러한 문제를 해결하기 위해 등장한 것이 바로 RAG(Retrieval Augmented Generation, 검색 증강 생성)입니다. RAG는 단순히 기존 LLM의 성능을 향상시키는 것을 넘어서, 실시간으로 업데이트되는 외부…

2025년 07월 02일
MCP Client: Streamlit과 MCP, LangChain으로 동적 툴(Tool) 라우팅 에이전트 구축

최근의 AI Client는 단순히 정해진 답변만 하는 것을 넘어, MCP와 같은 프로토콜을 기반으로 외부 도구를 활용하고 여러 AI 모델의 능력을 조합하여 복잡한 문제를 해결하는 방향으로 진화하고 있습니다. 이번 글에서는 사용자의 질문에 맞춰 최적의 도구를 동적으로 선택하고, 여러 AI 에이전트의 답변을 종합하여 최종 결과를 제공하는 챗봇을 만드는 방법을 소개합니다. 이 MCP Client는 Streamlit으로 만든 UI 뒤에서,…

2025년 06월 27일
AI의 새로운 흐름: CAG, TAG, RAG을 파헤치다

최근 생성형 AI의 발전과 함께 다양한 Augmented Generation 기술들이 주목받고 있습니다. 그 중에서도 Cache Augmented Generation(CAG, 캐시 증강 생성), Table Augmented Generation(TAG, 테이블 증강 생성), Retrieval Augmented Generation(RAG, 검색 증강 생성)은 각각 고유한 특징과 장점을 가지고 있어 다양한 상황에서 활용되고 있습니다. 각 접근 방식은 LLM의 응답을 사실적이고 맥락에 맞는 데이터에 기반하도록 만드는 근본적인 과제를 해결하지만,…

2025년 06월 24일
CrewAI: 멀티 에이전트 AI 자동화

CrewAI 소개 인공지능 기술이 빠르게 발전하면서, 단일 AI 모델의 한계를 극복하고 더 복잡한 작업을 효율적으로 처리할 수 있는 멀티 에이전트 시스템에 대한 관심이 높아지고 있습니다. 이러한 트렌드 속에서 CrewAI는 멀티 에이전트 AI 자동화 플랫폼으로 주목받고 있으며, GitHub에서 29.4K개의 스타를 받으며 Fortune 500 기업의 60%가 사용하고 있는 혁신적인 프레임워크입니다. 이러한 설계를 위해서는 langGraph를 이용한 방법도 있긴…

2025년 06월 21일
MCP Proxy: 서버 트랜스포트 간 전환을 위한 필수 도구

MCP Proxy는 서로 다른 서버 통신 방식(트랜스포트) 간의 전환을 가능하게 해주는 유용한 도구입니다. 특히 Claude Desktop과 같은 AI 애플리케이션에서 stdio 의 로컬 기반의 MCP Server만 지원하기 때문에, 원격 서버와의 통신을 원활하게 하는 데 큰 도움이 됩니다. MCP Proxy가 필요한 이유 MCP Proxy는 다음과 같은 상황에서 특히 유용합니다: MCP Proxy는 두 가지 주요 모드를 지원합니다: MCP…

2025년 06월 21일
MCP Server 구축하기: stdio와 SSE 방식 차이점

pulseMCP, smithery 등에 업데이트되는 정보들이 빠르게 증가하는 것을 보니, MCP(Model Context Protocol)을 이용한 서버와 클라이언트 개발이 매우 활발하게 이루어지는 것 같습니다. . 관련해서 이번 포스트에서는 Python의 mcp 라이브러리를 사용하여 간단한 MCP 서버를 구축하는 방법을 stdio와 SSE 두 가지 방식으로 나누어 설명하겠습니다. SSE와 stdio에 대한 설명 SSE (Server-Sent Events) SSE는 서버-센트 이벤트(Server-Sent Events)의 약자로, 웹 브라우저(클라이언트)가…

2025년 06월 19일
Uvicorn: 파이썬 ASGI 서버 라이브러리 완벽 가이드

웹 애플리케이션 개발에서 빠르고 효율적인 서버는 필수적입니다. 파이썬 생태계에서 Uvicorn은 ASGI(Asynchronous Server Gateway Interface) 서버로서 비동기 웹 애플리케이션을 위한 강력한 솔루션을 제공합니다. 이 글에서는 Uvicorn의 설치부터 사용법, ASGI 인터페이스와의 관계, 그리고 실제 MCP(Model Context Protocol) 서버 구축 사례까지 상세히 알아보겠습니다. Uvicorn이란? Uvicorn은 파이썬으로 작성된 초고속 ASGI 서버 구현체입니다. 비동기 프레임워크를 지원하도록 설계되었으며, uvloop와 httptools를 기반으로…

2025년 06월 16일
AnyCrawl: LLM 을 위한 고성능 웹 크롤러

고품질 데이터 수집의 중요성이 그 어느 때보다도 중요한 시기이 때문에 추가로 크롤러 서비스에 대한 또 다른 서비스에 대해서 포스트하려고 합니다. AnyCrawl은 AI와 LLM을 위해 특별히 설계된 고성능 웹 스크래핑 도구로, 코딩 없이도 모든 웹사이트에서 구조화된 데이터를 추출할 수 있는 엔터프라이즈급 크롤러 입니다. AnyCrawl의 주요 기능 1. AI 최적화 데이터 추출 AnyCrawl은 단순한 웹 스크래핑을 넘어서…

2025년 06월 12일