[카테고리:] AI
-
Chuking 파헤치기: RAG을 위한 필수 기술
LLM(대규모 언어 모델) 관련 애플리케이션을 구축할 때, 특히 콘텐츠를 임베드하여 벡터 데이터베이스에 저장하고 검색하는 과정에서 ‘청킹(Chunking)’은 핵심적인 기술입니다. 큰 텍스트 덩어리를 더 작고 관리 가능한 세그먼트로 나누는 이 과정은 벡터 데이터베이스에서 반환되는 콘텐츠의 관련성을 최적화하는 데 필수적입니다. VectorDB과 같은 시스템에서 콘텐츠를 인덱싱하려면 먼저 임베드해야 하며, 청킹을 하는 주된 이유는 의미적으로 관련성이 있으면서도 노이즈가 최소화된 콘텐츠를…
-

Firecrawl MCP Server: 웹 스크래핑과 리서치를 위한 강력한 도구
🔥 Firecrawl MCP Server는 웹 스크래핑 기능을 제공하는 Model Context Protocol(MCP) 서버 입니다. 이 도구는 웹 콘텐츠 수집, 검색, 분석을 위한 다양한 기능을 제공하여 연구자, 개발자, 데이터 분석가들에게 강력한 웹 리서치 도구로 활용될 수 있습니다. 현재 오픈소스 AGPL -3.0 (https://github.com/mendableai/firecrawl/blob/main/LICENSE) 으로 제공된 버전과 Cloud 버전을 제공하고 있습니다. 오픈소스와 차이는 다음과 같습니다. 이 글에서는 최근 MCP…
-

Home Assistant MCP 연동으로 Claude와 스마트홈 제어하기
스마트홈의 발전과 함께 AI 기술의 활용이 더욱 중요해지고 있습니다. 이번 포스트에서는 Home Assistant에 MCP(Model Context Protocol) 서버를 구성하여 Claude Desktop과 연동하는 방법을 상세히 알아보겠습니다. 이를 통해 자연어로 스마트홈 기기를 제어하고, 더욱 지능적인 자동화를 구현할 수 있습니다. Home Assistant MCP Server 구성 방법 1. 사전 요구사항 연동을 시작하기 전에 다음 사항들이 준비되어야 합니다: 2. Home Assistant에…
-
RAG 시스템의 새로운 시각: ‘충분한 맥락’으로 환각을 줄이는 법
Retrieval Augmented Generation (RAG) 시스템은 거대 언어 모델(LLM)에 외부 지식이나 최신 정보를 제공하여 성능을 향상시키는 강력한 방법으로 부상했습니다. 하지만 RAG 시스템에도 여전히 해결해야 할 과제가 많습니다. 이번 글에서는 최근 발표된 논문 “SUFFICIENT CONTEXT: A NEW LENS ON RETRIEVAL AUGMENTED GENERATION SYSTEMS”의 핵심 내용을 바탕으로, 기존 RAG 시스템의 문제점과 이를 개선하기 위한 새로운 접근 방식을 설명해…
-

AI의 새로운 가능성, MCP: 엔터프라이즈 환경에서 보안 대응
인공지능(AI) 기술이 빠르게 발전하면서, AI 시스템이 외부 세계와 상호작용하는 방식 역시 진화하고 있습니다. Anthropic이 도입한 모델 컨텍스트 프로토콜(Model Context Protocol, MCP)은 이러한 상호작용을 표준화하는 데 중요한 역할을 합니다. MCP를 통해 AI 모델은 실시간으로 외부 데이터 소스에 접근하고 다양한 도구를 활용할 수 있게 되며, 이는 AI 통합 및 기능 확장에 상당한 이점을 제공합니다. MCP의 핵심 구성…
-

MCP Tool Poisoning 공격: AI 에이전트의 새로운 보안 위협
AI 에이전트 생태계에서 혁신적인 기술로 주목받고 있는 MCP(Model Context Protocol)에서 심각한 보안 취약점이 발견되었습니다. Invariant Labs의 보안 연구팀이 발견한 Tool Poisoning Attack(TPA)은 AI 모델을 조작하여 민감한 데이터를 탈취하고 사용자 모르게 악의적인 행동을 수행할 수 있는 새로운 형태의 공격입니다. 이번 글에서는 Tool Poisoning 공격의 작동 원리, 실제 공격 사례, 그리고 이에 대한 효과적인 대응 방안을 자세히…
-

Anthropic, 차세대 AI 모델 Claude 4 공개 – 코딩과 추론 능력의 새로운 기준 제시
Anthropic이 차세대 AI 모델인 Claude Opus 4와 Claude Sonnet 4를 정식 발표했습니다. 이번 새로운 모델은 코딩, 고급 추론 및 AI 에이전트 분야에서 새로운 표준을 제시하며 기존 모델들의 한계를 뛰어넘는 성능을 보여주고 있습니다. Claude 4 시리즈의 주요 특징 Claude Opus 4는 세계 최고의 코딩 모델로 소개되었으며, 복잡하고 장시간 실행되는 작업과 에이전트 워크플로우에서 지속적인 성능을 발휘합니다. 특히…
-

FastAPI-MCP: FastAPI 서버를 MCP Server로 간단하게 전환하는 라이브러리
데이터 제어를 위한 백엔드 시스템으로 Python과 FastAPI를 통해 구현하였다면, Model Context Protocol(MCP) 서버로 변환해주는 강력한 라이브러리인 FastAPI-MCP에 대해 알아보겠습니다. FastAPI-MCP란 무엇인가? FastAPI-MCP는 FastAPI로 작성된 API 서버의 모든 엔드포인트를 MCP 도구(tool)로 자동 변환해주는 라이브러리입니다. Model Context Protocol(MCP)은 Claude, Cursor와 같은 AI 도구들과 쉽게 통합되도록 고안된 프로토콜로, 이를 통해 여러분의 API를 AI 모델이 직접 활용할 수 있게…
-

Long Context 처리를 위한 효율적인 방법: Recursive Abstractive Processing for Tree-Organized Retrieval (RAPTOR)
RAG 시스템 구축을 하면서 데이터를 벡터 스토어로 저장을 할때, 일정 길이로 청킹을 해서 임베딩후 저장을 하다보니, 검색을 통해서 검출된 문서 자체가 검색과 밀접한 관련이 있는 단어들만 나오게 됩니다. 결국 그 안에서 답변이 이루어 지기 떄문에 단편적인 질문에 따른 결과는 만족스럽더라도, 전체적인 맥락에 대한 이해가 요구되는 질문에는 그렇지 못합니다. 예를 들자면, 신데렐라가 어려서 부모님을 잃고, 자매로…
