-

MCP 전송 프로토콜 변경: HTTP+SSE에서 Streamable HTTP로
들어가며 2024년 11월 Anthropic이 발표한 Model Context Protocol(MCP)은 AI 애플리케이션과 다양한 데이터 소스를 연결하는 표준 프로토콜로 빠르게 자리잡았습니다. 하지만 2025년 3월, MCP는 전송 메커니즘에 있어 중대한 변경을 단행했습니다. 바로 HTTP+SSE 방식에서 Streamable HTTP로의 전환입니다. 이 글에서는 왜 이러한 변경이 필요했는지, 그리고 두 방식이 어떻게 다른지 살펴보겠습니다. MCP와 JSON-RPC 2.0 먼저 MCP의 기본 통신 방식을 이해해야…
-

OCR Arena, OCR 테스트를 직접해보세요.
OCR Arena는 문서 파싱 작업에서 주요 기반 VLM과 오픈소스 OCR 모델을 테스트하고 평가할 수 있는 무료 플랫폼입니다. 문서를 업로드하고 정확도를 측정한 후, 공개 리더보드에서 최고의 모델에 투표할 수 있습니다. OCR Arena는 Extend 팀에서 개발했습니다 . Baseten의 지원을 받아 10개 이상의 모델을 출시했으며, 앞으로도 지속적으로 새로운 모델이 출시되면 추가될 예정이라고 하네요. . 문서 처리는 AI 애플리케이션…
-

구글 Gemini 3 Pro 런칭: 바이브 코딩의 새로운 시대
구글이 AI 개발의 판도를 바꿀 Gemini 3 Pro를 공개했습니다. 이번 출시는 단순한 성능 업그레이드가 아닌, 개발 방식 자체를 근본적으로 재편하는 혁신입니다. 특히 “바이브 코딩(Vibe Coding)”이라는 새로운 개발 패러다임에 편승하며, 개발자와 AI의 관계를 완전히 새롭게 정의하고 있습니다. Gemini 2.5 Pro vs Gemini 3 Pro: 무엇이 달라졌나? 1. 압도적인 벤치마크 성능 향상 Gemini 3 Pro는 2.5 Pro…
-
![[GPU 자원 관리 방법] MIG vs CUDA_VISIBLE_DEVICES: 완벽한 격리? 유연한 공유?](https://blog.choonzang.com/wp-content/uploads/2025/11/Generated-Image-November-19-2025-11_28PM.png)
[GPU 자원 관리 방법] MIG vs CUDA_VISIBLE_DEVICES: 완벽한 격리? 유연한 공유?
이번에 GPU 정부지원 사업을 신청하여 H100 4장을 할당 받았습니다. 각 본부에서 LLM 개발 및 fine tuning을 목적으로 할당 하여 사용할 계획입니다. 아무래도 지원 사업 자체가 하나의 인스턴스에 GPU 자원을 나눠서 사용해야 하는 방식이다보니 자원을 어떻게 할당하는 것이 좋을지 알아보다가 정리된 내용을 포스트로 기록합니다. GPU 자원을 관리하는 가장 대표적인 두 가지 방식, NVIDIA MIG(Multi-Instance GPU)와 CUDA_VISIBLE_DEVICES…
-

효과적인 AI Agent를 구축하는 방법
AI Agent에 대해서는 이젠 매우 익숙한 단계가 아닌가 싶습니다. AI Agent는 LLM과 도구, 그리고 역할에 따른 인스트럭션을 기준으로 목표한 바를 달성하기 위한 단위로 정의된 것으로 보입니다. 오늘은 이러한 AI AGENT를 효과적으로 구축하는 실용적인 방법에 대해 포스트를 해보려고 합니다. 1. AI Agent란? 에이전트의 정의 “에이전트”는 다양한 방식으로 정의될 수 있습니다. 일부는 에이전트를 장기간 독립적으로 작동하며 다양한…
-

Google Gemini API의 File Search Tool: 완전 관리형 RAG 시스템의 등장
RAG의 복잡성을 해결하는 새로운 접근법 Google이 Gemini API에 완전 관리형 RAG(Retrieval-Augmented Generation) 시스템인 File Search Tool을 출시했습니다. 이 도구는 검색 파이프라인의 복잡성을 추상화하여 개발자가 실제 서비스 구축에만 집중할 수 있도록 설계되었습니다. File Search Tool의 핵심 특징 1. 혁신적인 가격 정책 File Search Tool의 가장 주목할 만한 특징은 파격적인 가격 정책입니다: 이러한 가격 정책은 RAG 시스템…
-
![[Nuxt.js-13] Nuxt 3 + Nuxt Content v2: 완벽한 마크다운 블로그 만들기 (Composition API 가이드)](https://blog.choonzang.com/wp-content/uploads/2025/11/Generated-Image-November-08-2025-2_10PM.png)
[Nuxt.js-13] Nuxt 3 + Nuxt Content v2: 완벽한 마크다운 블로그 만들기 (Composition API 가이드)
한동안 바쁜 일이 많다보니 너무 오랜만에 포스트를 작성하는 것 같습니다. 마지막에 가까운 만큼 잘 마무리 해야겠습니다. 이번 포스트부터는 실전 프로젝트에 필요한 고급 기술을 다루며, 더 전문적인 Nuxt.js 애플리케이션을 만드는 방법을 알아보겠습니다. 오늘은 Nuxt Content를 활용하여 블로그, 문서 사이트 등 콘텐츠 중심 웹사이트를 효율적으로 제작하는 방법을 알아보겠습니다. Nuxt Content는 content/ 디렉토리에 마크다운 파일을 넣는 것만으로 강력한…
-

MCP Server와 코드 실행: AI 에이전트의 토큰을 98% 절감하는 방법
Model Context Protocol(MCP)은 AI 에이전트를 외부 시스템에 연결하는 표준 프로토콜로, 2024년 11월 출시 이후 빠르게 업계 표준으로 자리잡았습니다. 커뮤니티에서는 수천 개의 MCP 서버를 개발했고, 모든 주요 프로그래밍 언어용 SDK가 제공되고 있습니다. 하지만 연결되는 도구가 늘어날수록 예상치 못한 문제가 발생했습니다. 도구가 많아질수록 에이전트가 느려지고, 비용이 급격히 증가하는 것입니다. Anthropic은 최근 이 문제에 대한 혁신적인 해결책을 제시했습니다.…
-

가트너가 제시한 2026년 주목해야 할 10대 기술 트렌드
왜 가트너의 기술 트렌드에 주목해야 하는가? 매년 가트너(Gartner)가 발표하는 전략적 기술 트렌드는 단순한 예측이 아닙니다. 이는 전 세계 IT 기업들이 향후 비즈니스 방향과 전략을 설정하는 나침반과 같은 역할을 합니다. 글로벌 선도 기업들은 이 트렌드를 기반으로 투자 우선순위를 결정하고, 혁신의 방향을 설정하며, 조직의 디지털 전환 로드맵을 수립합니다. 따라서 IT 업계 종사자뿐만 아니라 비즈니스 리더라면 반드시 관심…
