[카테고리:] AI
-

구글 Gemini 3 Pro 런칭: 바이브 코딩의 새로운 시대
구글이 AI 개발의 판도를 바꿀 Gemini 3 Pro를 공개했습니다. 이번 출시는 단순한 성능 업그레이드가 아닌, 개발 방식 자체를 근본적으로 재편하는 혁신입니다. 특히 “바이브 코딩(Vibe Coding)”이라는 새로운 개발 패러다임에 편승하며, 개발자와 AI의 관계를 완전히 새롭게 정의하고 있습니다. Gemini 2.5 Pro vs Gemini 3 Pro: 무엇이 달라졌나? 1. 압도적인 벤치마크 성능 향상 Gemini 3 Pro는 2.5 Pro…
-
![[GPU 자원 관리 방법] MIG vs CUDA_VISIBLE_DEVICES: 완벽한 격리? 유연한 공유?](https://blog.choonzang.com/wp-content/uploads/2025/11/Generated-Image-November-19-2025-11_28PM.png)
[GPU 자원 관리 방법] MIG vs CUDA_VISIBLE_DEVICES: 완벽한 격리? 유연한 공유?
이번에 GPU 정부지원 사업을 신청하여 H100 4장을 할당 받았습니다. 각 본부에서 LLM 개발 및 fine tuning을 목적으로 할당 하여 사용할 계획입니다. 아무래도 지원 사업 자체가 하나의 인스턴스에 GPU 자원을 나눠서 사용해야 하는 방식이다보니 자원을 어떻게 할당하는 것이 좋을지 알아보다가 정리된 내용을 포스트로 기록합니다. GPU 자원을 관리하는 가장 대표적인 두 가지 방식, NVIDIA MIG(Multi-Instance GPU)와 CUDA_VISIBLE_DEVICES…
-

효과적인 AI Agent를 구축하는 방법
AI Agent에 대해서는 이젠 매우 익숙한 단계가 아닌가 싶습니다. AI Agent는 LLM과 도구, 그리고 역할에 따른 인스트럭션을 기준으로 목표한 바를 달성하기 위한 단위로 정의된 것으로 보입니다. 오늘은 이러한 AI AGENT를 효과적으로 구축하는 실용적인 방법에 대해 포스트를 해보려고 합니다. 1. AI Agent란? 에이전트의 정의 “에이전트”는 다양한 방식으로 정의될 수 있습니다. 일부는 에이전트를 장기간 독립적으로 작동하며 다양한…
-

Google Gemini API의 File Search Tool: 완전 관리형 RAG 시스템의 등장
RAG의 복잡성을 해결하는 새로운 접근법 Google이 Gemini API에 완전 관리형 RAG(Retrieval-Augmented Generation) 시스템인 File Search Tool을 출시했습니다. 이 도구는 검색 파이프라인의 복잡성을 추상화하여 개발자가 실제 서비스 구축에만 집중할 수 있도록 설계되었습니다. File Search Tool의 핵심 특징 1. 혁신적인 가격 정책 File Search Tool의 가장 주목할 만한 특징은 파격적인 가격 정책입니다: 이러한 가격 정책은 RAG 시스템…
-

MCP Server와 코드 실행: AI 에이전트의 토큰을 98% 절감하는 방법
Model Context Protocol(MCP)은 AI 에이전트를 외부 시스템에 연결하는 표준 프로토콜로, 2024년 11월 출시 이후 빠르게 업계 표준으로 자리잡았습니다. 커뮤니티에서는 수천 개의 MCP 서버를 개발했고, 모든 주요 프로그래밍 언어용 SDK가 제공되고 있습니다. 하지만 연결되는 도구가 늘어날수록 예상치 못한 문제가 발생했습니다. 도구가 많아질수록 에이전트가 느려지고, 비용이 급격히 증가하는 것입니다. Anthropic은 최근 이 문제에 대한 혁신적인 해결책을 제시했습니다.…
-

PaddleOCR: 산업 선도적인 OCR 및 문서 AI 엔진 완벽 가이드
문서와 이미지를 구조화된 AI 친화적 데이터로 변환하는 최첨단 솔루션인 PaddleOCR를 소개합니다. 텍스트 추출부터 지능형 문서 이해까지 엔드투엔드 솔루션을 제공하는 이 도구는 개인 개발자부터 대기업까지 전 세계적으로 AI 애플리케이션을 지원하고 있습니다. PaddleOCR의 핵심 가치 PaddleOCR는 문서와 이미지를 JSON, Markdown과 같은 구조화된 AI 친화적 데이터로 업계 최고의 정확도로 변환합니다. 5만 개 이상의 GitHub 스타를 보유하고 MinerU, RAGFlow,…
-

Agentic Context Engine (ACE): AI 에이전트의 자가 학습 혁명
인공지능 분야에서 가장 큰 도전 중 하나는 AI 에이전트가 같은 실수를 반복한다는 점입니다. 하지만 이제 그 문제를 해결할 수 있는 혁신적인 프레임워크가 등장했습니다. 바로 Agentic Context Engine(ACE)입니다. ACE는 AI 에이전트가 자신의 성공과 실패로부터 학습하여 지속적으로 개선될 수 있게 해주는 획기적인 도구입니다. 이 블로그 포스트에서는 ACE의 주요 기능, 작동 방식, 그리고 이를 활용하여 어떻게 더 스마트한…
-

Chandra: 레이아웃 보존 기능을 갖춘 고정밀 OCR 모델 소개
AI산업에서 문서의 디지털화는 이제 필수 입니다. 특히 OCR영역은 그 정확도를 다투는 매루 치열한 영역이며, 최근 공개된 이 모델도 더 높은 벤치마크 성능을 자랑하며 새롭게 등장한 OCR모델입니다. 오늘은 그 최신 OCR 모델인 Chandra에 대해 자세히 알아보겠습니다. Chandra는 Datalab에서 개발된 AI OCR모델로, 이미지와 PDF를 구조화된 HTML, Markdown, JSON으로 변환하면서 레이아웃 정보까지 완벽하게 보존하는 고정밀 OCR 모델입니다. Chandra의…
-

Mistral OCR: 높은 정확도의 문서 인식 기술
디지털 전환 시대를 맞아 기업들은 방대한 양의 문서를 효율적으로 처리해야 하는 과제에 직면해 있습니다. 전 세계 조직 데이터의 약 90%가 여전히 문서 형태로 저장되어 있다는 사실은 문서 인식 기술의 중요성을 단적으로 보여줍니다. 2025년, 3월 6일, Mistral AI가 공개한 Mistral OCR은 이러한 문서 처리 영역에서 획기적인 도약을 이뤄냈습니다. 이미 6개월 이상이 지난 지금(2025.10)에서도 OCR과 관련된 모델에…
