[카테고리:] IT

  • Chandra: 레이아웃 보존 기능을 갖춘 고정밀 OCR 모델 소개

    Chandra: 레이아웃 보존 기능을 갖춘 고정밀 OCR 모델 소개

    AI산업에서 문서의 디지털화는 이제 필수 입니다. 특히 OCR영역은 그 정확도를 다투는 매루 치열한 영역이며, 최근 공개된 이 모델도 더 높은 벤치마크 성능을 자랑하며 새롭게 등장한 OCR모델입니다. 오늘은 그 최신 OCR 모델인 Chandra에 대해 자세히 알아보겠습니다. Chandra는 Datalab에서 개발된 AI OCR모델로, 이미지와 PDF를 구조화된 HTML, Markdown, JSON으로 변환하면서 레이아웃 정보까지 완벽하게 보존하는 고정밀 OCR 모델입니다. Chandra의…

  • 비기술 리더에게 기술적 명확성을 제공하는 방법

    비기술 리더에게 기술적 명확성을 제공하는 방법

    커뮤니티의 새로운 소식들을 찾아다니다가 호주의 한 소프트웨어 엔지니어의 블로그 포스트에 쓴 글이 매우 공감되어 포스트에 번역하여 옮겨보았습니다. 소프트웨어 비즈니스에서 어떤 이슈를 결정하는데 있어서 개발 기반이 아닌 결정권자들과 흔히 격는 상황에 대해서 솔직하게 이야기하고 있습니다. 그 사이에 매우 보수적인 또는 진보적인 개발자들 간에 리더에게 의사전달을 하는 방식의 차이도 한국의 상황과 크게 다르지 않아 공감이 되는 부분이…

  • 코드 한 줄 없이 웹 스크래핑하기: Scraperr 완벽 가이드

    코드 한 줄 없이 웹 스크래핑하기: Scraperr 완벽 가이드

    웹 스크래핑은 데이터 분석, 마케팅 리서치, 가격 모니터링 등 다양한 분야에서 필수적인 작업입니다. 때문에 요즘 오픈소스 스크래퍼 또는 크롤링 도구들이 많이 요구 됩니다. 오늘 소개할 어플리케이션도 이 웹스크래핑을 위한 셀프호스트 기반의 웹스크래퍼 인 Scraperr에 대한 포스트를 하려고 합니다. RAG 시스템에 웹사이트의 컨텐츠를 Ingest하기 위해서는 웹사이트의 데이터 스크래핑이 반드시 요구 됩니다. 그 과정에서 여러 크롤러 또는…

  • Mistral OCR: 높은 정확도의 문서 인식 기술

    Mistral OCR: 높은 정확도의 문서 인식 기술

    디지털 전환 시대를 맞아 기업들은 방대한 양의 문서를 효율적으로 처리해야 하는 과제에 직면해 있습니다. 전 세계 조직 데이터의 약 90%가 여전히 문서 형태로 저장되어 있다는 사실은 문서 인식 기술의 중요성을 단적으로 보여줍니다. 2025년, 3월 6일, Mistral AI가 공개한 Mistral OCR은 이러한 문서 처리 영역에서 획기적인 도약을 이뤄냈습니다. 이미 6개월 이상이 지난 지금(2025.10)에서도 OCR과 관련된 모델에…

  • [Nuxt.js-12] Nuxt.js 미들웨어(Middleware)와 라우트 가드

    [Nuxt.js-12] Nuxt.js 미들웨어(Middleware)와 라우트 가드

    안녕하세요! Nuxt.js 시리즈의 12번째 포스팅입니다.. 지난 번에는 플러그인과 유틸리티에 대해 알아보았는데요, 이번 시간에는 Nuxt.js의 강력한 기능 중 하나인 미들웨어(Middleware)와 라우트 가드에 대해 자세히 알아보겠습니다. 미들웨어는 페이지나 레이아웃이 렌더링되기 전에 실행되는 함수로, 사용자 인증 확인, 데이터 사전 로드, 리다이렉션 처리 등 다양한 상황에서 활용할 수 있습니다. 이를 통해 더 안전하고 유연한 애플리케이션을 구축할 수 있습니다. 1.…

  • [Nuxt.js-11] Nuxt.js 플러그인(Plugins)과 유틸리티(Utils) 활용하기

    [Nuxt.js-11] Nuxt.js 플러그인(Plugins)과 유틸리티(Utils) 활용하기

    안녕하세요, Nuxt.js 학습 시리즈의 11번째 시간입니다! 지난 시간에는 SEO 최적화와 메타 데이터 관리에 대해 알아보았는데요. 이번 시간에는 Nuxt.js에서 애플리케이션의 기능을 확장하고 코드를 효율적으로 관리할 수 있게 해주는 플러그인(Plugins)과 유틸리티(Utils)에 대해 자세히 알아보겠습니다. 1. Nuxt.js 플러그인(Plugins)이란? 플러그인은 Vue 애플리케이션이 생성되기 전에 실행되는 JavaScript 모듈로, 전역 구성 요소 등록, 외부 라이브러리 통합, 함수나 상수 주입 등 애플리케이션의…

  • vLLM Semantic Router: 차세대 AI 모델 라우팅으로 비용과 성능의 혁신을…

    vLLM Semantic Router: 차세대 AI 모델 라우팅으로 비용과 성능의 혁신을…

    지난 8월 OpenAI가 GPT5를 공개하였습니다. 오픈 이후에 매우 다양한 의견들이 있었는데요. . 질의의 내용에 따라 적절한 수준의 모델을 선정하여 효율성을 높이는 모델 라우팅에 대한 이슈가 매우 뜨거웠습니다. 다만, 비용을 효과적으로 관리하는 측면에서의 LLM의 라우팅은 필수적인 선택으로 갈것으로 보입니다. 또는 더 좋은 응답을 생성하기위한 필수적인 아키텍처일수 있다고도 생각됩니다. vLLM Semantic Router가 이러한 AI 모델 라우팅에 대한…

  • Mdream: 웹사이트를 LLM 최적화 마크다운으로 변환하는 강력한 크롤링 도구

    Mdream: 웹사이트를 LLM 최적화 마크다운으로 변환하는 강력한 크롤링 도구

    웹사이트 콘텐츠를 LLM(Large Language Model)에 최적화된 마크다운으로 변환하고 싶으신가요? 또는 AI 검색 가능성을 높이기 위해 사이트를 최적화하고 싶으신가요? Mdream은 이러한 요구를 충족시키는 강력한 도구입니다. 이 글에서는 Mdream의 주요 기능과 활용 방법에 대해 자세히 알아보겠습니다. 크롤러를 직접 개발하신 분들이라면, 고려해야 할것들이 매우 많은 영역의 장르라는 것은 잘 아실듯 합니다. 특히 다양한 유형의 웹페이지들을 불필요한 부분을 배제한…

  • PageIndex: 벡터 없는 혁신적인 RAG 서비스 소개

    PageIndex: 벡터 없는 혁신적인 RAG 서비스 소개

    인공지능 시대에 문서 검색과 정보 추출은 비즈니스의 핵심 요소가 되었습니다. 그동안 RAG(Retrieval-Augmented Generation) 시스템은 벡터 데이터베이스를 기반으로 한 유사도 검색에 의존해왔지만, 유사도가 곧 관련성을 의미하지는 않는다는 근본적인 한계가 있었습니다. 여기 이러한 문제를 다른 식으로 해석하여 풀어낸 케이스가 있어 소개합니다. PageIndex는 전통적인 벡터 기반 RAG와는 완전히 다른 접근법을 제시합니다. AlphaGo에서 영감을 받은 이 혁신적인 서비스는 인간…