AutoAgent: AI 에이전트의 혁신적인 미래를 열다

인공지능 기술이 급속도로 발전하면서, 복잡한 프로그래밍 지식 없이도 강력한 AI 솔루션을 구축할 수 있는 시대가 도래했습니다. 그 중심에 AutoAgent가 있습니다. AutoAgent는 완전 자동화되고 제로코드(Zero-Code) 환경에서 LLM(대형 언어 모델) 에이전트를 구축할 수 있는 혁신적인 프레임워크입니다.

기존의 AI 에이전트 개발은 복잡한 코딩 작업과 전문적인 기술 지식을 요구했습니다. 하지만 AutoAgent는 자연어만으로도 에이전트를 생성하고 배포할 수 있는 완전히 새로운 패러다임을 제시합니다. 이는 단순히 기술적 진보를 넘어서, AI 기술의 민주화를 의미하는 중요한 변화라고 할 수 있습니다.

<첫 시작 페이지, 출처: https://github.com/HKUDS/AutoAgent>

AutoAgent의 핵심 기능과 특징

<overview, 출처: https://github.com/HKUDS/AutoAgent?tab=readme-ov-file>

1. GAIA 벤치마크에서 입증된 성능

AutoAgent의 가장 주목할 만한 특징 중 하나는 GAIA(General AI Assistant) 벤치마크에서 보여준 뛰어난 성능입니다. 이 프레임워크는 많은 딥 리서치 에이전트들과 비교할 만한 성과를 달성했으며, 특히 OpenAI의 Deep Research와 유사한 수준의 성능을 Claude 3.5를 사용하여 구현해냈습니다.

이는 단순한 기술적 성취를 넘어서, 오픈소스 솔루션이 상용 프리미엄 서비스와 경쟁할 수 있음을 보여주는 의미있는 결과입니다. 월 200달러에 달하는 Deep Research 구독 서비스에 대한 비용 효율적인 대안을 제공하면서도, 성능 면에서는 뒤지지 않는 결과를 보여주고 있습니다.

2. 자연어 기반 에이전트 생성

AutoAgent의 가장 혁신적인 기능은 자연어만으로 도구, 에이전트, 워크플로우를 손쉽게 구축할 수 있다는 점입니다. 사용자는 복잡한 프로그래밍 코드를 작성할 필요 없이, 일상적인 언어로 원하는 기능을 설명하기만 하면 됩니다.

예를 들어, “데이터 분석을 수행하는 에이전트를 만들어줘”라고 요청하면, AutoAgent는 자동으로 해당 기능을 수행할 수 있는 에이전트를 생성합니다. 이러한 접근 방식은 기술적 배경이 없는 비전문가들도 AI 에이전트의 힘을 활용할 수 있게 해줍니다.

3. 네이티브 자가 관리 벡터 데이터베이스

AutoAgent는 자체적으로 관리되는 벡터 데이터베이스를 내장하고 있어, Agentic-RAG(Retrieval-Augmented Generation) 기능을 제공합니다. 이 기능은 업계 선도 솔루션인 LangChain을 능가하는 성능을 보여줍니다.

RAG 기술은 대화형 AI의 핵심 구성 요소로, 외부 지식을 실시간으로 검색하고 활용할 수 있게 해줍니다. AutoAgent의 자가 관리 벡터 데이터베이스는 이러한 과정을 자동화하여, 사용자가 별도의 데이터베이스 관리 작업 없이도 고도의 지식 기반 대화가 가능하도록 합니다.

4. 범용 LLM 지원

AutoAgent의 또 다른 강점은 다양한 LLM 제공업체와의 원활한 통합입니다. OpenAI, Anthropic, Deepseek, vLLM, Grok, Huggingface 등 주요 LLM 서비스들을 모두 지원하여, 사용자가 자신의 요구사항과 예산에 맞는 최적의 모델을 선택할 수 있습니다.

이러한 유연성은 특히 기업 환경에서 중요한 의미를 갖습니다. 다양한 업무 요구사항에 따라 서로 다른 모델을 활용할 수 있으며, 비용 최적화와 성능 극대화를 동시에 추구할 수 있기 때문입니다.

5. 유연한 상호작용 모드

AutoAgent는 함수 호출(Function-calling)과 ReAct 상호작용 모드를 모두 지원하여, 다양한 사용 시나리오에 맞는 유연한 상호작용을 제공합니다. 이는 사용자의 특정 요구사항이나 작업 특성에 따라 최적의 상호작용 방식을 선택할 수 있게 해줍니다.

AutoAgent의 세 가지 사용 모드

1. 사용자 모드 (User Mode): 최고 수준의 오픈 딥 리서치

사용자 모드는 AutoAgent의 가장 접근하기 쉬운 기능으로, 즉시 사용 가능한 멀티 에이전트 시스템을 제공합니다. 이 모드는 OpenAI의 Deep Research와 동일한 기능을 제공하면서도, GAIA 벤치마크에서 비교할 만한 성능을 보여줍니다.

사용자 모드의 주요 장점들:

높은 성능: OpenAI의 o3 모델 대신 Claude 3.5를 사용하면서도 Deep Research와 동등한 성능 구현
모델 유연성: Deepseek-R1, Grok, Gemini 등 다양한 LLM과 호환
비용 효율성: 월 200달러 구독 서비스에 대한 오픈소스 대안 제공
사용자 친화성: 원활한 상호작용을 위한 배포 간편한 CLI 인터페이스
파일 지원: 향상된 데이터 상호작용을 위한 파일 업로드 처리 기능

2. 에이전트 에디터 (Agent Editor): 워크플로우 없는 에이전트 생성

에이전트 에디터는 AutoAgent의 가장 독특한 기능 중 하나로, 자연어 커스터마이징 기능을 제공합니다. 다른 에이전트 프레임워크들과 달리, AutoAgent는 자연어만으로 도구, 에이전트, 워크플로우를 생성할 수 있게 해줍니다.

에이전트 생성 과정:

원하는 에이전트 유형을 입력
자동화된 에이전트 프로파일링
에이전트 프로필 출력
필요한 도구 생성
에이전트와 함께 완료하고자 하는 작업 입력 (선택사항)
원하는 에이전트 생성 및 다음 단계로 진행

이러한 단계별 접근 방식은 사용자가 복잡한 에이전트 시스템을 직관적으로 구축할 수 있게 해줍니다.

3. 워크플로우 에디터 (Workflow Editor): 워크플로우 포함 에이전트 생성

워크플로우 에디터는 더욱 복잡한 작업 흐름을 가진 에이전트를 생성할 수 있는 고급 기능입니다. 자연어 설명만으로 에이전트 워크플로우를 생성할 수 있으며, 현재는 도구 생성 기능을 일시적으로 지원하지 않습니다.

워크플로우 생성 과정:

원하는 워크플로우 유형 입력
자동화된 워크플로우 프로파일링
워크플로우 프로필 출력
워크플로우로 완료하고자 하는 작업 입력 (선택사항)
원하는 워크플로우 생성 및 다음 단계로 진행

설치 및 시작하기

기본 설치

AutoAgent를 시작하는 것은 매우 간단합니다. GitHub 저장소를 클론하고 필요한 패키지를 설치하기만 하면 됩니다:

git clone https://github.com/HKUDS/AutoAgent.git
cd AutoAgent
pip install -e .

Docker 설치

AutoAgent는 에이전트 상호작용 환경을 컨테이너화하기 위해 Docker를 사용합니다. Docker를 먼저 설치해야 하며, 사전 구축된 이미지를 수동으로 가져올 필요는 없습니다. AutoAgent가 자동으로 사용자의 머신 아키텍처에 맞는 이미지를 가져오기 때문입니다.

API 키 설정

사용하고자 하는 LLM의 API 키를 설정해야 합니다. .env.template과 같은 환경 변수 파일을 생성하고, 필요한 API 키들을 설정하면 됩니다:

# 필수 GitHub 토큰
GITHUB_AI_TOKEN=

# 선택적 API 키들
OPENAI_API_KEY=
DEEPSEEK_API_KEY=
ANTHROPIC_API_KEY=
GEMINI_API_KEY=
HUGGINGFACE_API_KEY=
GROQ_API_KEY=
XAI_API_KEY=

CLI 모드로 시작하기

AutoAgent는 다양한 명령어 옵션을 제공합니다:

auto main: 사용자 모드, 에이전트 에디터, 워크플로우 에디터를 포함한 AutoAgent의 전체 기능 시작
auto deep-research: 더 가벼운 사용자 모드만 시작

주요 설정 옵션들:

--container_name: Docker 컨테이너 이름 (기본값: ‘deepresearch’)
--port: 컨테이너 포트 (기본값: 12346)
COMPLETION_MODEL: 사용할 LLM 모델 지정
DEBUG: 디버그 모드 활성화
API_BASE_URL: LLM 제공업체의 기본 URL

다양한 LLM 제공업체와의 통합

Anthropic 사용

Anthropic의 Claude 모델을 사용하려면:

.env 파일에 ANTHROPIC_API_KEY 설정
auto main 명령어 실행 (기본 모델: claude-3-5-sonnet-20241022)

OpenAI 사용

OpenAI의 GPT 모델을 사용하려면:

.env 파일에 OPENAI_API_KEY 설정
COMPLETION_MODEL=gpt-4o auto main 명령어 실행

기타 제공업체들

AutoAgent는 Mistral, Gemini, Huggingface, Groq, 그리고 OpenAI 호환 엔드포인트 등 다양한 제공업체를 지원합니다. 각각에 대해서는 해당 API 키를 설정하고 적절한 모델 이름을 지정하기만 하면 됩니다.

특히 DeepSeek-R1의 경우, 공식 API가 아직 효율적으로 사용되지 않기 때문에 OpenRouter를 통한 사용을 권장합니다.

고급 기능과 팁

브라우저 쿠키 가져오기

특정 웹사이트에 더 잘 접근할 수 있도록 브라우저 쿠키를 브라우저 환경에 가져올 수 있습니다. 자세한 내용은 cookies 폴더를 참조하면 됩니다.

서드파티 도구 플랫폼 API 키 추가

RapidAPI와 같은 서드파티 도구 플랫폼에서 도구를 생성하려면, 해당 플랫폼에서 도구를 구독하고 process_tool_docs.py를 실행하여 자체 API 키를 추가해야 합니다:

python process_tool_docs.py

로드맵과 미래 계획

AutoAgent는 지속적으로 발전하고 있으며, 다음과 같은 기능들이 계획되어 있습니다:

더 많은 벤치마크: SWE-bench, WebArena 등으로 평가 확장
GUI 에이전트: GUI 상호작용을 지원하는 Computer-Use 에이전트
도구 플랫폼: Composio와 같은 더 많은 플랫폼과의 통합
코드 샌드박스: E2B와 같은 추가 환경 지원
웹 인터페이스: 더 나은 사용자 경험을 위한 종합적인 GUI 개발

현재 웹 GUI 인터페이스가 개발 중이며, 곧 더욱 직관적인 사용자 경험을 제공할 예정입니다.

성능 검증과 벤치마크 결과

GAIA 벤치마크

AutoAgent는 GAIA 벤치마크에서 뛰어난 성능을 보여주었습니다. 연구진이 제공하는 평가 스크립트를 통해 이러한 결과를 재현할 수 있으며, 이는 AutoAgent의 신뢰성과 성능을 객관적으로 입증하는 중요한 지표입니다.

Agentic-RAG 성능

Agentic-RAG 작업에서도 AutoAgent는 우수한 성과를 보여주었습니다. 특히 자체 벡터 데이터베이스의 자가 관리 기능이 기존 솔루션들을 능가하는 성능을 보여주고 있습니다.

커뮤니티와 지원

AutoAgent 프로젝트는 활발한 커뮤니티를 구축하고 있으며, 다양한 채널을 통해 사용자 지원을 제공합니다:

Slack 워크스페이스: 연구, 아키텍처, 미래 개발에 대한 논의
Discord 서버: 일반적인 토론, 질문, 피드백을 위한 커뮤니티 운영 서버
GitHub Issues: 현재 작업 중인 이슈 확인 및 아이디어 제안

이러한 다채널 지원 체계는 사용자들이 필요할 때 적절한 도움을 받을 수 있도록 보장합니다.

기술적 혁신과 의미

AutoAgent는 단순한 도구를 넘어서, AI 에이전트 개발 패러다임의 근본적인 변화를 대표합니다. 기존에는 복잡한 프로그래밍 지식이 필요했던 AI 에이전트 개발을, 자연어 대화만으로 가능하게 만들었다는 점에서 큰 의미를 갖습니다.

이러한 접근 방식은 AI 기술의 민주화를 촉진하며, 더 많은 사람들이 AI의 혜택을 누릴 수 있게 해줍니다. 특히 비전문가들도 자신의 업무나 관심 분야에 특화된 AI 에이전트를 손쉽게 구축할 수 있다는 점은, 향후 AI 기술 활용의 새로운 지평을 열어줄 것으로 기대됩니다.

결론

AutoAgent는 AI 에이전트 개발의 새로운 표준을 제시하고 있습니다. 완전 자동화된 제로코드 환경, 뛰어난 성능, 광범위한 LLM 지원, 그리고 직관적인 자연어 인터페이스를 통해, AI 기술의 접근성을 크게 향상시켰습니다.

이제 복잡한 프로그래밍 지식이나 전문적인 기술 배경 없이도, 누구나 강력한 AI 에이전트를 구축하고 활용할 수 있습니다. AutoAgent가 제시하는 이러한 비전은 단순히 기술적 편의성을 넘어서, AI 기술이 더욱 민주적이고 접근 가능한 형태로 발전할 수 있는 가능성을 보여줍니다.

앞으로 AutoAgent가 어떤 새로운 혁신을 가져올지, 그리고 이것이 AI 에이전트 생태계에 어떤 변화를 불러일으킬지 기대해 봅니다.

참고링크 : https://github.com/HKUDS/AutoAgent

게시됨

2025년 09월 14일

카테고리

Python

작성자

choonzang

태그:

AutoAgent, User Mode, 사용자 모드, 에이전트 에디터, 오토에이전트, 워크플로우 에디터, 유저모드, 자연어기반 에이전트 생성, 제로코드 기반 AI 에이전트 개발