Argus 通过 GUI Agent 与 Code Agent 双路协同执行任务:
GUI Agent负责屏幕理解、界面操作与流程执行Code Agent负责代码分析、脚本执行与逻辑推理Smart Router根据任务类型、执行结果与失败信号做动态路由与兜底切换
项目面向阿里 Agent 挑战赛与 Gemini Hackathon 场景,支持 GUI 与 CLI 双运行模式。
- Dual-Agent 协同执行(GUI + Code)
- 自动路由与失败回退策略
- Tool Calling 工具体系(screen / window / mouse / keyboard / code)
- Agent Memory 上下文记忆
- GUI 可视化模式 + CLI 批处理模式
- 标准工程化能力(uv / Docker / lint / test / CI)
graph TD
User[用户任务] --> Router[Smart Router]
Router -->|GUI任务| GUIAgent[GUI Agent]
Router -->|Code任务| CodeAgent[Code Agent]
GUIAgent --> Tools[Tool Runtime]
CodeAgent --> Tools
Tools --> Desktop[Desktop APIs]
Tools --> Exec[Code Execution]
GUIAgent --> Memory[Agent Memory]
CodeAgent --> Memory
Router --> Fallback[Fallback Strategy]
uv sync
cp .env.example .env至少配置以下变量:
GUIAgent_MODELGUIAgent_API_KEYCodeAgent_MODELCodeAgent_API_KEY
可选:
GUIAgent_API_BASECodeAgent_API_BASE
GUI 模式:
uv run python main.pyCLI 模式:
uv run python main.py --task "打开浏览器并搜索 GitHub"强制指定 Agent:
uv run python main.py --task "分析当前目录代码结构" --force codemake lint
make test
make checkmake doctor构建镜像:
make docker-build运行容器(CLI 示例):
make docker-run或 Compose:
docker compose run --rm argus| 变量名 | 必填 | 说明 |
|---|---|---|
GUIAgent_MODEL |
是 | GUI Agent 模型名 |
GUIAgent_API_BASE |
否 | GUI Agent API Base |
GUIAgent_API_KEY |
是 | GUI Agent API Key |
CodeAgent_MODEL |
是 | Code Agent 模型名 |
CodeAgent_API_BASE |
否 | Code Agent API Base |
CodeAgent_API_KEY |
是 | Code Agent API Key |
hackathon2512/
├── main.py
├── src/argus/
│ ├── runtime.py
│ ├── bootstrap.py
│ ├── config.py
│ ├── agents/
│ ├── tools/
│ └── ui/
├── tests/
├── Dockerfile
├── docker-compose.yml
├── Makefile
├── pyproject.toml
└── LICENSE
make release-bundle