Локальный LLM-провайдер для проекта slovo — Ollama c Laguna XS.2 (33B/3B MoE) в Docker с проброшенной NVIDIA GPU. Оптимизирован под single-user агентские сессии на RTX 4070 Ti SUPER + i9-11900K.
docker-compose moe code-generation nvidia-gpu mixture-of-experts wsl2 laguna llm local-inference ollama agentic-coding rtx-4070
-
Updated
Jun 1, 2026 - Python