Key Takeaways
- Qwen3-Coder 32B: 92,7% HumanEval. 22 GB de VRAM Q4. Melhor modelo de programação local. `ollama pull qwen2.5-coder:32b`.
- Qwen3-Coder 7B: 72% HumanEval. 4,7 GB de VRAM Q4. Mais rápido e equilibrado. `ollama pull qwen2.5-coder:7b`.
- DeepSeek-Coder-V2 16B: 79% HumanEval. 10 GB Q4. Forte suporte multilíngue.
- Velocidade: 2–5 s por resposta (vs <1 s na nuvem). Aceitável para a maioria dos fluxos de trabalho de codificação.
- O código nunca sai da sua máquina — conformidade com LGPD por padrão.
- Integração com VS Code: use Continue.dev ou Copilot apontando para localhost:11434.