Início/LLMs locais/Documentação da API compatível com OpenAI: LM Studio, Ollama, Aider, Cline e Roo Code (2026)

Tools & Interfaces

Documentação da API compatível com OpenAI: LM Studio, Ollama, Aider, Cline e Roo Code (2026)

Last updated: 14 de julho de 2026·11 min de leitura·By Hans Kuepper · Founder of PromptQuorum, multi-model AI dispatch tool · PromptQuorum

Ler em:

🇺🇸en 🇩🇪de 🇫🇷fr 🇯🇵ja 🇨🇳zh 🇪🇸es 🇧🇷pt 🇸🇦ar 🇰🇷ko

LM Studio (localhost:1234), Ollama (localhost:11434) e vLLM (localhost:8000) expõem APIs REST no formato OpenAI -- esta é a documentação de cada endpoint, formato de requisição e exemplo de código. Use o SDK oficial de Python ou Node.js da OpenAI com qualquer modelo local alterando apenas duas linhas: defina base_url para seu endpoint local e api_key para qualquer string.

LM Studio (localhost:1234), Ollama (localhost:11434) e vLLM (localhost:8000) expõem APIs REST no formato OpenAI -- esta página documenta cada endpoint, formato de requisição e exemplo de código. Use o SDK oficial de Python ou Node.js da OpenAI com qualquer modelo local alterando apenas duas linhas: defina base_url para seu endpoint local e api_key para qualquer string. O mesmo ajuste de base_url conecta ferramentas de codificação com IA como Aider, Cline e Roo Code aos seus modelos locais. A partir de maio de 2026, esta é a forma padrão de executar LLMs locais em aplicações Python e Node.js de produção sem custos na nuvem ou dependência de fornecedor.

Slide Deck: Documentação da API compatível com OpenAI: LM Studio, Ollama, Aider, Cline e Roo Code (2026)

O conjunto de slides abaixo cobre: o padrão de API compatível com OpenAI, configuração do endpoint do Ollama, integração de Python e Node.js em 3 passos, streaming, function calling e conformidade regional (LGPD Brasil, GDPR UE, APPI Japão). Baixe o PDF como cartão de referência de integração de API de LLM local.

Browse the slides below or download as PDF for offline reference. Download Reference Card (PDF)

Key Takeaways

LM Studio: localhost:1234/v1 — Ative na aba Local Server; sem GPU necessária; compatível com OpenAI.
Ollama: localhost:11434/v1 — Inicie com `ollama serve`; ideal para scripts e automação.
vLLM: localhost:8000/v1 — GPU recomendada; uso em produção de alto throughput.
Altere apenas duas linhas no seu código OpenAI existente: `base_url` e `api_key`.
Streaming e function calling funcionam com os três backends.
A LGPD brasileira é atendida: nenhum dado de prompt sai da sua infraestrutura local.
Aider, Cline e Roo Code se conectam aos modelos locais usando o mesmo ajuste de base_url -- sem integração separada.

Contexto regional e conformidade

Brasil (LGPD / ANPD) — A API de LLM local mantém todos os dados de prompt na sua infraestrutura. A LGPD (Lei nº 13.709/2018) exige controles adequados para dados pessoais sensíveis. A inferência local elimina a necessidade de Acordos de Processamento de Dados com provedores de nuvem.

UE/GDPR — A inferência local satisfaz o Artigo 28 do GDPR. Nenhum dado sai da sua infraestrutura, satisfazendo os requisitos de residência de dados do setor financeiro, de saúde e jurídico da UE.

Global — A API compatível com OpenAI permite migrar entre modelos locais e de nuvem sem alterações de código.

Nota sobre informações de terceiros

Este artigo faz referência a modelos de IA, benchmarks, preços e licenças de terceiros. O cenário da IA muda rapidamente. Pontuações de benchmark, termos de licença, nomes de modelos e preços de API podem mudar entre o momento em que foi escrito e quando você está lendo. Antes de tomar decisões de implantação ou conformidade com base neste artigo, verifique os dados atuais na fonte oficial de cada fornecedor: fichas de modelos do Hugging Face para licenças e benchmarks, sites dos fornecedores para preços de API e EUR-Lex para o texto atual do GDPR e da Lei de IA da UE. Este artigo reflete informações publicamente disponíveis em maio de 2026.

Run PromptQuorum with a local LLM, your own API keys, or both — you pick the backend.

Join the PromptQuorum Waitlist →

← Back to Local LLMs