Skip to main content
PromptQuorumPromptQuorum
Início/LLMs locais/API compatível com OpenAI para LLMs locais (Ollama, vLLM, LM Studio) — Guia Python e Node.js 2026
Tools & Interfaces

API compatível com OpenAI para LLMs locais (Ollama, vLLM, LM Studio) — Guia Python e Node.js 2026

·11 min de leitura·By Hans Kuepper · Founder of PromptQuorum, multi-model AI dispatch tool · PromptQuorum

LM Studio (localhost:1234), Ollama (localhost:11434) e vLLM (localhost:8000) expõem APIs REST no formato OpenAI. Use o SDK oficial de Python ou Node.js da OpenAI com qualquer modelo local alterando apenas duas linhas: defina base_url para seu endpoint local e api_key para qualquer string.

LM Studio (localhost:1234), Ollama (localhost:11434) e vLLM (localhost:8000) expõem APIs REST no formato OpenAI. Use o SDK oficial de Python ou Node.js da OpenAI com qualquer modelo local alterando apenas duas linhas: defina base_url para seu endpoint local e api_key para qualquer string. A partir de maio de 2026, esta é a forma padrão de executar LLMs locais em aplicações Python e Node.js de produção sem custos na nuvem ou dependência de fornecedor.

Slide Deck: API compatível com OpenAI para LLMs locais (Ollama, vLLM, LM Studio) — Guia Python e Node.js 2026

O conjunto de slides abaixo cobre: o padrão de API compatível com OpenAI, configuração do endpoint do Ollama, integração de Python e Node.js em 3 passos, streaming, function calling e conformidade regional (LGPD Brasil, GDPR UE, APPI Japão). Baixe o PDF como cartão de referência de integração de API de LLM local.

Browse the slides below or download as PDF for offline reference. Download Reference Card (PDF)

Key Takeaways

  • LM Studio: localhost:1234/v1 — Ative na aba Local Server; sem GPU necessária; compatível com OpenAI.
  • Ollama: localhost:11434/v1 — Inicie com `ollama serve`; ideal para scripts e automação.
  • vLLM: localhost:8000/v1 — GPU recomendada; uso em produção de alto throughput.
  • Altere apenas duas linhas no seu código OpenAI existente: `base_url` e `api_key`.
  • Streaming e function calling funcionam com os três backends.
  • A LGPD brasileira é atendida: nenhum dado de prompt sai da sua infraestrutura local.

Contexto regional e conformidade

Brasil (LGPD / ANPD) — A API de LLM local mantém todos os dados de prompt na sua infraestrutura. A LGPD (Lei nº 13.709/2018) exige controles adequados para dados pessoais sensíveis. A inferência local elimina a necessidade de Acordos de Processamento de Dados com provedores de nuvem.

UE/GDPR — A inferência local satisfaz o Artigo 28 do GDPR. Nenhum dado sai da sua infraestrutura, satisfazendo os requisitos de residência de dados do setor financeiro, de saúde e jurídico da UE.

Global — A API compatível com OpenAI permite migrar entre modelos locais e de nuvem sem alterações de código.

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each provider's official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Compare your local LLM against 25+ cloud models simultaneously with PromptQuorum.

Join the PromptQuorum Waitlist →

← Back to Local LLMs

API OpenAI com LM Studio e Ollama: Python e Node.js 2026