Key Takeaways
- Ollama se instala em menos de 2 minutos — um único instalador para macOS, Windows e Linux.
- Após a instalação: `ollama run llama3.2` baixa e executa o modelo automaticamente.
- Sem Python, sem pip, sem dependências — o Ollama gerencia tudo.
- Funciona sem GPU — mas é mais rápido com uma.
- Mais de 200 modelos disponíveis: `ollama list` para ver os instalados, `ollama pull [modelo]` para baixar.
Como instalar o Ollama no macOS
# Opção 1: Baixe o instalador em ollama.com
# Clique em Download, abra o .dmg, arraste Ollama para Aplicativos
# Opção 2: Homebrew
brew install ollama
# Verificar instalação
ollama --version
# Executar o primeiro modelo
ollama run llama3.2Como instalar o Ollama no Windows
# Baixe OllamaSetup.exe em ollama.com
# Execute o instalador e siga as instruções
# O Ollama adiciona automaticamente o PATH
# No PowerShell ou CMD:
ollama run llama3.2
# Verificar instalação
ollama --versionComo instalar o Ollama no Linux
# Script de instalação oficial
curl -fsSL https://ollama.com/install.sh | sh
# Verificar instalação
ollama --version
# Executar o primeiro modelo
ollama run llama3.2Baixar e executar o primeiro modelo
# Baixar e executar Llama 3.2 8B (padrão)
ollama run llama3.2
# Outros modelos populares
ollama run phi4-mini # 3.8B, rápido
ollama run qwen3:8b # Qwen3 com PT-BR
ollama run aya:8b # Multilíngue 101 idiomas
# Listar modelos instalados
ollama list
# API REST (compatível com OpenAI)
curl http://localhost:11434/api/generate \
-d '{"model": "llama3.2", "prompt": "Olá!"}'Perguntas frequentes sobre Ollama
O Ollama é gratuito?
Sim, o Ollama é totalmente gratuito e open-source. Todos os modelos da biblioteca do Ollama também são gratuitos para uso local.
O Ollama precisa de GPU para funcionar?
Não. O Ollama funciona em CPU somente, mas é mais lento (5–15 tok/s). Com uma GPU discreta (mesmo 4 GB VRAM), a velocidade sobe para 20–40 tok/s.
Como conversar em português com o Ollama?
Basta digitar em português no prompt. Modelos como Aya 8B e Qwen3 têm melhor suporte para PT-BR. Use `ollama run aya:8b` para o modelo com melhor suporte multilíngue.
Posso usar o Ollama com outros aplicativos?
Sim. O Ollama expõe uma API REST compatível com OpenAI na porta 11434. Qualquer aplicativo que suporte OpenAI pode usar o Ollama como backend local.