Principais conclusões
- O Home Assistant tem uma integração com o Ollama embutida; um modelo local vira o agente de conversa
- Você controla dispositivos em linguagem natural em vez de decorar frases exatas
- O modelo pode executar automações contextuais que regras rígidas não expressam
- Tudo roda no seu hardware: sem nuvem, sem dados de uso saindo de casa
- Um modelo pequeno com function-calling em um mini PC basta; uma GPU ou iGPU/NPU capaz reduz a latência
- Ordem de montagem: primeiro Home Assistant, depois Ollama, depois conectar o agente de conversa, depois adicionar voz local
O que significa rodar sua casa inteligente em um LLM local
Significa que um modelo de linguagem hospedado localmente fica entre você e seus dispositivos, traduzindo a intenção em linguagem natural para ações do Home Assistant e tomando decisões de automação que uma regra fixa não conseguiria. O LLM cumpre dois papéis: agente de conversa (você fala, ele age) e cérebro de automação (raciocina sobre o contexto).
- Agente de conversa: você diz ou digita "deixe a sala aconchegante" e o modelo mapeia essa intenção para chamadas concretas de dispositivos — diminuir luzes, definir cor quente, baixar as persianas.
- Cérebro de automação: em vez de um gatilho → uma ação, o modelo pode pesar o contexto: hora do dia, quem está em casa, estados de sensores e um objetivo em linguagem natural.
- Local por design: o modelo roda via Ollama na sua própria máquina, então nem seus comandos nem o estado da casa são enviados a terceiros.
Por que funciona em 2026
Três coisas convergiram: modelos pequenos ficaram capazes o bastante para o controle da casa, ganharam function-calling confiável e o Home Assistant lançou uma integração LLM de primeira linha. Nenhuma delas existia junta para usuários domésticos há poucos anos.
- Modelos pequenos capazes: modelos de 3B–8B já seguem instruções bem o suficiente para mapear intenção em ações de dispositivos, e cabem em hardware modesto. Para a mecânica e o tamanho do modelo, veja o que são LLMs locais — este guia não reexplica.
- Function-calling / uso de ferramentas: o controle da casa depende de o modelo emitir chamadas estruturadas (ligar, definir temperatura). Modelos locais modernos suportam isso, e é o que torna o controle confiável possível.
- Integração do Home Assistant: o Home Assistant expõe uma interface de agente de conversa e uma integração com o Ollama, então conectar um modelo local aos seus dispositivos é um passo de configuração, não um desenvolvimento sob medida.
A arquitetura: Home Assistant + Ollama + voz local
O stack são três componentes no seu próprio hardware: Home Assistant (dispositivos + automações), Ollama (o runtime do modelo local) e um pipeline de voz local (Assist + Whisper + Piper). Os dados fluem em um loop que nunca sai da sua rede.
- 1Home Assistant
Why it matters: Gerencia seus dispositivos, estados de entidades e automações, e expõe a interface de agente de conversa. É o hub pelo qual o modelo age — comece em [Home Assistant: primeiros passos](/pt/smart-home/home-assistant-getting-started). - 2Ollama
Why it matters: Roda o modelo local e o serve ao Home Assistant. Para instalar e escolher modelos, veja [como instalar o Ollama](/pt/local-llms/how-to-install-ollama); este guia foca na ligação do smart home. - 3Agente de conversa
Why it matters: A configuração do Home Assistant que aponta o Assist para o modelo do Ollama para que a linguagem natural vire ações de dispositivos — o passo a passo está em [conectar o Ollama ao Home Assistant](/pt/smart-home/home-assistant-ollama-integration). - 4Voz local (opcional)
Why it matters: O Whisper transcreve a fala e o Piper fala as respostas, então você ganha um assistente de voz totalmente offline — veja [montar um assistente de voz totalmente local](/pt/smart-home/local-voice-assistant-smart-home).
O que desbloqueia em relação à automação por regras
Um LLM local traz flexibilidade, linguagem natural e contexto que a automação por regras não consegue expressar — ao custo de mais configuração e hardware. Use regras para gatilhos determinísticos; o LLM onde intenção e contexto importam.
- Para exemplos concretos de automação e os prompts por trás, veja automações mais inteligentes com um LLM local.
- Mantenha automações de segurança determinísticas (alarme de fumaça, fechaduras) como regras simples — não as roteie pelo modelo.
| Aspecto | Automação por regras | Automação com LLM local |
|---|---|---|
| Flexibilidade | Gatilho fixo → ação fixa | Interpreta objetivos e se adapta ao contexto |
| Linguagem natural | Nenhuma — você cabeia condições exatas | Comandos e intenções em linguagem natural |
| Consciência de contexto | Apenas os estados que você programa | Raciocina sobre tempo, presença, sensores |
| Configuração | Simples por regra | Maior — hub + modelo + ligação |
| Necessidade de hardware | Mínima (um Pi) | Um mini PC; uma GPU/NPU ajuda na latência |
A realidade do hardware
Você pode rodar o Home Assistant e um modelo local pequeno em um único mini PC; uma GPU, iGPU capaz ou NPU reduz a latência de resposta. Este guia não reexplica VRAM nem quantização de modelos — para essa profundidade, links externos.
- Uma máquina basta: um mini PC pode hospedar o Home Assistant mais um modelo pequeno via Ollama. Para escolhas, veja melhores mini PCs para Home Assistant + IA local.
- A latência escala com o hardware: modelos maiores e inferência só em CPU respondem mais devagar; uma GPU ou iGPU/NPU moderna encurta a distância até um assistente ágil. Para VRAM e tamanho de modelo, veja melhor hardware para uma casa inteligente local.
- Escolha o modelo para a tarefa: o controle da casa premia modelos pequenos, rápidos e com function-calling em vez do maior disponível — veja melhores modelos LLM locais para o controle da casa inteligente.
Seu caminho passo a passo
Monte na ordem: Home Assistant, depois Ollama, depois o agente de conversa, depois voz e automações. Cada passo é tratado em um tutorial dedicado, para que este artigo principal continue sendo um mapa, não um paredão de comandos.
- 1Configure o Home Assistant em um mini PC — guia de primeiros passos.
- 2Instale o Ollama e baixe um modelo pequeno — como instalar o Ollama.
- 3Conecte o Ollama ao Home Assistant e defina-o como agente de conversa — guia de integração.
- 4Escolha um modelo ajustado ao controle da casa — melhores modelos LLM locais para o smart home.
- 5Adicione um frontend de voz totalmente local — assistente de voz local.
- 6Projete automações contextuais — automações de IA com um LLM local.
Perguntas frequentes
Qual o melhor modelo local para o controle da casa?
Um modelo pequeno que segue instruções e com function-calling confiável — normalmente na faixa de 3B a 8B — é o melhor encaixe, porque o controle da casa precisa de respostas rápidas e estruturadas mais do que do maior modelo. A escolha certa depende do seu hardware; veja o guia dos melhores modelos LLM locais para o smart home.
Preciso de uma GPU para uma casa inteligente com LLM local?
Não, mas ajuda. Um modelo pequeno roda em uma CPU moderna ou GPU integrada capaz; uma GPU dedicada ou NPU sobretudo reduz a latência de resposta para o assistente ficar mais ágil. Ajuste o tamanho do modelo ao seu hardware.
Uma casa inteligente com LLM local funciona offline?
Sim. O modelo roda localmente via Ollama e o Home Assistant controla os dispositivos pela sua LAN, então o controle em linguagem natural e as automações funcionam sem internet. Só o acesso remoto de fora de casa precisa de conexão.
Um LLM local é mais rápido que a Alexa?
Depende do hardware e do tamanho do modelo. Assistentes na nuvem como a Alexa são ajustados para baixa latência, enquanto um LLM local troca um pouco de velocidade por privacidade e operação offline; em um mini PC com GPU a distância diminui. A vantagem decisiva é privacidade e controle, não velocidade bruta.
Uma casa inteligente com LLM local roda em uma Raspberry Pi?
Uma Raspberry Pi roda bem o Home Assistant, mas a inferência de LLM em uma Pi se limita a modelos muito pequenos e é lenta. Para um assistente com LLM local ágil, um mini PC com iGPU/NPU capaz ou uma GPU dedicada é a melhor opção.