Skip to main content
PromptQuorumPromptQuorum
Início/LLMs locais/Whisper no Apple Silicon 2026: benchmarks Metal, configuração Core ML, guia M1-M5
Hardware & Performance

Whisper no Apple Silicon 2026: benchmarks Metal, configuração Core ML, guia M1-M5

·14 min de leitura·By Hans Kuepper · Founder of PromptQuorum, multi-model AI dispatch tool · PromptQuorum

Whisper large-v3 no M5 Pro: 10-12× tempo real. GPU Metal automático. Large-v3-turbo equilibra velocidade + precisão a 14-18×. Sem custo, totalmente offline.

Whisper de reconhecimento de voz no Apple Silicon: benchmarks de Metal e Core ML para M1 até M5 Max. Guia de configuração, seleção de modelo e transcrição em tempo real.

Tabela de benchmarks completa: desempenho do Whisper no Apple Silicon (M1-M5)

ChipTinyBaseSmallMediumLarge-v3
M132×20×12×
M1 Pro38×24×16×
M1 Max45×30×22×10×
M236×23×14×
M340×26×16×
M444×30×18×
M5 Pro55×40×30×14×
M5 Max65×48×38×18×

×N tempo real = N segundos de áudio transcritos em 1 segundo. Benchmarks via whisper.cpp com aceleração Metal.

Tamanhos de modelos Whisper: qual você deve usar?

ModeloParâmetrosTamanho em discoUso de RAMWER em inglêsIdeal para

O português brasileiro (pt-BR) é suportado com WER de aproximadamente 3-6%. Large-v3-turbo recomendado para maioria dos casos de uso em tempo real.

Metal vs Core ML vs Apple Neural Engine: qual backend escolher?

  • Metal (whisper.cpp): Mais rápido, ampla compatibilidade, configuração mais simples. Recomendado para a maioria dos usuários.
  • Core ML: Otimização com Neural Engine, ganho de velocidade de 15-20% em algumas cargas (requer conversão do modelo).
  • Apple Neural Engine: Benefício limitado para modelos grandes, ideal para tiny/base em laptops com bateria.

Configuração: whisper.cpp com aceleração Metal

  1. 1
    Instalar dependências
    Why it matters: xcode-select --install brew install ffmpeg
  2. 2
    Clonar e compilar whisper.cpp com Metal
    Why it matters: git clone https://github.com/ggerganov/whisper.cpp cd whisper.cpp make WHISPER_METAL=1
  3. 3
    Baixar um modelo
    Why it matters: bash ./models/download-ggml-model.sh large-v3-turbo
  4. 4
    Transcrever um arquivo de áudio
    Why it matters: ./main -m models/ggml-large-v3-turbo.bin -f audio.wav -l pt

Melhor configuração do Whisper por modelo de Mac

Configuração MacModelo recomendadoMúltiplo de tempo realCaso de uso

Para conformidade com LGPD: transcrição local garante que dados de áudio sensíveis nunca saiam da organização.

Whisper local vs serviços de transcrição na nuvem

MétricaWhisper local (M5 Pro)Google Speech-to-TextOpenAI Whisper API

Para conformidade com a LGPD e proteção de dados sensíveis (médico, jurídico, financeiro), o Whisper local é a única opção que garante que os dados de áudio nunca saiam da organização.

O Whisper funciona bem em português?

Sim. O português (Brasil e Portugal) é um dos idiomas com melhor suporte. WER típico: 3-5% para português padrão, 5-10% para sotaques regionais. Especifique o idioma com -l pt para melhor desempenho.

O Whisper local é mais rápido que as APIs na nuvem?

Local no M5 Pro: 10× tempo real (latência 100ms). APIs na nuvem: 100-500ms de latência pela rede. O local é mais rápido e gratuito.

Qual modelo Whisper tem o melhor equilíbrio velocidade/qualidade?

Large-v3-turbo. Atinge ~95% da precisão do large-v3 a 4-6× a velocidade. Recomendado para a maioria dos casos de uso em tempo real.

Posso usar o Whisper local para conformidade com a LGPD?

Sim. O Whisper rodando localmente garante que nenhum dado de áudio seja enviado a servidores externos. Ideal para prontuários médicos, processos jurídicos e dados financeiros sob a LGPD (Lei nº 13.709/2018).

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each provider's official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Compare your local LLM against 25+ cloud models simultaneously with PromptQuorum.

Join the PromptQuorum Waitlist →

← Back to Local LLMs

Whisper STT no Apple Silicon 2026: benchmarks Metal M1-M5