Início/LLMs locais/ALLaM, AceGPT e os melhores LLMs locais de árabe saudita (2026)

Best Models

ALLaM, AceGPT e os melhores LLMs locais de árabe saudita (2026)

Last updated: 14 de junho de 2026·11 min de leitura·By Hans Kuepper · Founder of PromptQuorum, multi-model AI dispatch tool · PromptQuorum

Ler em:

🇺🇸en 🇩🇪de 🇫🇷fr 🇯🇵ja 🇨🇳zh 🇪🇸es 🇧🇷pt 🇸🇦ar 🇰🇷ko

Para IA local em árabe na Arábia Saudita, o ALLaM 7B (HUMAIN/NCAI, Apache 2.0) é o principal modelo disponível publicamente — pontuando 72–74% no AraLingBench contra 40–62% das variantes Qwen — e roda localmente via Ollama usando seus pesos GGUF. O AceGPT 7B/13B (KAUST + CUHKSZ) é uma alternativa, mas parece sem manutenção desde dezembro de 2023.

As ambições focadas em IA da Arábia Saudita — incluindo os modelos ALLaM da HUMAIN e o Ano oficial da Inteligência Artificial de 2026 — estão produzindo uma nova geração de LLMs locais nativos em árabe. Mas escolher um modelo para cargas de trabalho em árabe não é apenas uma questão de quantidade de parâmetros: modelos multilíngues de fornecedores globais pontuam significativamente abaixo dos modelos especializados em árabe em tarefas culturais e dialetais, apesar de serem gramaticalmente fluentes. Este guia cobre o ALLaM (HUMAIN/NCAI), o AceGPT (KAUST + CUHKSZ) e as principais alternativas multilíngues — com dados de benchmark verificados, requisitos de VRAM e um guia passo a passo para rodar o ALLaM localmente com o Ollama.

ALLaM, AceGPT e os melhores LLMs locais de árabe saudita (2026)

Key Takeaways

O ALLaM 7B é o melhor modelo em árabe auto-hospedável publicamente — construído pelo NCAI/SDAIA (agora sob a HUMAIN), lançado sob a Apache 2.0, com pesos GGUF que rodam diretamente no Ollama e no llama.cpp.
A diferença de benchmark é real: o ALLaM-7B pontua 72–74% no AraLingBench, enquanto as variantes Qwen pontuam 40–62% — uma diferença de 12–32 pontos percentuais em tarefas linguísticas em árabe.
O AceGPT (KAUST + CUHKSZ + SRIBD) é uma alternativa 7B/13B sob Apache 2.0, mas sua última atualização no GitHub foi em dezembro de 2023 — trate-o como sem manutenção.
Fidelidade cultural ≠ fluência gramatical. Modelos treinados globalmente podem ser gramaticalmente corretos e culturalmente errados; o ajuste fino de um modelo multilíngue em árabe muitas vezes *melhora* a qualidade do MSA enquanto *reduz* a precisão dialetal — um paradoxo documentado.
Referência rápida de VRAM (Q4_K_M): 7B ≈ 6–8 GB, 13B ≈ 10–14 GB, 34B ≈ 20–24 GB, 70B ≈ 40–48 GB.
O ALLaM 34B é proprietário — ele alimenta o HUMAIN Chat, mas não tem pesos públicos, então apenas o 7B é auto-hospedável hoje.
Impulso nacional: a Arábia Saudita declarou 2026 o Ano da Inteligência Artificial, acelerando o desenvolvimento de modelos em árabe.

O ALLaM 7B (Apache 2.0, pronto para Ollama) é o principal modelo em árabe auto-hospedável publicamente, pontuando 72–74% no AraLingBench contra 40–62% das variantes Qwen.

Se você precisa de uma IA em árabe que possa rodar no seu próprio computador, o ALLaM 7B da Arábia Saudita é a melhor opção gratuita no momento. Modelos globais grandes como o Qwen entendem a gramática do árabe, mas muitas vezes erram a cultura e o dialeto.

Por que a fidelidade cultural em árabe importa para a IA local

Um modelo pode produzir árabe gramaticalmente correto e ainda estar culturalmente errado — e para trabalhos voltados ao cliente ou governamentais na Arábia Saudita, a correção cultural é o que importa.

A evidência dos benchmarks é consistente. No AraLingBench, que testa o raciocínio morfológico e sintático em árabe, os modelos da família Qwen pontuam 40–62%, enquanto modelos especializados em árabe como o ALLaM-7B pontuam 72–74%. Essa diferença de 12–32 pontos percentuais se concentra exatamente nas áreas — morfologia, sintaxe, registro — em que o árabe mais difere das línguas europeias para as quais os modelos globais são otimizados.

O ajuste fino não é uma correção gratuita. Pesquisas sobre o panorama dos LLMs em árabe (arXiv 2506.01340, 2026) documentam um paradoxo: o ajuste fino de um modelo multilíngue com dados em árabe muitas vezes melhora a qualidade do Árabe Padrão Moderno (MSA) enquanto *reduz* a precisão dialetal. Você não pode simplesmente acoplar competência em árabe a um modelo global e esperar fidelidade dialetal.

O tratamento de dialetos é onde os modelos globais falham de forma mais visível. Para modelos menores de pesos abertos, a precisão dialetal estrita por código ISO pode cair para apenas 0.016–0.078 — o que significa que o modelo produz árabe fluente no dialeto *errado*. O benchmark AraDiCE (COLING 2025) constata que modelos específicos para árabe superam os multilíngues em dialeto, embora desafios significativos na identificação e geração de dialetos persistam em todos os modelos.

O contexto cultural e religioso é um ponto fraco documentado. O mesmo levantamento observa que dados de treinamento centrados no Ocidente ou multilíngues "introduzem vieses culturais que podem desalinhar os modelos com os valores e expectativas das comunidades de língua árabe" — afetando como um modelo enquadra temas islâmicos, tratamento formal e convenções sociais.

A concordância gramatical de gênero é um desafio conhecido e persistente: o árabe aplica concordância de gênero a verbos, adjetivos e pronomes de formas que diferem estruturalmente das línguas europeias, e modelos treinados globalmente erram isso sutilmente o tempo todo.

A implicação de negócios para implantações sauditas: se o seu caso de uso é conteúdo em árabe voltado ao cliente, correspondência formal ou qualquer coisa que toque em contexto cultural ou religioso, um modelo especializado em árabe vale a troca — e a distinção entre MSA e dialeto do Golfo deve ser parte explícita da sua seleção de modelo.

Modelos locais sauditas e de árabe: ALLaM, AceGPT e alternativas multilíngues

O ALLaM 7B é o ponto de partida recomendado para IA em árabe auto-hospedada; a tabela abaixo resume as opções realistas.

O ALLaM foi construído pelo Centro Nacional de IA (NCAI) na SDAIA em parceria com a IBM, e agora é comercializado por meio da HUMAIN — uma empresa de IA de propriedade do Public Investment Fund lançada em maio de 2025. A família abrange variantes 7B, 13B, 34B e 70B, mas apenas o 7B Instruct está disponível publicamente (Apache 2.0, com nove quantizações GGUF no Hugging Face). O 34B que alimenta o HUMAIN Chat é proprietário, sem pesos públicos.

O AceGPT é um projeto conjunto da KAUST, da Universidade Chinesa de Hong Kong Shenzhen (CUHKSZ) e do Shenzhen Research Institute of Big Data (SRIBD) — não é um modelo apenas da KAUST. Ele oferece variantes 7B e 13B (base e chat) construídas sobre o LLaMA-2, sob Apache 2.0. No seu lançamento em 2023, superou o Jais em tarefas em árabe, mas sua última atualização no GitHub foi em dezembro de 2023, então trate-o como sem manutenção.

O Qwen2.5 é a alternativa multilíngue mais forte para ampla cobertura de idiomas, mas, como mostram os benchmarks, fica atrás dos modelos especializados em árabe em tarefas culturais e dialetais, apesar do seu ecossistema maior.

O Jais (13B/70B) está incluído por completude, mas observe que ele é de origem nos EAU (Core42/G42, Abu Dhabi), não saudita. Ele permanece competitivo em tarefas de dialeto árabe e é Apache 2.0.

Modelo	Parâmetros	VRAM (Q4_K_M)	Licença	Ollama	Pontuação em árabe
ALLaM 7B	7B	6–8 GB	Apache 2.0	Sim (GGUF)	72–74% (AraLingBench)
ALLaM 34B	34B	~20 GB	Proprietário	Não (sem pesos públicos)	Sem benchmark público
AceGPT 7B	7B	6–8 GB	Apache 2.0	Port da comunidade	Forte no lançamento (2023)
AceGPT 13B	13B	10–14 GB	Apache 2.0	Port da comunidade	Forte no lançamento (2023)
Qwen2.5 7B	7B	6–8 GB	Apache 2.0	Sim	40–62% (AraLingBench)
Qwen2.5 72B	72B	40–48 GB	Apache 2.0	Sim	Maior, mas lacunas culturais permanecem
Jais 13B (EAU)	13B	10–14 GB	Apache 2.0	Limitado	Competitivo em dialeto

Comparação de pontuação no AraLingBench: o ALLaM 7B atinge 72–74% contra 40–62% do Qwen2.5 7B, uma diferença de até 32 pontos percentuais em tarefas linguísticas em árabe.

Rodando o ALLaM 7B localmente com o Ollama

O ALLaM 7B é distribuído como quantizações GGUF no Hugging Face, então você pode rodá-lo no Ollama com um Modelfile de uma linha. Siga estes passos.

Alternativa — llama.cpp diretamente: llama-cli -m ALLaM-7B-Instruct-Q4_K_M.gguf --chat-template chatml -p "أكمل الجملة التالية:" para máximo controle sobre o comprimento do contexto e a amostragem.
AceGPT via port da comunidade: ollama run salmatrafi/acegpt baixa o port do AceGPT mantido pela comunidade, caso você queira comparar.
Hardware mínimo: uma GPU com 8 GB de VRAM (RTX 3070/4060 ou melhor) ou Apple Silicon com 16 GB de memória unificada. Dimensione modelos maiores com a Calculadora de VRAM.

1
Baixe o GGUF do Hugging Face
Why it matters: Acesse humain-ai/ALLaM-7B-Instruct-preview no Hugging Face, navegue pelas quantizações e baixe o ALLaM-7B-Instruct-Q4_K_M.gguf (recomendado, ~4.5 GB) — o melhor equilíbrio entre qualidade e tamanho para uma GPU de 8 GB.
2
Instale o Ollama
Why it matters: Baixe o Ollama em ollama.com para o seu sistema operacional. Você precisa de aproximadamente 8 GB de VRAM em uma GPU NVIDIA, ou 16 GB de memória unificada no Apple Silicon, para rodar um modelo 7B confortavelmente.
3
Crie um Modelfile
Why it matters: Crie um arquivo de texto simples chamado Modelfile contendo uma única linha: FROM ./ALLaM-7B-Instruct-Q4_K_M.gguf — isso informa ao Ollama onde encontrar os pesos.
4
Registre o modelo no Ollama
Why it matters: Execute: ollama create allam-7b -f Modelfile. O Ollama importa o GGUF e o disponibiliza como um modelo nomeado que você pode chamar repetidamente.
5
Rode a inferência em árabe
Why it matters: Execute: ollama run allam-7b "اشرح مفهوم الذكاء الاصطناعي المحلي" (Explique o conceito de IA local). O modelo responde em Árabe Padrão Moderno.
6
Verifique e direcione a saída em árabe
Why it matters: Se o modelo responder em inglês, adicione um system prompt como "أجب دائماً باللغة العربية الفصحى" (Sempre responda em Árabe Padrão Moderno) para travar o registro e o idioma.

Necessidades de VRAM de LLMs locais por tamanho na quantização Q4_K_M: modelos de 7B precisam de 6–8 GB, 13B de 10–14 GB, 34B de 20–24 GB e 70B de 40–48 GB.

Como autoavaliar a qualidade de um modelo em árabe

Os benchmarks são um ponto de partida, mas você deve testar qualquer modelo em árabe no seu próprio domínio antes de implantar. Use estas verificações.

Consistência MSA vs. dialeto: envie o mesmo prompt em Árabe Padrão Moderno e em dialeto do Golfo, e verifique se o modelo mantém o registro e o significado em ambos.
Teste de contexto cultural: pergunte sobre práticas culturais sauditas, princípios das finanças islâmicas ou convenções de tratamento formal — e verifique se o enquadramento é apropriado, não apenas gramaticalmente válido.
Teste de concordância de gênero: peça ao modelo para descrever uma médica e um engenheiro, e verifique a concordância gramatical de gênero correta em árabe em verbos, adjetivos e pronomes.
Calibração de formalidade: solicite uma carta formal e depois uma mensagem casual — um bom modelo ajusta o registro; um fraco usa o mesmo tom para ambos.
Proxies de benchmark: use o AraLingBench (raciocínio morfológico e sintático) e o AraDiCE (consciência cultural e dialeto) como pontos de referência publicados ao comparar modelos.
Sinais de alerta: respostas em escrita latina a prompts em árabe, o registro dialetal errado ou um enquadramento culturalmente inadequado de temas religiosos sinalizam todos uma má adequação.
Regra prática: para qualquer caso de uso em árabe voltado ao cliente, teste com pelo menos 20 prompts específicos do domínio antes de implantar — pontuações de benchmark não capturam o seu conteúdo específico.

Perguntas frequentes: LLMs locais de árabe

O que é o ALLaM e quem o criou?

O ALLaM é uma família de modelos de linguagem em árabe construída pelo Centro Nacional de IA (NCAI) na SDAIA em parceria com a IBM, e agora comercializada por meio da HUMAIN, uma empresa de IA de propriedade do Public Investment Fund. A versão 7B Instruct está disponível publicamente sob Apache 2.0; existem variantes maiores 13B, 34B e 70B, mas apenas o 7B tem pesos abertos.

Posso rodar o ALLaM localmente?

Sim — o modelo ALLaM 7B Instruct tem quantizações GGUF no Hugging Face que rodam diretamente no Ollama e no llama.cpp em uma GPU com cerca de 8 GB de VRAM ou Apple Silicon com 16 GB de memória unificada. O 34B que alimenta o HUMAIN Chat é proprietário e não pode ser auto-hospedado.

O que é o AceGPT e ele ainda recebe manutenção?

O AceGPT é um modelo em árabe desenvolvido conjuntamente pela KAUST, CUHKSZ e SRIBD, oferecendo variantes 7B e 13B sob Apache 2.0. Ele superou o Jais no seu lançamento em 2023, mas sua última atualização no GitHub foi em dezembro de 2023, então parece sem manutenção — utilizável, mas não ativamente aprimorado.

Como o ALLaM se compara ao Qwen em árabe?

No AraLingBench, o ALLaM-7B pontua 72–74% contra 40–62% das variantes Qwen — uma diferença de 12–32 pontos percentuais em tarefas linguísticas em árabe. O Qwen tem um ecossistema maior e cobertura multilíngue mais ampla, mas o ALLaM é mais forte em morfologia, sintaxe e tarefas culturais específicas do árabe.

Por que os modelos multilíngues têm dificuldade com o árabe?

Eles costumam ser gramaticalmente fluentes, mas cultural e dialetalmente fracos. A precisão dialetal estrita pode cair para 0.016–0.078 em modelos menores, e o ajuste fino de um modelo multilíngue em árabe muitas vezes melhora a qualidade do MSA enquanto reduz a precisão dialetal — um paradoxo documentado. Dados de treinamento centrados no Ocidente também introduzem vieses culturais na forma como os modelos lidam com contexto islâmico e social.

De quanta VRAM eu preciso para um modelo 7B em árabe?

Cerca de 6–8 GB de VRAM na quantização Q4_K_M, com 8 GB ou mais recomendados para um desempenho confortável. Um modelo 13B precisa de 10–14 GB, um 34B cerca de 20–24 GB, e um 70B cerca de 40–48 GB.

O Jais é um modelo saudita?

Não — o Jais é de origem nos EAU, desenvolvido pela Core42/G42 em Abu Dhabi, não por uma instituição saudita. Ele está incluído aqui porque é um modelo em árabe capaz, sob Apache 2.0, competitivo em tarefas de dialeto, mas não faz parte da linhagem saudita (ALLaM/AceGPT).

Devo usar o ALLaM 34B ou o 7B?

Para implantação local, use o 7B — o 34B é proprietário e não auto-hospedável. Comece com o ALLaM 7B no seu próprio hardware e, se você precisar da capacidade do 34B, acesse-o por meio do produto HUMAIN Chat em vez de esperar pesos para download.

Como eu testo se um modelo lida corretamente com o árabe saudita?

Rode prompts de consistência MSA vs. dialeto, pergunte sobre práticas culturais sauditas e finanças islâmicas, e teste a concordância gramatical de gênero (por exemplo, descrevendo uma médica e um engenheiro). Fique atento a respostas em escrita latina, registro dialetal errado ou enquadramento culturalmente inadequado, e valide com pelo menos 20 prompts específicos do domínio antes de implantar.

O que é a HUMAIN?

A HUMAIN é uma empresa saudita de IA totalmente controlada pelo Public Investment Fund, lançada em maio de 2025. Ela comercializa o ALLaM e opera o HUMAIN Chat. É separada da SDAIA, mas herdou os modelos ALLaM do Centro Nacional de IA da SDAIA; a Aramco depois adquiriu uma participação minoritária.

Fontes

Hugging Face — humain-ai/ALLaM-7B-Instruct-preview (cartão do modelo, quantizações GGUF) — huggingface.co
AraLingBench — benchmark linguístico em árabe (arXiv 2511.14295) — arxiv.org
Landscape of Arabic LLMs — levantamento (arXiv 2506.01340) — arxiv.org
AraDiCE — avaliação de dialeto e cultura em árabe, COLING 2025 (arXiv 2409.11404) — arxiv.org
HUMAIN Chat lançado sobre o ALLaM 34B — Middle East AI News — middleeastainews.com
Gabinete saudita — 2026 declarado o Ano da Inteligência Artificial — spa.gov.sa

Nota sobre informações de terceiros

Este artigo faz referência a modelos de IA, benchmarks, preços e licenças de terceiros. O cenário da IA muda rapidamente. Pontuações de benchmark, termos de licença, nomes de modelos e preços de API podem mudar entre o momento em que foi escrito e quando você está lendo. Antes de tomar decisões de implantação ou conformidade com base neste artigo, verifique os dados atuais na fonte oficial de cada fornecedor: fichas de modelos do Hugging Face para licenças e benchmarks, sites dos fornecedores para preços de API e EUR-Lex para o texto atual do GDPR e da Lei de IA da UE. Este artigo reflete informações publicamente disponíveis em maio de 2026.

Run PromptQuorum with a local LLM, your own API keys, or both — you pick the backend.

Download the PromptQuorum Beta →

← Back to Local LLMs