Skip to main content
PromptQuorumPromptQuorum
Home/Local LLMs/Instalar LM Studio: configuración de interfaz gráfica para macOS, Windows y Linux
Getting Started

Instalar LM Studio: configuración de interfaz gráfica para macOS, Windows y Linux

·7 min de lectura·Por Hans Kuepper · Fundador de PromptQuorum, herramienta de despacho multi-modelo · PromptQuorum

LM Studio es una aplicación de escritorio que te permite explorar, descargar y ejecutar LLMs locales a través de una interfaz gráfica, sin necesidad de comandos en la terminal. Funciona en macOS, Windows y Linux, e incluye una interfaz de chat integrada y un servidor local compatible con OpenAI.

LM Studio es una aplicación de escritorio que te permite explorar, descargar y ejecutar LLMs locales a través de una interfaz gráfica, sin necesidad de comandos en la terminal. Funciona en macOS, Windows y Linux, e incluye una interfaz de chat integrada y un servidor local compatible con OpenAI. A partir de abril de 2026, LM Studio admite cualquier modelo GGUF cuantizado de Hugging Face.

Key Takeaways

  • Descarga LM Studio desde lmstudio.ai -- disponible para macOS (Apple Silicon + Intel), Windows y Linux (AppImage).
  • Mínimo: 8 GB de RAM. Recomendado: 16 GB de RAM para modelos 7B. Los Mac con Apple Silicon usan aceleración GPU por defecto.
  • El navegador de modelos integrado busca directamente en Hugging Face -- descarga modelos GGUF sin salir de la app.
  • LM Studio incluye una interfaz de chat integrada y un servidor local compatible con OpenAI en el puerto 1234.
  • Ideal para: principiantes que prefieren una interfaz gráfica, usuarios que quieren comparar varios modelos en paralelo y cualquiera que quiera un paquete completo sin comandos de terminal.

¿Qué es LM Studio?

LM Studio es una aplicación de escritorio para ejecutar LLMs locales. Proporciona un navegador gráfico de modelos, una interfaz de chat integrada y un servidor de API local, todo en una sola app. Internamente usa llama.cpp para la inferencia, el mismo motor que impulsa Ollama.

La diferencia clave con Ollama es que LM Studio es completamente visual. Exploras y descargas modelos desde la interfaz de la app, inicias chats con un clic y ajustas la configuración con controles deslizantes en lugar de archivos de configuración.

LM Studio es gratuito para uso personal. Lo desarrolla LM Studio, Inc. y fue lanzado en 2023. A partir de 2026, admite aceleración NVIDIA CUDA, AMD ROCm y Apple Metal.

¿Cuáles son los requisitos del sistema para LM Studio?

EspecificaciónMínimoRecomendado
Sistema operativomacOS 13.6, Windows 10, Ubuntu 22.04macOS 14+, Windows 11, Ubuntu 24.04
RAM8 GB16 GB o más
Almacenamiento500 MB para la app + espacio para modelos50 GB+ libres para varios modelos
GPU (opcional)NVIDIA GTX serie 10 o más recienteNVIDIA RTX 40/50, AMD RX 7000+ o Apple M-series

¿Cómo descargar e instalar LM Studio?

  1. 1
    Ve a lmstudio.ai y haz clic en el botón de descarga para tu sistema operativo.
  2. 2
    macOS: Abre el archivo .dmg y arrastra LM Studio a la carpeta Aplicaciones. En el primer inicio, aprueba el aviso de seguridad en Preferencias del Sistema → Privacidad y Seguridad.
  3. 3
    Windows: Ejecuta el instalador LM-Studio-Setup.exe. LM Studio se instala en %LOCALAPPDATA%\LM-Studio.
  4. 4
    Linux: Descarga el archivo .AppImage. Hazlo ejecutable con `chmod +x LM-Studio-*.AppImage` y ejecútalo. No se requiere instalación en el sistema.
  5. 5
    En el primer inicio, LM Studio muestra una pantalla de bienvenida y te pide descargar un modelo.

¿Cómo buscar y descargar un modelo en LM Studio?

Usa la pestaña de búsqueda (icono de lupa en la barra lateral izquierda) para encontrar modelos:

  1. 1
    Haz clic en la pestaña Search en la barra lateral izquierda.
  2. 2
    Escribe el nombre de un modelo, por ejemplo "llama 3.1" o "phi-3 mini".
  3. 3
    LM Studio muestra los modelos GGUF coincidentes de Hugging Face con tamaños de archivo y opciones de cuantización.
  4. 4
    Selecciona un nivel de cuantización. Para 8 GB de RAM: elige Q4_K_M (~4,5 GB para un modelo 7B). Para 16 GB de RAM: Q5_K_M o Q6_K ofrecen mejor calidad.
  5. 5
    Haz clic en la flecha de descarga. El progreso se muestra en la pestaña Downloads.

¿Cómo empezar a chatear con un modelo en LM Studio?

  1. 1
    Haz clic en la pestaña Chat (icono de bocadillo) en la barra lateral izquierda.
  2. 2
    En la parte superior de la ventana de chat, haz clic en el menú desplegable del selector de modelo y elige el modelo descargado.
  3. 3
    LM Studio carga el modelo en memoria -- esto tarda entre 5 y 30 segundos según el tamaño del modelo y el hardware.
  4. 4
    Escribe tu mensaje en el campo de entrada de la parte inferior y pulsa Enter o haz clic en Enviar.
  5. 5
    La respuesta del modelo se transmite token a token. La velocidad de generación aparece en la barra de estado en la parte inferior de la ventana.

¿Cómo ajustar la configuración del modelo en LM Studio?

El panel derecho de la pestaña Chat expone los parámetros de inferencia principales:

  • Temperature (por defecto 0.8): controla la aleatoriedad de las respuestas. Valores bajos (0.1-0.4) producen salidas más enfocadas y predecibles. Valores altos (0.8-1.2) producen salidas más variadas y creativas.
  • Context Length (por defecto 4096 tokens): el historial máximo de conversación que el modelo puede procesar. Un contexto más largo usa más RAM. La mayoría de los modelos 7B admiten entre 4096 y 8192 tokens.
  • GPU Layers (macOS/Linux/Windows con GPU): cuántas capas del modelo se descargan a la GPU. Establece el valor máximo para la inferencia más rápida si tu GPU tiene suficiente VRAM.
  • System Prompt: una instrucción persistente que se antepone a cada conversación. Úsala para definir el rol o el comportamiento del modelo.

¿Cómo activar el servidor local de LM Studio?

LM Studio incluye un servidor local que imita la API de OpenAI. Cualquier aplicación que funcione con OpenAI puede usar tu modelo local a través de este servidor:

  1. 1
    Haz clic en la pestaña Local Server (el icono "<->") en la barra lateral izquierda.
  2. 2
    Selecciona un modelo en el menú desplegable de la parte superior.
  3. 3
    Haz clic en "Start Server". El servidor se inicia en http://localhost:1234.
  4. 4
    Tu aplicación debe establecer `base_url = "http://localhost:1234/v1"` y cualquier cadena como clave de API (el servidor acepta cualquier valor).

Conectar con LM Studio mediante Python

python
from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:1234/v1",
    api_key="not-needed"
)

response = client.chat.completions.create(
    model="local-model",
    messages=[{"role": "user", "content": "What is a local LLM?"}]
)
print(response.choices[0].message.content)

LM Studio vs Ollama: ¿cuál debes usar?

FactorLM StudioOllama
InterfazAplicación de escritorio gráficaTerminal + API
Fuente de modelosHugging Face (cualquier modelo GGUF)Biblioteca de Ollama (curada, ~200 modelos)
Puerto de APIlocalhost:1234localhost:11434
Gestión de modelosNavegador GUI con info de tamaño de archivoComandos CLI (ollama pull, list, rm)
AutomatizaciónLimitada (orientada a GUI)Potente (scripting, Docker, CI)
Ideal paraPrincipiantes, usuarios de GUI, exploración de modelosDesarrolladores, automatización, despliegues en servidor

Solución de problemas comunes en LM Studio

LM Studio muestra "Not enough memory to load model"

El modelo requiere más RAM de la disponible. Cierra otras aplicaciones para liberar memoria o selecciona una cuantización menor (Q3_K_S en lugar de Q4_K_M). Como regla general: multiplica el tamaño del archivo del modelo por 1.2 para estimar la RAM necesaria. Un archivo de 4.5 GB necesita ~5.4 GB de RAM libre.

El modelo genera texto muy lentamente (menos de 5 tokens/seg)

El modelo está ejecutándose completamente en CPU. Comprueba GPU Layers en el panel derecho -- si muestra 0, tu GPU no se está usando. En macOS, LM Studio activa Metal (GPU) automáticamente para Apple Silicon. En Windows/Linux con NVIDIA, asegúrate de tener el driver actualizado y aumenta GPU Layers al valor máximo que se muestre.

No encuentro un modelo específico en la búsqueda de LM Studio

LM Studio busca archivos GGUF en Hugging Face. Si un modelo no aparece, intenta buscar directamente por el nombre del repositorio de Hugging Face (por ejemplo, "bartowski/Llama-3.1-8B-Instruct-GGUF"). Es posible que algunos modelos más recientes aún no estén indexados.

El servidor local devuelve errores "model not found"

Es necesario que haya un modelo cargado en la pestaña Local Server antes de que el servidor pueda responder. Abre la pestaña Local Server, selecciona un modelo en el menú desplegable y haz clic en Start Server. El nombre del modelo en las solicitudes de API puede ser cualquier cadena -- LM Studio usa el modelo que esté cargado en ese momento.

Próximos pasos tras instalar LM Studio

Con LM Studio funcionando, prueba Ejecuta tu primer LLM local para entender qué calidad de respuesta y velocidad esperar. Para recomendaciones de modelos adaptadas a tu hardware, consulta Mejores modelos LLM locales para principiantes. Si quieres solucionar problemas de configuración, consulta Solución de problemas de configuración de LLM local.

Fuentes

  • Sitio oficial de LM Studio -- Descargas y documentación
  • Hugging Face Model Hub -- Amplia gama de modelos cuantizados GGUF
  • GitHub de LM Studio -- Código fuente y debates de la comunidad

Errores comunes al instalar LM Studio

  • No asignar suficiente RAM del sistema para el modelo seleccionado en la configuración de LM Studio.
  • Usar un modelo pre-cuantizado que sigue siendo demasiado grande para la VRAM de tu GPU.
  • Esperar respuestas instantáneas de modelos grandes en sistemas solo CPU -- el tiempo de respuesta será de 10 a 30 segundos.

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each provider's official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Compare your local LLM against 25+ cloud models simultaneously with PromptQuorum.

Join the PromptQuorum Waitlist →

← Back to Local LLMs

Instalar LM Studio: configuración de interfaz gráfica para macOS, Windows y Linux