Key Takeaways
- El mejor en general: Mistral Small 3.1 24B (salida más concisa, tono adecuado). El mejor multilingüe: Qwen2.5 7B (francés/alemán/español/japonés). El mejor para adaptación de tono: Llama 3.1 8B.
- Los modelos 70B son demasiado verbosos para textos cortos. Para documentos de más de 2 páginas, Llama 3.3 70B con 128K de contexto maneja propuestas de múltiples secciones de forma fiable.
- Mistral Small 3.1 y Llama 3.1 8B son ideales para correos, propuestas y memos.
- Redacción de correos: Mistral Small 3.1. Propuesta de negocio: Llama 3.1 8B con ejemplos de tono.
- Transferencia de voz de marca: Proporciona 2-3 correos de ejemplo; el modelo aprende el tono y la elección de palabras.
- Modo edición > generación: Usa el modelo para refinar borradores existentes (mejor control que la generación pura).
- Velocidad: Mistral Small 3.1 genera un correo de 200 palabras en 8-15 seg. Llama 3.1 8B en 5-10 seg.
- Costo: Cero (código abierto) vs. $30/mes (ChatGPT Plus) o $200/mes (empresa).
¿Qué modelos destacan en tono profesional?
La redacción profesional premia la claridad y la concisión. Los modelos más pequeños son mejores.
- Mistral Small 3.1 24B: La salida más concisa. Produce contenido corto, limpio y profesional (correos, mensajes de Slack, memos ejecutivos). El mejor control de tono.
- Llama 3.1 8B: Equilibrado. Bueno para contenido de longitud media (propuestas, memos). Se adapta bien a ejemplos de voz de marca.
- Qwen2.5 7B: Excelente para redacción profesional en idiomas distintos al inglés. Tokenización nativa para francés, alemán, español, japonés y chino. La mejor opción multilingüe.
- Para textos cortos (correos, memos), los modelos de 7B a 24B producen salidas más limpias que los de 70B. Para contenido extenso (propuestas, informes de más de 2 páginas), Llama 3.3 70B con 128K de contexto maneja documentos de múltiples secciones de forma fiable.
Tareas de redacción y recomendaciones de modelos
| Tarea | Mejor modelo | Estrategia de prompt | Calidad de salida |
|---|---|---|---|
| Redacción de correo | Mistral Small 3.1 24B | "Voz activa, máximo 150 palabras, sin jerga" | Excelente -- conciso, profesional |
| Propuesta de negocio (1-3 páginas) | Llama 3.1 8B | Proporcionar 2-3 propuestas como referencia de estilo | Buena -- se adapta bien a ejemplos de tono |
| Memo ejecutivo | Mistral Small 3.1 24B | "Formato: Problema / Recomendación / Próximos pasos" | Excelente -- salida estructurada |
| Mensaje de Slack/interno | Qwen2.5 7B | "Informal pero profesional, máximo 2-3 oraciones" | Buena -- baja latencia en tiempo real |
| Correo empresarial en otro idioma | Qwen2.5 7B | "Correo empresarial en [idioma], registro formal" | Excelente -- tokenización nativa |
| Resumen de contrato | Llama 3.3 70B | "Resume las obligaciones clave y los puntos de riesgo" | La mejor -- contexto largo para documentos completos |
| Refinado de borrador existente | Cualquier modelo 7B | "Edita para mayor claridad, elimina jerga, voz activa" | Excelente -- el mejor caso de uso del modo edición |
Ingeniería de prompts para la voz de marca
La redacción profesional requiere coherencia. Enseña al modelo tu voz.
- 1Reúne ejemplos: 3-5 correos o memos con tu voz de marca. Cuanto más específicos, mejor; usa correos reales enviados, no idealizados.
- 2Crea una plantilla de prompt: "Escribes así: [EJEMPLOS]. Ahora redacta [TAREA] con esta voz."
- 3Especifica restricciones: "Máximo 150 palabras.", "Voz activa.", "Sin jerga ni palabras de moda."
- 4Itera sobre los resultados: Si el primer borrador es demasiado formal, refina: "Usa un lenguaje más sencillo, elimina las palabras de moda, escribe como si enviaras un mensaje a un colega."
- 5Guarda las plantillas: Guarda los prompts por tipo de redacción (ventas, soporte, interno). Reutilízalos para mantener coherencia.
Errores comunes en redacción profesional
- Usar modelos de 70B para textos cortos. Producen salidas verbosas y sobre-explicadas. Para correos y memos, Mistral Small 3.1 24B o Llama 3.1 8B es más rápido y conciso.
- No proporcionar ejemplos. El modelo adivina tu voz. Proporciona siempre 2-3 correos o memos reales enviados con tu voz de marca.
- Confiar en el primer borrador. La redacción profesional requiere 1-2 ciclos de edición. Usa prompts de edición, no flujos de trabajo solo de generación.
- No establecer la longitud de contexto para documentos largos: Ollama usa por defecto 2048 tokens. Una propuesta de 2 páginas tiene aproximadamente 1.500-2.000 palabras, cerca o por encima de este límite. Establece como mínimo `PARAMETER num_ctx 8192` en tu Modelfile para tareas de redacción profesional. Para revisión de contratos o informes de varias páginas, usa 32K de contexto.
- Usar el mismo modelo para redacción y edición: El mejor flujo de trabajo es de dos etapas: genera un borrador inicial con cualquier modelo 7B (rápido), luego usa Mistral Small 3.1 24B en modo edición para refinar el tono, eliminar jerga y mejorar la estructura. Usar un modelo de 70B para ambas tareas es más lento y produce salidas menos concisas que este enfoque de dos modelos.
Configuración: asistente de redacción local
- 1Inicia Ollama con Mistral Small 3.1: `ollama run mistral-small3.1`.
- 2Instala la extensión de VS Code "Continue" o la extensión de navegador para aplicaciones web.
- 3Crea un system prompt personalizado con tus ejemplos de voz de marca.
- 4Asigna un atajo de teclado (p. ej., Ctrl+K) para activar la autocompletación.
- 5Redacta el correo → selecciona → Ctrl+K → "Refina este correo para [tono]" → copia el resultado.
LLMs locales para redacción profesional: contexto regional
UE / RGPD
Para profesionales de la UE que redactan correos o documentos con referencias a clientes, empleados o socios comerciales, ejecutar un asistente de redacción local significa que ningún dato personal —nombres, datos de contacto, condiciones de acuerdos— se transmite a servicios de IA en la nube. El artículo 6 del RGPD exige una base legal para el tratamiento de datos personales; usar una API de IA en la nube para correspondencia empresarial que incluye nombres de clientes y datos de empresa crea una relación de tratamiento de datos que requiere un DPA según el artículo 28.
La inferencia local elimina esto por completo. Mistral Small 3.1 24B (Mistral AI, Francia, Apache 2.0) es el modelo de la UE recomendado: origen europeo, licencia limpia y fuerte capacidad de seguimiento de instrucciones para redacción profesional formal en alemán, francés e inglés.
España y Latinoamérica
La redacción empresarial en español varía entre España y Latinoamérica en términos de registro formal. En España, el tratamiento de usted es estándar en correspondencia formal; en Latinoamérica, el uso varía por país. Para correos formales, añade al system prompt: "Escribe en español formal con tratamiento de usted. Tono profesional y objetivo sin anglicismos." Tanto Mistral Small 3.1 como Qwen2.5 7B siguen esta instrucción de forma fiable. Qwen2.5 7B también admite variantes regionales del español para comunicación interna más informal.
Japón (METI)
La redacción empresarial japonesa tiene registros de formalidad estrictos (niveles de keigo: teineigo, sonkeigo, kenjōgo). Los LLMs estándar usan teineigo por defecto pero no pueden producir sonkeigo ni kenjōgo de forma fiable sin instrucciones explícitas. Para correspondencia empresarial en japonés: usa Qwen2.5 7B con instrucciones explícitas de keigo: "メールは丁寧な敬語(尊敬語と謙譲語)を使用してください". El tokenizador japonés de Qwen2.5 maneja el vocabulario empresarial en kanji/kana notablemente mejor que Llama en el mismo nivel de tamaño.
FAQ
¿Por qué Mistral Small 3.1 es mejor que Llama 3.1 para correos?
Mistral Small 3.1 es más conciso. Llama 3.1 es más adaptable. Para pura brevedad/precisión: Mistral Small 3.1. Para ajuste de tono: Llama 3.1.
¿Puedo usar un modelo 13B para redacción profesional?
Sí, pero no es necesario. El 7B es más rápido e igual de bueno. El 13B es ligeramente mejor para propuestas largas (más de 2 páginas).
¿Debo usar el modo generación o el modo edición?
El modo edición (refinar borrador existente) es más seguro. El modo generación es más rápido pero requiere más trabajo de prompting.
¿Cómo evito sonar como ChatGPT?
Usa modelos pequeños (7B-24B), proporciona ejemplos de tu marca, solicita voz activa + oraciones cortas, sin palabras de relleno.
¿Puedo usar LLMs locales para correos confidenciales?
Sí. 100% privado. Ningún dato sale de tu equipo. Esta es la ventaja principal frente a las APIs en la nube.
¿Qué hago si la salida es demasiado formal?
Refina el prompt: "Elimina la jerga. Usa lenguaje cotidiano. Escribe como si enviaras un mensaje a un colega."
¿Cuál es el mejor LLM local para redacción profesional en idiomas distintos al inglés?
Qwen2.5 7B admite 29 idiomas de forma nativa, incluyendo francés, alemán, español, japonés, chino, coreano y árabe. Procesa texto empresarial en otros idiomas con mayor eficiencia de tokens que Llama o Mistral. Para idiomas europeos formales (alemán, francés, español), Mistral Small 3.1 24B es competitivo gracias a sus datos de entrenamiento de la UE. Ejecuta: `ollama run qwen2.5:7b` para idiomas asiáticos y de Oriente Medio; `ollama run mistral-small3.1` para redacción formal europea.
¿Cómo uso un LLM local para replicar la voz de marca de mi empresa?
Proporciona 3-5 ejemplos de comunicaciones existentes en tu system prompt: "Escribes con este estilo: [pega ejemplos]. Mantén este tono y vocabulario en todas las respuestas." El modelo aprende patrones de vocabulario, preferencias de longitud de oraciones y nivel de formalidad a partir de los ejemplos. Actualiza los ejemplos cada 6 meses a medida que tu voz de marca evoluciona.
¿Pueden los LLMs locales escribir en español formal?
Sí, con instrucción explícita. Añade a tu system prompt: "Escribe en español formal y profesional. Usa tratamiento de usted en comunicaciones formales cuando corresponda. Tono objetivo y profesional sin anglicismos." Mistral Small 3.1 y Qwen2.5 7B siguen esta instrucción de manera fiable.
¿Qué modelo local es mejor para editar texto existente frente a generar desde cero?
Para edición: cualquier modelo 7B (Qwen2.5 7B, Llama 3.1 8B) funciona bien; editar es menos exigente que generar. Para generar desde cero en documentos complejos (propuestas, informes): Mistral Small 3.1 24B produce salida más estructurada. El enfoque de dos etapas funciona mejor: genera el borrador con un modelo 7B (rápido), refina con Mistral Small 3.1 en modo edición.
Fuentes
- Mistral AI. (2024). "Mistral Small 3.1 Release." https://mistral.ai/news/mistral-small-3-1/ -- Especificaciones del modelo y benchmarks de seguimiento de instrucciones para Mistral Small 3.1 24B.
- Alibaba Qwen Team. (2025). "Qwen2.5 Technical Report." https://arxiv.org/abs/2412.15115 -- Datos de capacidad multilingüe incluyendo soporte para redacción empresarial en japonés, alemán, francés y chino.
- Meta AI. (2024). "Llama 3.1 Model Card." https://llama.meta.com/ -- Evaluación de adaptación de tono y seguimiento de instrucciones para Llama 3.1 8B.