Wichtigste Erkenntnisse
- Gesamtbeste: Mistral Small 3.1 24B (präzisester Output, tongerecht). Mehrsprachig: Qwen2.5 7B (Französisch/Deutsch/Spanisch/Japanisch). Beste Tonanpassung: Llama 3.1 8B.
- 70B-Modelle sind für Kurzform-Texte zu weitschweifig. Für Dokumente über 2 Seiten verarbeitet Llama 3.3 70B mit 128K Kontext mehrteilige Angebote zuverlässig.
- Mistral Small 3.1 und Llama 3.1 8B eignen sich ideal für E-Mails, Angebote und Memos.
- E-Mail-Entwurf: Mistral Small 3.1. Geschäftsangebot: Llama 3.1 8B mit Tonbeispielen.
- Markenstimmen-Übertragung: 2-3 Beispiel-E-Mails bereitstellen; das Modell erlernt Ton und Wortwahl.
- Bearbeitungsmodus > Generierung: Modell nutzen, um bestehende Entwürfe zu verfeinern (bessere Kontrolle als reine Generierung).
- Geschwindigkeit: Mistral Small 3.1 erzeugt eine 200-Wörter-E-Mail in 8-15 Sek. Llama 3.1 8B in 5-10 Sek.
- Kosten: Kostenlos (Open Source) vs. 30 $/Monat (ChatGPT Plus) oder 200 $/Monat (Enterprise).
Welche Modelle eignen sich für Geschäftskorrespondenz?
Geschäftskorrespondenz erfordert Klarheit und Präzision. Kleinere Modelle sind hier überlegen.
- Mistral Small 3.1 24B: Präzisester Output. Erzeugt klare, professionelle Kurzform-Inhalte (E-Mails, Slack-Nachrichten, Geschäftsmemos). Beste Tonkontrolle.
- Llama 3.1 8B: Ausgewogen. Gut für mittellange Inhalte (Angebote, Memos). Passt sich gut an Markenstimmen-Beispiele an.
- Qwen2.5 7B: Ausgezeichnet für nicht-englische Geschäftskorrespondenz. Native Tokenisierung für Französisch, Deutsch, Spanisch, Japanisch und Chinesisch. Beste mehrsprachige Wahl.
- Für Kurzform-Texte (E-Mails, Memos) erzeugen 7B-24B-Modelle sauberere Ergebnisse als 70B-Modelle. Für Langform-Inhalte (Angebote, Berichte über 2 Seiten) verarbeitet Llama 3.3 70B mit 128K Kontext mehrteilige Dokumente zuverlässig.
Schreibaufgaben & Modellempfehlungen
| Aufgabe | Empfohlenes Modell | Prompt-Strategie | Ausgabequalität |
|---|---|---|---|
| E-Mail-Entwurf | Mistral Small 3.1 24B | "Aktive Stimme, max. 150 Wörter, kein Fachjargon" | Ausgezeichnet -- präzise, professionell |
| Geschäftsangebot (1-3 Seiten) | Llama 3.1 8B | 2-3 Angebote als Stilreferenz bereitstellen | Gut -- passt sich gut an Tonbeispiele an |
| Geschäftsmemo | Mistral Small 3.1 24B | "Format: Problem / Empfehlung / Nächste Schritte" | Ausgezeichnet -- strukturierter Output |
| Slack-/interne Nachricht | Qwen2.5 7B | "Locker, aber professionell, max. 2-3 Sätze" | Gut -- niedrige Latenz in Echtzeit |
| Nicht-englische Geschäfts-E-Mail | Qwen2.5 7B | "[Sprache] Geschäfts-E-Mail, formelles Register" | Ausgezeichnet -- native Tokenisierung |
| Vertragszusammenfassung | Llama 3.3 70B | "Wesentliche Verpflichtungen und Risikopunkte zusammenfassen" | Optimal -- langer Kontext für vollständige Dokumente |
| Entwurfsüberarbeitung | Beliebiges 7B-Modell | "Klarheit verbessern, Buzzwords entfernen, aktive Stimme" | Ausgezeichnet -- optimaler Anwendungsfall für Bearbeitungsmodus |
Prompt-Engineering für die Markenstimme
Geschäftskorrespondenz erfordert Konsistenz. Bringen Sie dem Modell Ihre Stimme bei.
- 1Beispiele sammeln: 3-5 E-Mails oder Memos in Ihrer Markenstimme. Je spezifischer, desto besser -- verwenden Sie echte versendete E-Mails, keine idealisierten.
- 2Prompt-Vorlage erstellen: „Sie schreiben so: [BEISPIELE]. Verfassen Sie jetzt [AUFGABE] in diesem Stil."
- 3Einschränkungen festlegen: „Maximal 150 Wörter.", „Aktive Stimme.", „Kein Fachjargon."
- 4Outputs verfeinern: Falls der erste Entwurf zu formell ist: „Verwenden Sie einfachere Sprache, entfernen Sie Buzzwords, schreiben Sie wie in einer Nachricht an einen Kollegen."
- 5Vorlagen speichern: Prompts nach Schreibtyp (Vertrieb, Support, intern) speichern. Für Konsistenz wiederverwenden.
Häufige Fehler beim Geschäftsschreiben
- 70B-Modelle für Kurzform-Texte verwenden. Sie erzeugen weitschweifigen, übermäßig erklärenden Output. Für E-Mails und Memos ist Mistral Small 3.1 24B oder Llama 3.1 8B schneller und präziser.
- Keine Beispiele bereitstellen. Das Modell rät Ihre Stimme. Geben Sie stets 2-3 echte versendete E-Mails oder Memos in Ihrer Markenstimme an.
- Dem ersten Entwurf vertrauen. Geschäftskorrespondenz erfordert 1-2 Überarbeitungszyklen. Verwenden Sie Bearbeitungs-Prompts statt reiner Generierungs-Workflows.
- Keine Kontextlänge für lange Dokumente festlegen: Ollama verwendet standardmäßig 2.048 Token. Ein zweiseitiges Geschäftsangebot umfasst etwa 1.500-2.000 Wörter -- nahe oder über diesem Limit. Setzen Sie mindestens `PARAMETER num_ctx 8192` in Ihrer Modelfile für Geschäftskorrespondenz. Für Vertragsreviews oder mehrseitige Berichte verwenden Sie 32K Kontext.
- Dasselbe Modell für Schreiben und Bearbeiten verwenden: Der optimale Workflow ist zweistufig: Einen groben Entwurf mit einem beliebigen 7B-Modell (schnell) generieren, dann Mistral Small 3.1 24B im Bearbeitungsmodus nutzen, um Ton zu verfeinern, Fachjargon zu entfernen und die Struktur zu straffen. Die Verwendung eines 70B-Modells für beide Aufgaben ist langsamer und erzeugt weniger präzisen Output als dieser Zwei-Modell-Ansatz.
Einrichtung: Lokaler Schreibassistent
- 1Ollama mit Mistral Small 3.1 starten: `ollama run mistral-small3.1`.
- 2VS-Code-Erweiterung „Continue" oder die Browser-Erweiterung für Web-Apps installieren.
- 3Einen benutzerdefinierten System-Prompt mit Ihren Markenstimmen-Beispielen erstellen.
- 4Eine Tastenkombination (z. B. Strg+K) für die Textvervollständigung festlegen.
- 5E-Mail verfassen → markieren → Strg+K → „Diese E-Mail für [Ton] überarbeiten" → Ergebnis kopieren.
Lokale LLMs für Geschäftskorrespondenz: Regionaler Kontext
EU / DSGVO
Für EU-Geschäftsprofis, die E-Mails oder Dokumente mit Bezug zu Kunden, Mitarbeitern oder Geschäftspartnern verfassen, bedeutet ein lokaler Schreibassistent, dass keine personenbezogenen Daten -- Namen, Kontaktdaten, Vertragsbedingungen -- an Cloud-KI-Dienste übermittelt werden. Die DSGVO Art. 6 erfordert eine Rechtsgrundlage für die Verarbeitung personenbezogener Daten; die Nutzung einer Cloud-KI-API für Geschäftskorrespondenz mit Kundennamen und Unternehmensdaten begründet eine Auftragsverarbeitungsbeziehung, die einen AVV gemäß Art. 28 erfordert.
Lokale Inferenz schließt dies vollständig aus. Mistral Small 3.1 24B (Mistral AI, Frankreich, Apache 2.0) ist das empfohlene EU-Modell -- europäischer Ursprung, saubere Lizenz und starke Instruction-Following-Leistung für formale deutsche, französische und englische Geschäftskorrespondenz.
Deutschland: BSI-Grundschutz & DIN 5008
Für BSI-Grundschutz-konforme IT-Umgebungen gilt: Der Einsatz lokaler KI-Modelle für die Bearbeitung von Geschäftskorrespondenz entspricht dem Schutzbedarf „normal" bis „hoch" gemäß BSI-Standard 200-2, da keine Datenübermittlung an externe Dienste stattfindet. Das BSI empfiehlt für KRITIS-Bereiche explizit die Bevorzugung lokal betriebener Systeme.
Mistral Small 3.1 ist das einzige lokal betreibbare Modell in vergleichbarer Größe, das Output erzeugt, der den DIN-5008-Formatierungskonventionen für Geschäftsbriefe folgt -- inklusive korrekter Sie-Form, Datumsformat (TT.MM.JJJJ) und Absatzstruktur.
Für DACH-Unternehmen (Deutschland, Österreich, Schweiz): Qwen2.5 7B unterstützt österreichische Fachterminologie und Schweizer Geschäftskorrespondenz besser als Llama-Modelle gleicher Größe.
Japan (METI)
Japanische Geschäftskorrespondenz erfordert strikte Höflichkeitsregister (Keigo-Ebenen: Teineigo, Sonkeigo, Kenjōgo). Standard-LLMs verwenden standardmäßig Teineigo (höflich), können aber ohne explizite Prompt-Anweisungen nicht zuverlässig Sonkeigo (ehrerbietig) oder Kenjōgo (bescheiden) produzieren. Für japanische Geschäftskorrespondenz: Qwen2.5 7B mit expliziten Keigo-Anweisungen verwenden: „メールは丁寧な敬語(尊敬語と謙譲語)を使用してください". Qwen2.5s japanischer Tokenizer verarbeitet Kanji/Kana-Geschäftsvokabular deutlich besser als Llama in derselben Größenklasse.
FAQ
Warum ist Mistral Small 3.1 besser als Llama 3.1 für E-Mails?
Mistral Small 3.1 ist präziser. Llama 3.1 ist anpassungsfähiger. Für reine Kürze/Präzision: Mistral Small 3.1. Für Tonanpassung: Llama 3.1.
Kann ich ein 13B-Modell für Geschäftskorrespondenz verwenden?
Ja, aber unnötig. 7B ist schneller und qualitativ gleichwertig. 13B ist für lange Angebote (>2 Seiten) leicht besser.
Soll ich den Generierungs- oder Bearbeitungsmodus verwenden?
Der Bearbeitungsmodus (bestehenden Entwurf verfeinern) ist sicherer. Der Generierungsmodus ist schneller, erfordert aber mehr Prompt-Aufwand.
Wie vermeide ich einen ChatGPT-typischen Klang?
Kleine Modelle (7B-24B) verwenden, Markenstimmen-Beispiele bereitstellen, aktive Stimme + kurze Sätze anfordern, keine Füllwörter.
Kann ich lokale LLMs für vertrauliche E-Mails verwenden?
Ja. 100 % privat. Keine Daten verlassen Ihren Rechner. Dies ist der Hauptvorteil gegenüber Cloud-APIs.
Was tun, wenn der Output zu formell ist?
Prompt anpassen: „Buzzwords entfernen. Alltagssprache verwenden. Schreiben Sie, als würden Sie einem Kollegen eine Nachricht schicken."
Welches lokale LLM ist am besten für nicht-englische Geschäftskorrespondenz?
Qwen2.5 7B unterstützt 29 Sprachen nativ, einschließlich Französisch, Deutsch, Spanisch, Japanisch, Chinesisch, Koreanisch und Arabisch. Für formale europäische Geschäftssprachen (Deutsch, Französisch, Spanisch) ist Mistral Small 3.1 24B dank EU-Trainingsdaten konkurrenzfähig. Ausführen: `ollama run qwen2.5:7b` für asiatische Sprachen; `ollama run mistral-small3.1` für europäisches Formalschreiben.
Wie verwende ich ein lokales LLM, um die Markenstimme meines Unternehmens zu treffen?
3-5 Beispiele bestehender Unternehmenskommunikation im System-Prompt bereitstellen: „Sie schreiben in diesem Stil: [Beispiele einfügen]. Behalten Sie diesen Ton und Wortschatz in allen Antworten bei." Die Beispiele alle 6 Monate aktualisieren, wenn sich Ihre Markenstimme weiterentwickelt.
Können lokale LLMs in der deutschen Sie-Form schreiben?
Ja, mit expliziter Anweisung. In Ihren System-Prompt aufnehmen: „Schreiben Sie auf Deutsch. Verwenden Sie ausschließlich die Sie-Form. Sachlicher, professioneller Ton ohne Anglizismen." Sowohl Mistral Small 3.1 als auch Qwen2.5 7B befolgen diese Anweisung zuverlässig. Ohne explizite Anweisung verwenden Modelle im Deutschen standardmäßig die informelle Du-Form.
Welches lokale Modell eignet sich besser zum Überarbeiten vorhandener Texte als zum Generieren von Grund auf?
Zum Überarbeiten: Beliebige 7B-Modelle (Qwen2.5 7B, Llama 3.1 8B) funktionieren gut -- Überarbeiten ist weniger anspruchsvoll als Generieren. Für die Generierung komplexer Dokumente (Angebote, Berichte): Mistral Small 3.1 24B erzeugt strukturierteren Output. Zweistufiger Ansatz empfohlen: Entwurf mit 7B generieren, mit Mistral Small 3.1 im Bearbeitungsmodus verfeinern.
Muss ich bei der Verwendung eines lokalen LLMs für Geschäftskorrespondenz die DSGVO beachten?
Ja, aber lokale Inferenz vereinfacht die Compliance erheblich. Bei Cloud-KI-Diensten für Korrespondenz mit Kundennamen und Vertragsinhalten begründen Sie eine Auftragsverarbeitungsbeziehung gemäß DSGVO Art. 28 (AVV erforderlich). Lokale Inferenz eliminiert dies vollständig: Keine Daten verlassen Ihre Infrastruktur, kein Auftragsverarbeiter, Verarbeitung unter alleiniger Kontrolle gemäß DSGVO Art. 6 Abs. 1 lit. b. Für BSI-Grundschutz-konforme Umgebungen erfüllen lokale LLMs die Anforderungen des Bausteins OPS.1.2.4 ohne zusätzliche Sicherheitsmaßnahmen für Cloud-Übertragungen.
Sind lokale LLMs für den deutschen Mittelstand geeignet?
Ja. Lokale LLMs sind für den Mittelstand besonders geeignet: keine SaaS-Abonnements (0 € laufende Kosten nach Hardware), keine Cloud-Datenübermittlung (DSGVO-konform ab Inbetriebnahme), kein Vendor-Lock-in. Empfohlene Konfiguration für KMU (50-500 Mitarbeiter): Mistral Small 3.1 24B auf einem Workstation-Server (z. B. Dell Precision mit RTX 4090, ~3.500 €), zentral über Ollama bereitgestellt, per VS-Code-Erweiterung „Continue" in Mitarbeiter-Workflows integriert. Das BSI empfiehlt für KRITIS-Bereiche die Bevorzugung lokal betriebener KI-Systeme gemäß IT-Grundschutz-Kompendium.
Quellen
- Mistral AI. (2024). „Mistral Small 3.1 Release." https://mistral.ai/news/mistral-small-3-1/ -- Modellspezifikationen und Instruction-Following-Benchmarks für Mistral Small 3.1 24B.
- Alibaba Qwen Team. (2025). „Qwen2.5 Technical Report." https://arxiv.org/abs/2412.15115 -- Mehrsprachige Leistungsdaten einschließlich japanischer, deutscher, französischer und chinesischer Geschäftsschreib-Unterstützung.
- Meta AI. (2024). „Llama 3.1 Model Card." https://llama.meta.com/ -- Tonanpassung und Instruction-Following-Evaluierung für Llama 3.1 8B.