DACHMistral Enterprise & Open Source

KI – On-Demand, isoliert & Edge

Über Mistral Enterprise & Forge haben wir Zugriff auf die jeweils aktuellsten Mistral-Modelle sowie die Möglichkeit, diese auf Mistrals Infrastruktur zu trainieren und zu alignen – Domain Alignment, RLHF, LoRA, volles Custom Training. Die Modelle verbleiben auf Mistrals Plattform und sind über Mistral Studio, Vibe und Chat nutzbar. Agenten, Prozesse und Pipelines laufen direkt auf Mistral – keine Datenverlagerung nach DACH nötig.Auf unserer eigenen Infrastruktur in Genf betreiben wir offene Hochleistungsmodelle für Pre-Training und Own-Training auf dedizierten Servern. Fine-Tuning auf LoRA/QLoRA-Basis, Custom Checkpoints, Multi-LoRA-Serving – deine Daten verlassen nie die isolierte Umgebung. Anbindung über REST API oder MCP-Proxy, kompatibel mit bestehenden LLM-Workflows.Für lokale, latenzkritische Anwendungen setzen wir auf Apple Silicon Edge: Mit CoreML und MLX auf Mac Studio 4-bit-quantisierte Narrow Models. Unter 10 ms Antwortzeit, netzunabhängig, DSGVO-konform. Ideal für Sprachassistenten, Dokumentenklassifikation und Echtzeit-Summaries.

Jetzt starten info@vombat.kiwi

Modelle

Verfügbare LLMs – Benchmarks & Spezifikationen

Alle Modelle laufen auf isolierter Infrastruktur in DACH. Daten verlassen nie den Raum.

MMLU Benchmark (5-Shot, %)

Mistral Medium 3.5

87%

Mistral Small 4

78%

Qwen 2.5 7B

74%

Qwen 2.5 72B

85%

Quelle: Open LLM Leaderboard (Hugging Face) & offizielle Model Cards. Stand Juni 2026.

Latenz

< 10ms

Apple Silicon Edge (Mac Studio) – keine Netzwerklatenz

Deployment

Mistral Enterprise (Studio/Vibe) · Genf isoliert · Mac Studio Edge

Data Residency

DACH

Bayern und Genf – keine US-Jurisdiktion

Services

Leistungen im Überblick

Mistral Enterprise & Forge

Aktuellste Mistral-Modelle inkl. Custom Training via Forge. Nutzbar über Mistral Studio, Vibe und Chat – Agenten, Pipelines und Prozesse auf Mistrals Plattform, keine Verlagerung nötig.

Genf – Offene Modelle & Fine-Tuning

Hochleistungsmodelle auf unserer Infrastruktur in Genf. LoRA/QLoRA-Fine-Tuning, Custom Checkpoints, Multi-LoRA-Serving. Deine Daten, dein isolierter Endpunkt.

Pre-Trained & Fine-Tuning

LoRA/QLoRA-Fine-Tuning auf Mistral und Qwen. Custom Checkpoints und Multi-LoRA-Serving als dedizierter API-Endpunkt in DACH. Own-Trained Modelle in deiner isolierten Umgebung.

Apple Silicon Edge

Mit CoreML und MLX auf Mac Studio 4-bit-quantisierte Narrow Models. Unter 10 ms Antwortzeit, netzunabhängig, DSGVO-konform. Speech-to-Text, Klassifikation, Summaries – lokal auf Apple Silicon.

KI einsetzen – nicht ausgeliefert sein

Mistral Enterprise & Forge, offene Modelle in Genf oder Apple Silicon Edge – DACH-basiert, DSGVO-konform.

Jetzt starten info@vombat.kiwi