MiMo v2 TTS
Generieren Sie hochwertige Sprache aus Text mit der neuesten MiMo v2 TTS-API.
Text-zu-Sprache-Generator
Dieses Tool basiert auf dem neuesten MiMo v2 TTS (Text-to-Speech) Modell von Xiaomi, das Text in natürliche Sprache umwandelt. Sie können Sprachstile konfigurieren und detaillierte Audio-Tags einfügen.
⚠️ Haftungsausschluss: Dieses Tool wurde schnell erstellt und kann Fehler aufweisen. Bei Problemen oder Wünschen melden Sie sich gerne!
🔗 Schnelle Links
- 🔑 MIMO API-Schlüssel anfordern (Konsole)
- 📖 Offizielle API-Dokumentation
- 💰 Abrechnung: Derzeit für begrenzte Zeit kostenlos.
🌟 Konfigurationsanleitung
1. Bewerbung für API-Schlüssel & Sicherheit
Bevor Sie dieses Tool verwenden, müssen Sie einen gültigen MIMO API-Schlüssel angeben.
- So bewerben Sie sich: Besuchen Sie die Xiaomi MiMo-Konsole, um Ihren eindeutigen Schlüssel zu generieren.
- 🔒 Datenschutzgarantie: Alle API-Anrufe von dieser Website erfolgen direkt von Ihrem Browser zu den offiziellen Servern. Wir werden Ihren API-Schlüssel NIEMALS aufzeichnen, sammeln oder hochladen. Wenn Sie immer noch Bedenken haben, können Sie den Schlüssel nach der Nutzung löschen oder widerrufen.
2. Sprachauswahl (Voreingestellte Stimmen)
Sie können eine voreingestellte offizielle Stimme aus der Dropdown-Liste auswählen:
mimo_default: MiMo-Standarddefault_zh: MiMo-Chinesische Frauenstimmedefault_en: MiMo-Englische Frauenstimme (Hinweis: Das Klonen von Stimmen wird derzeit von der API nicht unterstützt)
3. Allgemeine Steuerung des Sprachstils (Style)
Geben Sie Ihre gewünschte Emotion oder Ihren Dialekt in das Feld "Stil" ein. Das Tool fügt dies automatisch als <style>Ihr Stil</style> am Anfang des Inhalts hinzu. Sie können sogar durch Leerzeichen getrennte Stile kombinieren!
Unterstützte Stile umfassen unter anderem:
- Sprechgeschwindigkeit: Beschleunigen / Verlangsamen
- Emotionen: Glücklich / Traurig / Wütend
- Rollen: Sun Wukong / Lin Daiyu
- Stilwechsel: Flüstern / Hohe Stimme / Taiwanesischer Akzent / Singen
- Dialekte: Nordostchinesischer Dialekt / Sichuan-Dialekt / Kantonesisch
Beispiele:
<style>Glücklich</style>Morgen ist Freitag, so glücklich!<style>Flüstern</style>Oh mein Gott, es ist heute so kalt!- (Hinweis: Um den besten Gesangsstil zu erzielen, dürfen Sie NUR das Gesangs-Tag ganz am Anfang hinzufügen).
4. Detaillierte Audio-Tags
Durch Inline-Audio-Tags können Sie feinkörnige Kontrolle ausüben, um Emotionen und Ausdrucksstile präzise anzupassen. Fügen Sie Atemzüge, Pausen oder Husten direkt in den Text ein. Beispiele:
Hatschi! Ähem. Ich—ich glaube wirklich [cough], ich bekomme eine schreckliche [cough] Erkältung.[schweres Atmen] Gib mir... einfach... eine Sekunde.Es ist einfach so dumm! (schluchzend) er hat alles auf einmal gegessen!
5. Rollen: Benutzerkontext vs. Assistenten-Text
- Assistenten-Text (Erforderlich): Der Zieltext MUSS in einer
assistant-Nachricht platziert werden. - Benutzerkontext (Optional): Bietet einen Gesprächskontext für die KI, um einen angemessenen Tonfall festzulegen.