MiMo v2 TTS

Genera voce di alta qualità dal testo utilizzando l'ultima API MiMo v2 TTS.

Generatore da Testo a Voce

Questo strumento è alimentato dal modello MiMo v2 TTS (Text-to-Speech) di Xiaomi, in grado di convertire il testo in voce naturale. Puoi configurare stili vocali e inserire tag audio dettagliati.

⚠️ Avviso: Questo strumento è stato creato rapidamente e potrebbe presentare bug. Sentiti libero di segnalare problemi o richieste!

🔗 Link Rapidi

🌟 Guida alla Configurazione

1. Applicazione della Chiave API e Sicurezza

Prima di utilizzare questo strumento, devi fornire una Chiave API MIMO valida.

  • Come candidarsi: Visita la Console Xiaomi MiMo per registrarti e generare la tua chiave unica.
  • 🔒 Garanzia di Privacy: Tutte le chiamate API da questo sito Web vengono effettuate direttamente dal tuo browser ai server ufficiali. NON registreremo, raccoglieremo o caricheremo MAI la tua chiave API. Se sei ancora preoccupato, puoi eliminare o revocare la chiave nella console dopo averla utilizzata.

2. Selezione della Voce (Voci Integrate)

Puoi scegliere una voce preimpostata dal menu a discesa:

  • mimo_default: MiMo-Predefinito
  • default_zh: MiMo-Voce Femminile Cinese
  • default_en: MiMo-Voce Femminile Inglese (Nota: La clonazione vocale attualmente non è supportata dall'API)

3. Controllo Stile Vocale (Style)

Inserisci l'emozione o il dialetto desiderato nella casella "Stile". Lo strumento anteporrà automaticamente come tag <style>Il Tuo Stile</style> all'inizio del contenuto. Puoi anche combinare stili separati da spazi!

Gli stili supportati includono ma non sono limitati a:

  • Ritmo del Parlato: Accelera / Rallenta
  • Emozioni: Felice / Triste / Arrabbiato
  • Ruoli: Sun Wukong / Lin Daiyu
  • Cambio di Stile: Sussurro / Voce acuta / Accento taiwanese / Canto
  • Dialetti: Vari dialetti cinesi

Esempi:

  • <style>Felice</style>Domani è venerdì, sono così felice!
  • <style>Sussurro</style>Oh mio Dio, fa così freddo oggi! Questo vento ulula come un coltello!
  • (Nota: Per ottenere il miglior stile di canto, devi aggiungere SOLO il tag di canto all'inizio).

4. Tag Audio Dettagliati

Attraverso i tag audio direttamente nel testo, puoi esercitare un controllo dettagliato per regolare con precisione il tono in sezioni diverse. Esempi:

  • Ecciù! Ehi. Io—credo davvero [cough] di essermi preso un terribile [cough] raffreddore.
  • [respiro affannoso] Dammi solo... un secondo.
  • È così stupido! (singhiozzando) l'ha mangiato tutto in un boccone!

5. Ruoli: Contesto dell'Utente vs Testo dell'Assistente

  • Testo dell'Assistente (Obbligatorio): Il testo di destinazione per la sintesi vocale DEVE essere inserito in un messaggio per l'assistant.
  • Contesto dell'Utente (Opzionale): Fornisce un contesto di conversazione di fondo per consentire al motore TTS di adattare il tono adatto.