MiMo v2 TTS

Générez une voix de haute qualité à partir d'un texte à l'aide de la dernière API MiMo v2 TTS.

Générateur de Texte en Voix

Cet outil est propulsé par le dernier modèle MiMo v2 TTS (Text-to-Speech) de Xiaomi, capable de convertir du texte en voix naturelle. Vous pouvez configurer des styles vocaux et insérer des balises audio détaillées.

⚠️ Avis: Cet outil a été construit rapidement et peut comporter des bugs. N'hésitez pas à nous faire part de vos problèmes ou demandes !

🔗 Liens Rapides

🌟 Guide de Configuration

1. Application et Sécurité de la Clé API

Avant d'utiliser cet outil, vous devez fournir une clé API MIMO valide.

  • Comment postuler : Visitez la Console Xiaomi MiMo pour vous inscrire et générer votre clé unique.
  • 🔒 Garantie de Confidentialité : Tous les appels API depuis ce site Web sont effectués directement depuis votre navigateur vers les serveurs officiels. Nous n'enregistrerons, ne collecterons ni ne téléchargerons JAMAIS votre clé API. Si vous êtes toujours inquiet, vous pouvez supprimer ou révoquer la clé dans la console après utilisation.

2. Sélection de la Voix (Voix Intégrées)

Vous pouvez choisir une voix prédéfinie officielle dans le menu déroulant :

  • mimo_default : MiMo-Défaut
  • default_zh : MiMo-Voix Féminine Chinoise
  • default_en : MiMo-Voix Féminine Anglaise (Remarque : Le clonage vocal n'est actuellement pas pris en charge par l'API)

3. Contrôle Général du Style de Voix (Style)

Entrez l'émotion ou le dialecte souhaité dans la zone "Style". L'outil ajoutera automatiquement la balise <style>Votre style</style> au début du contenu cible. Vous pouvez même combiner des styles séparés par des espaces !

Les styles pris en charge incluent (sans s'y limiter) :

  • Vitesse de parole : Accélérer / Ralentir
  • Émotions : Heureux / Triste / En colère
  • Rôles : Sun Wukong / Lin Daiyu
  • Modification du style : Chuchotement / Voix aiguë / Accent taïwanais / Chant
  • Dialectes : Dialectes chinois régionaux divers

Exemples :

  • <style>Heureux</style>Demain c'est vendredi, tellement heureux !
  • <style>Chuchotement</style>Oh mon Dieu, il fait si froid aujourd'hui !
  • (Remarque : Pour obtenir la meilleure qualité de chant, vous devez UNIQUEMENT ajouter la balise <style>唱歌</style> au tout début).

4. Balises Audio Détaillées

Grâce aux balises d'action insérées dans le texte, vous pouvez contrôler avec précision le ton, l'émotion et le style d'expression de différentes parties. Exemples :

  • Atchoum ! Hum.. Je—je pense vraiment [cough] que j'attrape un rhume épouvantable [cough].
  • [respiration lourde] Juste... donne-moi... une seconde.
  • C'est tellement stupide ! (en sanglotant) il a tout mangé en une seule bouchée !

5. Rôles : Contexte de l'Utilisateur vs Texte de l'Assistant

  • Texte de l'Assistant (Requis) : Le texte cible pour la synthèse vocale DOIT être placé dans un message de rôle assistant.
  • Contexte de l'Utilisateur (Optionnel) : Fournit un contexte conversationnel pour le moteur TTS afin d'adapter son ton de réponse.