MiMo v2 TTS
Générez une voix de haute qualité à partir d'un texte à l'aide de la dernière API MiMo v2 TTS.
Générateur de Texte en Voix
Cet outil est propulsé par le dernier modèle MiMo v2 TTS (Text-to-Speech) de Xiaomi, capable de convertir du texte en voix naturelle. Vous pouvez configurer des styles vocaux et insérer des balises audio détaillées.
⚠️ Avis: Cet outil a été construit rapidement et peut comporter des bugs. N'hésitez pas à nous faire part de vos problèmes ou demandes !
🔗 Liens Rapides
- 🔑 Obtenir une clé API MIMO (Console)
- 📖 Documentation API Officielle
- 💰 Tarification : Actuellement gratuit pour une durée limitée.
🌟 Guide de Configuration
1. Application et Sécurité de la Clé API
Avant d'utiliser cet outil, vous devez fournir une clé API MIMO valide.
- Comment postuler : Visitez la Console Xiaomi MiMo pour vous inscrire et générer votre clé unique.
- 🔒 Garantie de Confidentialité : Tous les appels API depuis ce site Web sont effectués directement depuis votre navigateur vers les serveurs officiels. Nous n'enregistrerons, ne collecterons ni ne téléchargerons JAMAIS votre clé API. Si vous êtes toujours inquiet, vous pouvez supprimer ou révoquer la clé dans la console après utilisation.
2. Sélection de la Voix (Voix Intégrées)
Vous pouvez choisir une voix prédéfinie officielle dans le menu déroulant :
mimo_default: MiMo-Défautdefault_zh: MiMo-Voix Féminine Chinoisedefault_en: MiMo-Voix Féminine Anglaise (Remarque : Le clonage vocal n'est actuellement pas pris en charge par l'API)
3. Contrôle Général du Style de Voix (Style)
Entrez l'émotion ou le dialecte souhaité dans la zone "Style". L'outil ajoutera automatiquement la balise <style>Votre style</style> au début du contenu cible. Vous pouvez même combiner des styles séparés par des espaces !
Les styles pris en charge incluent (sans s'y limiter) :
- Vitesse de parole : Accélérer / Ralentir
- Émotions : Heureux / Triste / En colère
- Rôles : Sun Wukong / Lin Daiyu
- Modification du style : Chuchotement / Voix aiguë / Accent taïwanais / Chant
- Dialectes : Dialectes chinois régionaux divers
Exemples :
<style>Heureux</style>Demain c'est vendredi, tellement heureux !<style>Chuchotement</style>Oh mon Dieu, il fait si froid aujourd'hui !- (Remarque : Pour obtenir la meilleure qualité de chant, vous devez UNIQUEMENT ajouter la balise
<style>唱歌</style>au tout début).
4. Balises Audio Détaillées
Grâce aux balises d'action insérées dans le texte, vous pouvez contrôler avec précision le ton, l'émotion et le style d'expression de différentes parties. Exemples :
Atchoum ! Hum.. Je—je pense vraiment [cough] que j'attrape un rhume épouvantable [cough].[respiration lourde] Juste... donne-moi... une seconde.C'est tellement stupide ! (en sanglotant) il a tout mangé en une seule bouchée !
5. Rôles : Contexte de l'Utilisateur vs Texte de l'Assistant
- Texte de l'Assistant (Requis) : Le texte cible pour la synthèse vocale DOIT être placé dans un message de rôle
assistant. - Contexte de l'Utilisateur (Optionnel) : Fournit un contexte conversationnel pour le moteur TTS afin d'adapter son ton de réponse.