MiMo v2 TTS
Buat suara berkualitas tinggi dari teks menggunakan API MiMo v2 TTS terbaru.
Generator Teks ke Suara
Alat online ini ditenagai oleh model MiMo v2 TTS (Text-to-Speech) terbaru dari Xiaomi, yang mampu mengubah teks menjadi ucapan alami. Anda dapat mengonfigurasi gaya berbicara dan menyisipkan tag audio mendetail.
โ ๏ธ Peringatan: Alat ini dibuat dengan cepat dan mungkin memiliki bug. Jika Anda mengalami masalah atau memiliki permintaan, silakan beri tahu kami!
๐ Tautan Cepat
- ๐ Dapatkan Kunci API MIMO (Konsol)
- ๐ Dokumentasi API Resmi
- ๐ฐ Penagihan: Saat ini gratis untuk waktu yang terbatas.
๐ Panduan Konfigurasi
1. Aplikasi & Keamanan Kunci API
Sebelum menggunakan alat ini, Anda harus memberikan Kunci API MIMO yang valid.
- Cara mendaftar: Kunjungi Konsol Xiaomi MiMo untuk mendaftar dan menghasilkan Kunci unik Anda.
- ๐ Jaminan Privasi: Semua panggilan API dari situs web ini dilakukan langsung dari browser Anda ke server resmi. Kami TIDAK AKAN PERNAH merekam, mengumpulkan, atau mengunggah Kunci API Anda. Jika Anda masih khawatir, Anda dapat menghapus atau mencabut kunci di konsol setelah digunakan.
2. Pemilihan Suara (Suara Bawaan)
Anda dapat memilih suara preset resmi dari dropdown:
mimo_default: MiMo-Bawaandefault_zh: MiMo-Suara Wanita Mandarindefault_en: MiMo-Suara Wanita Inggris (Catatan: Kloning suara saat ini belum didukung oleh API)
3. Kontrol Gaya Berbicara (Style)
Masukkan emosi atau dialek yang Anda inginkan ke dalam kotak input "Gaya". Alat ini akan secara otomatis menambahkan tag <style>Gaya Anda</style> ke awal konten target. Anda bahkan dapat menggabungkan gaya yang dipisahkan oleh spasi!
Gaya yang didukung meliputi namun tidak terbatas pada:
- Kecepatan Berbicara: Percepat / Perlambat
- Emosi: Senang / Sedih / Marah
- Peran: Sun Wukong / Lin Daiyu
- Perubahan Gaya: Bisikan / Suara melengking / Aksen Taiwan / Bernyanyi
- Dialek: Dialek Timur Laut / Dialek Sichuan / Kanton
Contoh:
<style>Senang</style>Besok adalah hari Jumat, sangat senang!<style>Bisikan</style>Ya ampun, hari ini sangat dingin!- (Catatan: Untuk mencapai gaya bernyanyi terbaik, Anda HANYA boleh menambahkan tag bernyanyi di awal tulisan).
4. Tag Audio Mendetail
Melalui Tag Audio di dalam teks target, Anda dapat melakukan kontrol dengan halus untuk menyesuaikan nada, emosi, dan gaya ekspresi secara akurat. Contoh:
Hatchi! Ehem. Akuโaku benar-benar [cough] mengira aku sedang sakit [cough] flu yang parah.[napas berat] Cukup... beri aku... sebentar.Konyol sekali! (sambil menangis) dia memakan semuanya dalam satu gigitan!
5. Peran: Konteks Pengguna vs Teks Asisten
- Teks Asisten (Wajib): Teks target untuk sintesis ucapan HARUS ditempatkan dalam pesan peran
assistant. Field ini adalah audio yang akan dibuat nantinya. - Konteks Pengguna (Saran Opsional): Memberikan percakapan latar belakang agar TTS dapat menyesuaikan emosi suara yang pas untuk menjawab Pengguna.