Support me on Ko-fi

MiMo v2 TTS

Buat suara berkualitas tinggi dari teks menggunakan API MiMo v2 TTS terbaru.

Generator Teks ke Suara

Alat online ini ditenagai oleh model MiMo v2 TTS (Text-to-Speech) terbaru dari Xiaomi, yang mampu mengubah teks menjadi ucapan alami. Anda dapat mengonfigurasi gaya berbicara dan menyisipkan tag audio mendetail.

โš ๏ธ Peringatan: Alat ini dibuat dengan cepat dan mungkin memiliki bug. Jika Anda mengalami masalah atau memiliki permintaan, silakan beri tahu kami!

๐Ÿ”— Tautan Cepat

๐ŸŒŸ Panduan Konfigurasi

1. Aplikasi & Keamanan Kunci API

Sebelum menggunakan alat ini, Anda harus memberikan Kunci API MIMO yang valid.

  • Cara mendaftar: Kunjungi Konsol Xiaomi MiMo untuk mendaftar dan menghasilkan Kunci unik Anda.
  • ๐Ÿ”’ Jaminan Privasi: Semua panggilan API dari situs web ini dilakukan langsung dari browser Anda ke server resmi. Kami TIDAK AKAN PERNAH merekam, mengumpulkan, atau mengunggah Kunci API Anda. Jika Anda masih khawatir, Anda dapat menghapus atau mencabut kunci di konsol setelah digunakan.

2. Pemilihan Suara (Suara Bawaan)

Anda dapat memilih suara preset resmi dari dropdown:

  • mimo_default: MiMo-Bawaan
  • default_zh: MiMo-Suara Wanita Mandarin
  • default_en: MiMo-Suara Wanita Inggris (Catatan: Kloning suara saat ini belum didukung oleh API)

3. Kontrol Gaya Berbicara (Style)

Masukkan emosi atau dialek yang Anda inginkan ke dalam kotak input "Gaya". Alat ini akan secara otomatis menambahkan tag <style>Gaya Anda</style> ke awal konten target. Anda bahkan dapat menggabungkan gaya yang dipisahkan oleh spasi!

Gaya yang didukung meliputi namun tidak terbatas pada:

  • Kecepatan Berbicara: Percepat / Perlambat
  • Emosi: Senang / Sedih / Marah
  • Peran: Sun Wukong / Lin Daiyu
  • Perubahan Gaya: Bisikan / Suara melengking / Aksen Taiwan / Bernyanyi
  • Dialek: Dialek Timur Laut / Dialek Sichuan / Kanton

Contoh:

  • <style>Senang</style>Besok adalah hari Jumat, sangat senang!
  • <style>Bisikan</style>Ya ampun, hari ini sangat dingin!
  • (Catatan: Untuk mencapai gaya bernyanyi terbaik, Anda HANYA boleh menambahkan tag bernyanyi di awal tulisan).

4. Tag Audio Mendetail

Melalui Tag Audio di dalam teks target, Anda dapat melakukan kontrol dengan halus untuk menyesuaikan nada, emosi, dan gaya ekspresi secara akurat. Contoh:

  • Hatchi! Ehem. Akuโ€”aku benar-benar [cough] mengira aku sedang sakit [cough] flu yang parah.
  • [napas berat] Cukup... beri aku... sebentar.
  • Konyol sekali! (sambil menangis) dia memakan semuanya dalam satu gigitan!

5. Peran: Konteks Pengguna vs Teks Asisten

  • Teks Asisten (Wajib): Teks target untuk sintesis ucapan HARUS ditempatkan dalam pesan peran assistant. Field ini adalah audio yang akan dibuat nantinya.
  • Konteks Pengguna (Saran Opsional): Memberikan percakapan latar belakang agar TTS dapat menyesuaikan emosi suara yang pas untuk menjawab Pengguna.