MiMo v2 TTS
最新のMiMo v2 TTS APIを使用して、テキストから高品質な音声を生成します。
テキストを音声に変換
このオンラインツールは、Xiaomiがリリースした最新の**MiMo v2 TTS (Text-to-Speech)**モデルを利用しており、入力テキストを自然な音声に自動変換します。音声スタイルの設定や詳細なオーディオタグの挿入をサポートしています。
⚠️ 注意: 早期リリース版のため、不具合がある可能性があります。問題や要望があればお知らせください!
🔗 クイックリンク
- 🔑 MIMO APIキーを取得 (コンソール)
- 📖 公式APIドキュメント
- 💰 料金: 現在、期間限定で無料です。
🌟 設定ガイド (Configuration Guide)
1. APIキーの申請とセキュリティ
このツールを使用する前に、有効なMIMO APIキーを提供する必要があります。
- 申請方法: Xiaomi MiMo コンソール にアクセスして登録し、独自のキーを生成してください。
- 🔒 プライバシー保証: このウェブサイトからのすべてのAPI呼び出しは、ブラウザから公式サーバーに直接行われます。私たちはあなたのAPIキーを記録、収集、アップロードすることは決してありません。それでも心配な場合は、使用後にコンソールでキーを削除または無効化できます。
2. 音声の選択 (Voice)
ドロップダウンから公式のプリセット音声を選択できます:
mimo_default:MiMo-デフォルトdefault_zh:MiMo-中国語 女性の声default_en:MiMo-英語 女性の声 (注: 音声クローンは現在APIでサポートされていません)
3. 全体的な音声スタイル制御 (Style)
希望する感情や方言を「スタイル」入力ボックスに入力します。ツールは自動的にターゲットコンテンツの先頭に <style>あなたのスタイル</style> として追加します。スペースで区切ってスタイルを組み合わせることも可能です!
サポートされているスタイルには以下が含まれますが、これらに限定されません:
- 話速: 速くする / 遅くする
- 感情: 嬉しい / 悲しい / 怒っている
- キャラクター: 孫悟空 / 林黛玉
- スタイル変更: ひそひそ話 / アニメ声 / 台湾なまり / 歌う
- 方言: 東北弁 / 四川弁 / 河南弁 / 広東語
例:
<style>嬉しい</style>明日は金曜日、とても嬉しい!<style>ひそひそ話</style>ああ、今日はすごく寒い!あの風はナイフのように冷たい!- (注: 最適な歌のスタイルを実現するには、ターゲットテキストの先頭に【<style>歌う</style>】のみを追加する必要があります).
4. 詳細なオーディオタグ制御
テキスト内のアクションタグを通じて、トーンや感情を微調整し、呼吸声や咳を直接テキストに挿入できます。 例:
ハクション!ゴホン。私…本当に[咳]ひどい風邪を引いたみたいだ[咳]。[荒い息づかい] ちょっと…待って…。なんて愚かなの!(泣きながら) 彼が全部一口で食べちゃったの!
5. 役割: User のコンテキストと Assistant テキスト
- Assistant テキスト (必須): 音声合成のターゲットテキストは、
assistantロールのメッセージに配置する必要があります。これが実際に生成される音声オーディオです。 - User コンテキスト (任意): TTSエンジンのバックグラウンド会話コンテキストを提供します。TTSモデルがユーザーの入力に応じて適切なトーンを調整するのに役立ちます。