MiMo v2 TTS

最新のMiMo v2 TTS APIを使用して、テキストから高品質な音声を生成します。

テキストを音声に変換

このオンラインツールは、Xiaomiがリリースした最新の**MiMo v2 TTS (Text-to-Speech)**モデルを利用しており、入力テキストを自然な音声に自動変換します。音声スタイルの設定や詳細なオーディオタグの挿入をサポートしています。

⚠️ 注意: 早期リリース版のため、不具合がある可能性があります。問題や要望があればお知らせください!

🔗 クイックリンク

🌟 設定ガイド (Configuration Guide)

1. APIキーの申請とセキュリティ

このツールを使用する前に、有効なMIMO APIキーを提供する必要があります。

  • 申請方法: Xiaomi MiMo コンソール にアクセスして登録し、独自のキーを生成してください。
  • 🔒 プライバシー保証: このウェブサイトからのすべてのAPI呼び出しは、ブラウザから公式サーバーに直接行われます。私たちはあなたのAPIキーを記録、収集、アップロードすることは決してありません。それでも心配な場合は、使用後にコンソールでキーを削除または無効化できます。

2. 音声の選択 (Voice)

ドロップダウンから公式のプリセット音声を選択できます:

  • mimo_default:MiMo-デフォルト
  • default_zh:MiMo-中国語 女性の声
  • default_en:MiMo-英語 女性の声 (注: 音声クローンは現在APIでサポートされていません)

3. 全体的な音声スタイル制御 (Style)

希望する感情や方言を「スタイル」入力ボックスに入力します。ツールは自動的にターゲットコンテンツの先頭に <style>あなたのスタイル</style> として追加します。スペースで区切ってスタイルを組み合わせることも可能です!

サポートされているスタイルには以下が含まれますが、これらに限定されません:

  • 話速: 速くする / 遅くする
  • 感情: 嬉しい / 悲しい / 怒っている
  • キャラクター: 孫悟空 / 林黛玉
  • スタイル変更: ひそひそ話 / アニメ声 / 台湾なまり / 歌う
  • 方言: 東北弁 / 四川弁 / 河南弁 / 広東語

例:

  • <style>嬉しい</style>明日は金曜日、とても嬉しい!
  • <style>ひそひそ話</style>ああ、今日はすごく寒い!あの風はナイフのように冷たい!
  • (注: 最適な歌のスタイルを実現するには、ターゲットテキストの先頭に【<style>歌う</style>】のみを追加する必要があります).

4. 詳細なオーディオタグ制御

テキスト内のアクションタグを通じて、トーンや感情を微調整し、呼吸声や咳を直接テキストに挿入できます。 例:

  • ハクション!ゴホン。私…本当に[咳]ひどい風邪を引いたみたいだ[咳]。
  • [荒い息づかい] ちょっと…待って…。
  • なんて愚かなの!(泣きながら) 彼が全部一口で食べちゃったの!

5. 役割: User のコンテキストと Assistant テキスト

  • Assistant テキスト (必須): 音声合成のターゲットテキストは、assistantロールのメッセージに配置する必要があります。これが実際に生成される音声オーディオです。
  • User コンテキスト (任意): TTSエンジンのバックグラウンド会話コンテキストを提供します。TTSモデルがユーザーの入力に応じて適切なトーンを調整するのに役立ちます。
その他のツール