Support me on Ko-fi

MiMo v2 TTS 語音合成

使用小米最新發佈的 MiMo v2 TTS 模型,快速將文字轉換為高品質語音。支援配音、情感合成等細粒度控制。

線上文字轉語音工具

此線上工具基於小米最新發布的 MiMo v2 TTS (Text-to-Speech) 語音合成模型,可將輸入的文字自動轉換為自然流暢的語音輸出。支援設定發音風格及細粒度音訊標籤,生成表達豐富、生動的語音內容。

⚠️ 重要提示:本工具為了搶鮮快速上線,可能存在體驗不健全的地方。如果遇到任何 Bug 或是功能需求,歡迎隨時回饋提出!

🔗 快速連結

🌟 核心能力設定指南

1. API Key 獲取與安全說明

使用本工具前,您需要提供一個有效的 MIMO API Key。

  • 獲取方法:請前往 小米 MiMo 控制台 註冊並生成您的專屬 Key。
  • 🔒 隱私承諾:本網站所有 API 呼叫均直接由您的瀏覽器直連官方伺服器發起,我們絕不會記錄、收集或上傳您的 API Key。如果您仍有疑慮,隨時可以在使用完畢後去控制台刪除或停用該 Key。

2. 聲音與音色選擇 (Voice)

你可以從下拉框中選擇預置的音色。目前小米支援以下模型:

  • mimo_default:MiMo-預設
  • default_zh:MiMo-中文女聲
  • default_en:MiMo-英文女聲 (註:暫不支援音色複製)

3. 發音風格控制與方言 (Style)

直接在工具介面的「發音風格」框中填入你想要的風格或方言!平台會自動幫您在前端拼裝成 <style>風格</style> 標籤放在生成的文字最開頭(多個風格可用空格隔開)。這可以讓語音更生動自然。

表內及額外支援的風格範例包括:

  • 語速控制:變快 / 變慢
  • 情緒變化:開心 / 悲傷 / 生氣
  • 角色扮演:孫悟空 / 林黛玉
  • 風格變化:悄悄話 / 夾子音 / 台灣腔 / 唱歌
  • 方言:東北話 / 四川話 / 河南話 / 粵語

例:

  • <style>開心</style>明天就是週五了,真開心!
  • <style>東北話</style>哎呀媽呀,這天兒也忒冷了吧!你說這風,嗖嗖的,跟刀子似的,割臉啊!
  • (註:體驗絕佳的唱歌風格,必須單獨在文字最開頭只加一個"唱歌"標籤)

4. 細粒度音訊標籤微調 (Fine-grained Control)

除了整體風格,你還可以在**「要合成的助手文字」**各個段落中插入音訊動作標籤,來精準調節語氣、加入呼吸聲、停頓或咳嗽等! 例:

  • (緊張,深呼吸)呼……冷靜,冷靜。不就是一個面試嗎……
  • (極其疲憊,有氣無力)師傅……到地方了叫我一聲……(長嘆一口氣)我先瞇一會兒。
  • (寒冷導致的急促呼吸)呼——呼——這、這大興安嶺的雪……(咳嗽)簡直能把人骨頭凍透了……

5. 對話上下文機制 (User vs Assistant)

  • 「要合成的助手文字」 (Assistant):API 強制要求發音的目標文字必須且只能放在 role 為 assistant 的訊息中。工具已限制主輸入框對應此角色。
  • 「用戶上下文對話」 (User):該選填框用於傳遞上一句對話設定,讓生成的聲音立刻帶有合適的交流感和對應情感。建議使用。