AI相關

ElevenLabs 完整教學 2026：AI 語音生成免費版怎麼用？文字轉語音、聲音複製一次學會！

2026 年 04 月 29 日

665 人次

你有沒有這樣的困擾：想做 YouTube 影片，卻不想出聲錄音；想做 Podcast，卻覺得自己聲音不夠好聽；想把一篇長文章變成有聲版，但念完整篇要花好幾個小時？

阿正老師最近深度使用了一款叫 ElevenLabs 的工具，說真的，第一次聽到它生成出來的中文語音時，我還真的以為是真人配音——那個語調、那個停頓、甚至連輕微的情緒起伏都有。它是目前公認 AI 語音品質最高的平台，連好萊塢和 Netflix 都在用。

更棒的是，ElevenLabs 有免費版可以用，每個月可以生成約 10 分鐘的語音，對於想試試看的朋友來說完全夠了。這篇文章阿正老師從零開始帶你認識 ElevenLabs，從功能介紹、操作步驟、繁體中文技巧，到方案比較，一篇搞定！

文章目錄

ElevenLabs 是什麼？
免費註冊帳號（3 分鐘完成）
文字轉語音（Text to Speech）基本操作
語音參數調整：讓聲音更自然
聲音複製（Voice Cloning）教學
Voice Design：自訂全新 AI 聲音
繁體中文語音實戰技巧
方案比較：哪個方案最適合你？
優缺點總整理
阿正老師的總結

一、ElevenLabs 是什麼？

官方網站	https://elevenlabs.io
開發公司	ElevenLabs Inc.（美國，2022 年成立）
主要功能	文字轉語音、聲音複製、AI 配音翻譯、音效生成
支援語言	70+ 種語言，含繁體中文、簡體中文、英文、日文、韓文等
支援平台	網頁版、iOS App、Android App
費用	免費版（每月約 10 分鐘）/ Starter $5/月 / Creator $22/月 / Pro $99/月
繁體中文介面	❌（英文介面，但支援繁體中文語音輸出）
軟體下載	[本站下載點]（網址待補）

ElevenLabs 是目前全球公認 AI 語音品質最高的文字轉語音平台，2022 年由前 Google 與 Palantir 工程師創立，短短幾年估值已超過 30 億美元。它最厲害的地方，就是生成出來的語音幾乎無法和真人配音區分——有自然的語調起伏、語速節奏，甚至能表達情緒。

ElevenLabs 支援超過 70 種語言、擁有上萬種 AI 聲音可以選，還有一個讓阿正老師最感興趣的功能：聲音複製（Voice Cloning）——只需要上傳幾分鐘的錄音樣本，AI 就能克隆出你的聲音，之後用文字就能讓「你的聲音」說任何話。

主要應用場景包括：YouTube 影片旁白、Podcast 配音、有聲書製作、影片多語言配音翻譯，以及需要大量語音內容的行銷團隊。

———————————————-
ElevenLabs 文字轉語音介面截圖（顯示主要的 Text to Speech 操作介面，有聲波視覺化效果）
———————————————-

二、免費註冊帳號（3 分鐘完成）

ElevenLabs 免費版不需要信用卡，用 Google 帳號就能馬上開始使用。以下是完整的註冊步驟：

步驟一：前往官網
打開瀏覽器，前往 elevenlabs.io，點選右上角的「Sign Up」。

步驟二：用 Google 帳號一鍵登入
選擇「Continue with Google」，直接用 Google 帳號授權登入，整個過程不到 30 秒，也不需要填任何表單。

最後可以輸入你的名字（選擇性）及語言（目前中文只提供簡體中文，選擇後會從英文界面自動切換成簡體中文界面）。

步驟三：進入主介面
登入後你會看到左側選單，主要會用到的功能包括：

Text to Speech（文本轉語音）——文字轉語音的主要操作頁面
Voices（音色）——瀏覽、試聽、新增 AI 聲音
Studio（工作室）——製作長篇語音內容或有聲書用
Dubbing（配音）——上傳影片，AI 自動翻譯並重新配音

免費版每個月有 10,000 個字元（Credits）的配額，以一般說話速度計算，大約可以生成 10 分鐘左右的語音。用 Google 帳號登入，完全不需要輸入信用卡。

三、文字轉語音（Text to Speech）基本操作

這是 ElevenLabs 最核心的功能，操作非常直覺。以下是完整步驟：

步驟一：進入 Text to Speech 頁面
點選左側選單的「Text to Speech」(文本轉語音)，就會進入主要操作介面。

步驟二：選擇語音（Voice）
點選上方的聲音選擇區，可以瀏覽數百種 AI 聲音，包括男聲、女聲、不同年齡、不同口音。每種聲音都可以點「Preview」先試聽。找好之後選取即可。如果要找台灣口音的語音，可以在上方直接搜尋「Taiwan」就會列出，目前已經有二十多種。

步驟三：選擇 AI 模型
ElevenLabs 有3個主要 TTS 模型：

Eleven (十一號) v3：品質最高，支援70多種語言。
Eleven Multilingual(十一多語言) v2：品質中等，支援 29 種以上語言，適合最終輸出版本使用，但速度較慢
Eleven Flash (十一閃電俠)v2.5：速度極快（延遲約 75ms），字元消耗只有一般模型的一半，適合快速打稿或測試用

阿正老師建議平常測試的時候用 Flash 省點數，確認文字沒問題後，最後輸出才換成 Multilingual v2或v3，這樣可以讓免費額度用得更久。

步驟四：輸入文字
在下方的大型文字框中，輸入或貼入你要轉成語音的文字。免費版單次最多可以輸入約 2,500 個字元。如果文字很長，建議分段處理。

步驟五：按下 Generate，下載語音
確認設定無誤後，點選「Generate」按鈕，幾秒後就會出現語音播放器。試聽沒問題，點下載圖示就可以下載 MP3 格式的語音檔案。

四、語音參數調整：讓聲音更自然

ElevenLabs 讓你調整四個關鍵參數，可以讓生成的語音更符合你的需求：

Stability（穩定性）
數值越高，聲音越平穩一致，適合新聞播報、教學說明等需要清晰一致的場合。數值越低，聲音會有更多起伏變化，聽起來更像真人說話，但有時候可能會偏離原本聲音的特色。阿正老師建議一般用途設定在 50–70% 之間。

Similarity（相似性）
這個參數主要在使用聲音複製功能時比較重要。數值越高，生成的語音越接近原始聲音樣本，但如果樣本本身有背景雜音，也可能一起被放大。建議設定在 70–80% 左右。

另外還有一個 Style Exaggeration（風格誇張），可以讓聲音的說話風格更鮮明，但太高容易失真，建議保持在 30% 以下。

阿正老師點評：這兩個參數沒有固定的「最佳值」，建議實際多試幾次才能找到最適合你的聲音的設定組合。阿正老師通常先把 Stability 和 Similarity 都設在 60%，再根據聽起來的感覺慢慢微調。

五、聲音複製（Voice Cloning）教學

這是 ElevenLabs 最讓人印象深刻的功能——只需要上傳你的聲音樣本，AI 就能克隆出一個聽起來像你的虛擬聲音，之後輸入任何文字，它都能用「你的聲音」說出來。ElevenLabs 提供兩種聲音複製方式：

即時語音克隆Instant Voice Cloning，IVC）
所需方案：Starter（$5/月）以上
只需上傳 1 分鐘以上的清晰錄音（建議 5–10 分鐘效果更好），大約 30 秒就能完成克隆。適合 YouTuber、Podcast 主等一般創作者，日常旁白用途已非常夠用。

專業語音克隆（Professional Voice Cloning，PVC）
所需方案：Creator（$22/月）以上
需要錄製 30 分鐘以上的腳本音訊並上傳，ElevenLabs 會進行深度訓練，等待 24–48 小時後完成。複製出來的品質明顯更高，適合廣告配音、有聲書、或是以聲音為主要個人品牌的創作者。

即時聲音複製操作步驟：

步驟一：進入左側選單的「音色(Voices)」旁的＋號按鈕，再選「即時語音克隆(Instant Voice Cloning)」。

步驟二：替你的聲音取一個名稱，然後上傳音訊檔案（支援 MP3、WAV、M4A 等格式）。要注意的是，音訊需要是乾淨的單人語音，沒有背景音樂、沒有雜音效果最好。

步驟三：勾選同意條款（聲明音訊是你本人的聲音，且你授權 ElevenLabs 用於克隆），點「Add Voice」。大約等 30 秒，你的聲音就會出現在聲音庫中，之後在 Text to Speech 頁面選它就能使用。

⚠️ ElevenLabs 的使用條款明確規定，只能複製自己的聲音，或取得當事人明確授權才能複製他人聲音。未經授權複製他人聲音可能涉及法律問題，這點務必注意。

六、Voice Design：自訂全新 AI 聲音

如果你不想用現有聲音庫，也不想複製真實聲音，ElevenLabs 還有一個很酷的功能叫 Voice Design——用文字描述你想要的聲音特質，AI 就會幫你從零創造一個全新的聲音。

舉幾個描述範例：

「A 35-year-old Taiwanese woman, warm and friendly tone, clear Mandarin pronunciation」（溫和親切的台灣女性聲音）
「A confident middle-aged male news anchor, professional and authoritative」（穩重的男性新聞播報音調）
「A cheerful young woman for educational YouTube videos, energetic and engaging」（活潑的教學 YouTube 聲音）

按下「生成音色(Generate)」後，系統會生成幾個符合描述的聲音供你試聽，挑選喜歡的加入聲音庫就可以在 Text to Speech 中使用了。這個功能特別適合品牌想建立專屬 AI 品牌聲音的企業，完全原創、不涉及任何版權問題。

阿正老師點評：Voice Design 這個功能讓阿正老師很驚喜。我輸入「warm Taiwanese male voice, mid-30s, calm podcast host style」，生成出來的聲音和阿正老師心目中想要的感覺八九不離十。如果你想為自己的頻道或品牌打造一個獨一無二的 AI 聲音形象，這個功能值得試試。

七、繁體中文語音實戰技巧

ElevenLabs 支援繁體中文，但要讓中文語音效果夠好，有幾個技巧值得注意，阿正老師親測後整理如下：

技巧一：選擇中文專屬聲音
在 Voices 聲音庫中搜尋「Taiwan」、「Chinese」或「Mandarin」，篩選出專門為中文訓練的聲音。不要用英文聲音來讀中文文字，效果差很多，發音也容易不準。

技巧二：使用 Multilingual v2/v3 模型
中文語音建議一律使用 Multilingual v2/v3 模型，而不是 Flash 模型。Flash 模型對中文的語調處理比較弱，重要的最終輸出要選品質優先的 Multilingual v2/v3。

技巧三：標點符號幫助斷句
ElevenLabs 會根據標點符號來決定停頓位置，所以繁體中文文字一定要有適當的標點（逗號、句號、問號）。如果有一段很長的句子卻沒有標點，AI 可能會一口氣唸完，聽起來很趕。

技巧四：數字和英文混排要多注意
如果文字裡有數字或英文夾雜，建議把數字改成國字（例如「3」改成「三」），英文縮寫加上讀音提示（例如「AI（人工智慧）」），這樣 AI 唸出來的方式會比較自然。

技巧五：情緒標記讓語音更有感情
ElevenLabs 支援在文字中加入情緒提示，例如在特定句子前加上 [excited]（興奮）、[sad]（悲傷）、[whisper]（輕語）、[laughs]（笑）、[sighs]（嘆氣），語音生成時就會對應調整語調。這個技巧特別適合用在故事旁白或需要感情表達的內容。

八、方案比較：哪個方案最適合你？

功能	免費版	Starter $5/月	Creator $22/月	Pro $99/月
每月字元配額	10,000 （約 10 分鐘）	30,000 （約 30 分鐘）	100,000 （約 100 分鐘）	500,000 （約 500 分鐘）
商業授權	❌	✅	✅	✅
即時聲音複製（IVC）	❌	✅	✅	✅
專業聲音複製（PVC）	❌	❌	✅	✅
音訊下載格式	MP3	MP3	MP3 / WAV	MP3 / WAV 44.1kHz PCM
可建立的自訂聲音數	最多 3 個	最多 10 個	最多 30 個	最多 160 個
影片 AI 配音翻譯（Dubbing）	✅（有限制）	✅	✅	✅
未使用點數是否保留	❌（每月重置）	✅（保留最多 2 個月）	✅（保留最多 2 個月）	✅（保留最多 2 個月）
年繳折扣後月費	免費	約 $4/月	約 $18/月	約 $82/月

阿正老師的建議選法：

偶爾做影片、不需要商業授權：免費版夠用，每月 10 分鐘對輕量使用者來說通常足夠
有 YouTube 頻道或 Podcast 需要商業授權：Starter（$5/月，約 NT$160）是最划算的入門選擇
每週固定產出內容、需要聲音複製功能：Creator（$22/月）最適合，有 PVC 功能且 100 分鐘的額度很夠用
企業或專業製作團隊：Pro（$99/月）起，有高品質 PCM 音訊和大量配額

九、優缺點總整理

✅ 優點

語音品質是目前市場最高水準，接近真人配音
免費版可用，每月約 10 分鐘語音不需信用卡
支援繁體中文及 70+ 種語言
有聲音複製（Voice Cloning）功能
可調整情緒語調，不像傳統 TTS 那樣機械
Voice Design 可從零創造全新 AI 聲音
支援影片 AI 配音翻譯（Dubbing）
有 iOS / Android App，手機也能操作
付費版未用完點數可保留最多 2 個月

⚠️ 缺點

介面只有英文，沒有繁體中文版
免費版不可商用，需付費才能商業授權
免費版每月只有 10 分鐘，用量較大者不夠
聲音複製功能需要付費方案（最低 $5/月）
數字和英文夾雜的中文文字唸法有時不準
以字元計費方式對不熟悉的用戶來說容易搞混
Pro 以上方案月費對個人用戶偏高

十、阿正老師的總結

偶爾需要語音旁白、純個人娛樂用途

→ ElevenLabs 免費版就夠了。每月 10 分鐘、不需信用卡，要試試 AI 語音的感覺完全可以。

YouTube 頻道、Podcast，需要商業授權的創作者

→ Starter 方案（$5/月，約 NT$160）。最便宜的商業授權起點，有即時聲音複製，每月 30 分鐘對輕量創作者夠用。

每週固定產出、想用自己的聲音做旁白的創作者

→ Creator 方案（$22/月，約 NT$705）。有專業聲音複製（PVC）、每月 100 分鐘額度，是大多數認真創作者的最佳選擇。

行銷團隊、需要大量語音內容的企業

→ Pro 方案以上（$99/月）。高品質音訊輸出、500 分鐘配額，取代傳統錄音外包絕對划算。

AI 語音技術已經成熟到讓人分不清真假

ElevenLabs 對阿正老師來說是目前最值得推薦的 AI 語音工具，沒有之一。光是免費版的品質，就已經秒殺市面上大多數付費的 TTS 軟體。如果你是內容創作者、YouTuber、Podcast 主，或是常常需要讓文字「說話」的人，強烈建議去 elevenlabs.io 試試看免費版，聽聽那個語音的質感，相信你會和阿正老師一樣，覺得「這哪是 AI 啊？！」

想了解更多 AI 創作工具，也可以參考阿正老師的 Suno AI 免費音樂生成教學，和 2026 免費 AI 工具懶人包！

你有沒有用過 ElevenLabs？覺得哪種聲音最好聽？歡迎在下面留言跟阿正老師分享！