AI 文字转语音

SpeechGen

SpeechGen 是一个 AI 文本转语音和语音生成平台,可创建多种语言的逼真音频,并支持下载文件。

SpeechGen

Realistic AI voice generation in 150 languages

访问官网

什么是 SpeechGen?

SpeechGen 是一款在线 AI 语音生成器和文本转语音平台,可将书面文本转换为逼真的口语音频。它支持多种声音、语言选择、SSML 控制、字幕同步、背景音乐,以及可下载的音频格式,适用于个人和商业用途。

如何使用 SpeechGen?

  1. 1在编辑器中输入或粘贴文本。
  2. 2选择声音和语言,并在需要时调整语速、音高或音量。
  3. 3添加 SSML 标签、说话人标签或切分标记,以实现停顿和多语音输出。
  4. 4点击 Convert to Speech。
  5. 5以你偏好的格式下载完成的音频,例如 MP3、WAV、FLAC、OGG 或 OPUS。

SpeechGen 主要功能

  • 5,000+ AI voices
  • 150 languages
  • 文本转语音转换
  • MP3、WAV、FLAC、OGG 和 OPUS 下载
  • 支持 SSML
  • 单个文件支持多个说话人
  • 字幕与音频同步
  • Smart cache,可免费重新生成相同文本
  • 支持背景音乐
  • 支持上传 DOCX、PDF 和 SRT
  • 包含商业许可
  • API access

SpeechGen 使用场景

  • 营销视频配音
  • 在线学习和培训音频
  • 企业电话菜单和 IVR
  • 音频导览和博物馆讲解
  • 工业安全播报
  • 多语言本地化
  • 有声书和逐章旁白
  • 字幕同步视频配音

SpeechGen 价格与免费额度

SpeechGen 目前采用 免费, 付费 模式。

Free

$0

无需注册即可立即使用 1,000 个字符。免费注册可提高每日额度,首次免费使用不添加水印。

Pay-as-you-go

From $4.99

按需购买额度,并按自己的节奏使用。计划包含商业许可、历史记录、Smart cache,以及访问所有声音。

Voice quality tiers

STD / PRO / HD

Standard 按每字符 0.5 计费,Pro 按每字符 1 计费,HD 按每字符 2 计费,可获得更高质量的合成选项。

SpeechGen 优缺点

优点

  • 拥有 5,000+ 个声音的大型语音库
  • 支持 150 种语言
  • 前 1,000 个字符无需注册即可使用
  • 包含商业许可
  • Smart cache 可在文本未更改时免费重新生成
  • 支持多种输出格式和字幕同步

缺点

  • 按字符计费,某些用户可能不容易比较成本
  • 高级功能可能需要学习 SSML 和格式标签
  • 超长项目的处理时间可能更久

SpeechGen 最适合哪些用途?

  • 内容创作者
  • 视频编辑
  • 在线学习团队
  • 中小企业
  • 本地化团队
  • 播客制作人
  • 博物馆和导览运营方

SpeechGen 常见问题

SpeechGen 的免费替代工具

Magnific is an AI creative platform for generating, editing, upscaling, and managing images, video, audio, 3D, and stock assets in one place.

Cartesia 构建快速的语音AI模型和语音助手,用于实时文本转语音、转录和交互对话。

RecCloud 是一个 AI 音频和视频平台,提供转录、字幕、翻译、文本转语音、摘要和基础视频编辑功能。

免费

LOVO 是一款 AI 语音生成和文字转语音平台,可用于创建逼真的配音、视频旁白和语音克隆,支持 100+ 种语言。

免费

PopPop.AI 是一款免费的在线音频创作套件,提供文本转语音、人声去除、AI 翻唱歌曲和音效制作功能。

Inworld AI 提供用于文本转语音、语音转语音、语音转文本以及对话应用模型路由的实时语音 AI 工具。

Infatuated AI 是一款 AI 女友聊天机器人,具备记忆、语音、图片和视频功能,旨在提供个性化陪伴与角色扮演体验。

Fineshare 是一个 AI 音频、音乐和视频创作平台,提供与声音、歌曲、摄像头以及 Sora 相关视频工作流有关的工具。