A

Amazon Polly

云端语音合成
官网 ↗

Amazon Polly is a cloud TTS service with neural voices tightly integrated into the AWS ecosystem.

✓ 优点
  • AWS IAM 和 S3 无缝集成
  • 用于口型同步和突出显示的语音标记(元数据)
  • 即用即付定价,并提供 12 个月的免费套餐
  • 低延迟流合成
✗ 缺点
  • 语音目录比 Google Cloud TTS 更小
  • 神经语音仅限于特定语言
  • 与较新的深度学习竞争对手相比,自然韵律较少
免费套餐 ✓ 免费套餐
定价模式 usage
价格 (Standard) varies USD
功能
ssmlneural tts
支持语言 en, ja
音色数量 80
API ✓ 可用 文档 ↗
定价方案
Free Tier$05M standard chars/mo for 12 months
Standard voices$4/1M charsAfter free tier
Neural voices$16/1M charsAfter free tier
支持平台
api
集成 AWS Lambda, Amazon Lex, S3, Amazon Connect, SDK (Python, JS, Java)
官方网站 https://aws.amazon.com/polly/

AI点评

Amazon Polly是AWS原生架构的天然TTS选择,尤其适合使用Amazon Lex聊天机器人或Amazon Connect联络中心的场景。Speech Marks(单词和音素的时间戳元数据)支持口型同步动画和卡拉OK式高亮显示。对于实用型应用,语音自然度足够,但在富有表现力的创意内容方面仍落后于Google Neural2和ElevenLabs。

与以下对比: Amazon Polly