Amazon Polly is a cloud TTS service with neural voices tightly integrated into the AWS ecosystem.
✓ 优点
- AWS IAM 和 S3 无缝集成
- 用于口型同步和突出显示的语音标记(元数据)
- 即用即付定价,并提供 12 个月的免费套餐
- 低延迟流合成
✗ 缺点
- 语音目录比 Google Cloud TTS 更小
- 神经语音仅限于特定语言
- 与较新的深度学习竞争对手相比,自然韵律较少
| 免费套餐 | ✓ 免费套餐 |
| 定价模式 | usage |
| 价格 (Standard) | varies USD |
| 功能 | |
| 支持语言 | en, ja |
| 音色数量 | 80 |
| API | ✓ 可用 文档 ↗ |
| 定价方案 | Free Tier$05M standard chars/mo for 12 months Standard voices$4/1M charsAfter free tier Neural voices$16/1M charsAfter free tier |
| 支持平台 | |
| 集成 | AWS Lambda, Amazon Lex, S3, Amazon Connect, SDK (Python, JS, Java) |
| 官方网站 | https://aws.amazon.com/polly/ |
AI点评
Amazon Polly是AWS原生架构的天然TTS选择,尤其适合使用Amazon Lex聊天机器人或Amazon Connect联络中心的场景。Speech Marks(单词和音素的时间戳元数据)支持口型同步动画和卡拉OK式高亮显示。对于实用型应用,语音自然度足够,但在富有表现力的创意内容方面仍落后于Google Neural2和ElevenLabs。