Amazon Polly vs Microsoft Azure TTS

云端语音合成

A
Amazon Polly
M
Microsoft Azure TTS
免费套餐 ✓ 免费套餐 ✓ 免费套餐
定价模式 usage usage
价格 varies (Standard) $16 (Neural (1M chars))
功能
ssmlneural tts
neural ttsssmlcustom voicereal time
支持语言 en, ja en, ja, zh, ko, fr, de, es
音色数量 80 500
API ✓ 可用 文档 ↗ ✓ 可用 文档 ↗
官方网站 Amazon Polly ↗ Microsoft Azure TTS ↗
定价方案
Free Tier$05M standard chars/mo for 12 months
Standard voices$4/1M charsAfter free tier
Neural voices$16/1M charsAfter free tier
Free$0500K neural chars/mo, 5M standard chars/mo
Neural voices$16/1M charsAfter free quota
Custom Neural VoiceFrom $50/moCustom voice training + deployment
支持平台
api
api
集成 AWS Lambda, Amazon Lex, S3, Amazon Connect, SDK (Python, JS, Java) Azure OpenAI, Azure Bot Service, Power Platform, Teams, REST API / SDK
Amazon Polly
✓ 优点
  • AWS IAM 和 S3 无缝集成
  • 用于口型同步和突出显示的语音标记(元数据)
  • 即用即付定价,并提供 12 个月的免费套餐
  • 低延迟流合成
✗ 缺点
  • 语音目录比 Google Cloud TTS 更小
  • 神经语音仅限于特定语言
  • 与较新的深度学习竞争对手相比,自然韵律较少
Microsoft Azure TTS
✓ 优点
  • 云提供商中最大的神经语音目录(500 多种语音)
  • 定制神经语音,打造品牌独特的语音角色
  • 与 Azure OpenAI 和认知服务紧密集成
  • 免费套餐对于开发来说是慷慨的
✗ 缺点
  • 自定义神经语音需要 Microsoft 批准并需要大量成本
  • Azure 门户的复杂性可能会让新用户望而生畏
  • 随着生产规模的扩大,定价可能会迅速上涨

AI点评

Amazon Polly

Amazon Polly是AWS原生架构的天然TTS选择,尤其适合使用Amazon Lex聊天机器人或Amazon Connect联络中心的场景。Speech Marks(单词和音素的时间戳元数据)支持口型同步动画和卡拉OK式高亮显示。对于实用型应用,语音自然度足够,但在富有表现力的创意内容方面仍落后于Google Neural2和ElevenLabs。

Microsoft Azure TTS

Azure TTS在主要云提供商中拥有最大的神经语音目录,支持140多种语言。自定义神经语音功能使企业能够创建专有语音角色,这是越来越多注重品牌的企业所需求的能力。与Azure OpenAI服务和更广泛的认知服务套件的集成,使其成为微软技术栈组织的首选。在规模化运营时需要仔细关注定价透明度。

同类别比较 云端语音合成