A

Amazon Polly

클라우드 TTS
사이트 ↗

Amazon Polly is a cloud TTS service with neural voices tightly integrated into the AWS ecosystem.

✓ 장점
  • 원활한 AWS IAM 및 S3 통합
  • 립싱크 및 강조 표시를 위한 음성 표시(메타데이터)
  • 12개월 무료 등급을 사용한 종량제 가격
  • 저지연 스트리밍 합성
✗ 단점
  • Google Cloud TTS보다 작은 음성 카탈로그
  • 특정 언어로 제한된 신경 음성
  • 새로운 딥러닝 경쟁 제품에 비해 덜 자연스러운 운율
무료 플랜 ✓ 무료 플랜
요금제 유형 usage
가격 (Standard) varies USD
기능
ssmlneural tts
지원 언어 en, ja
음성 수 80
API ✓ 사용 가능 문서 ↗
요금제
Free Tier$05M standard chars/mo for 12 months
Standard voices$4/1M charsAfter free tier
Neural voices$16/1M charsAfter free tier
지원 플랫폼
api
통합 AWS Lambda, Amazon Lex, S3, Amazon Connect, SDK (Python, JS, Java)
공식 사이트 https://aws.amazon.com/polly/

AI 해설

Amazon Polly는 특히 Amazon Lex 챗봇이나 Amazon Connect 컨택 센터를 사용하는 AWS 네이티브 아키텍처에 가장 자연스러운 TTS 선택지입니다. 단어와 비짐(viseme)에 대한 타임스탬프 메타데이터인 Speech Marks는 립싱크 애니메이션과 노래방 스타일 하이라이팅을 가능하게 합니다. 실용적인 애플리케이션에는 충분한 자연스러움을 제공하지만 표현력 있는 크리에이티브 콘텐츠에서는 Google Neural2나 ElevenLabs에 미치지 못합니다.

비교 대상: Amazon Polly