A

Azure Speech (STT)

음성 인식
사이트 ↗

Azure Speech-to-Text offers real-time and batch transcription across 100+ languages with custom model fine-tuning.

✓ 장점
  • 화자 분할을 통한 실시간 및 일괄 전사
  • 도메인별 어휘 미세 조정을 위한 Custom Speech
  • 100개 이상의 언어 지원 - 클라우드 STT 제공업체 중 가장 광범위함
  • 심층적인 Azure 생태계 통합
✗ 단점
  • 커스텀 모델 학습으로 복잡성과 비용이 추가됩니다.
  • Deepgram 또는 AssemblyAI와 비교한 SDK의 자세한 정도
  • 실시간 작업에서 Deepgram보다 약간 높은 지연 시간
무료 플랜 ✓ 무료 플랜
요금제 유형 usage
가격 (Standard (1 hour)) $1 USD
기능
real timebatchspeaker diarizationcustom model
지원 언어 en, ja, zh, ko, fr, de
API ✓ 사용 가능 문서 ↗
요금제
Free$05 audio hours/mo free
Standard$1/hrReal-time and batch
Custom Speech$1.40/hr + training feeDomain-specific model fine-tuning
지원 플랫폼
api
통합 Azure Bot Service, Power Platform, Teams, Dynamics 365, REST API / SDK
공식 사이트 https://azure.microsoft.com/en-us/products/cognitive-services/speech-to-text/

AI 해설

Azure Speech STT는 언어 지원 폭과 컴플라이언스 요건 면에서 가장 강력한 엔터프라이즈 STT 서비스입니다. 커스텀 스피치를 통해 의료·법률·기술 분야에 필수적인 독자적 어휘로 모델 파인튜닝이 가능합니다. 실시간과 배치 모드 모두 잘 지원됩니다. Deepgram 대비 주요 경쟁 약점은 스트리밍 트랜스크립션 작업에서의 약간 높은 지연입니다.

비교 대상: Azure Speech (STT)