D

Deepgram

음성 인식
사이트 ↗

Deepgram is a high-accuracy, low-latency speech-to-text API built for real-time and batch transcription at scale.

✓ 장점
  • 동급 최고의 실시간 전사 대기 시간(300ms 미만)
  • Nova-2 모델은 시끄러운 오디오에서 최고의 정확도를 제공합니다.
  • 화자 분할, 스마트 형식화 및 주제 감지 포함
  • 가입 시 넉넉한 $200 무료 크레딧 제공
✗ 단점
  • Azure Speech 또는 Google STT보다 다국어 지원 범위가 여전히 좁습니다.
  • 엔터프라이즈 계층에만 온프레미스 배포
  • 회의 녹화 기능이 내장되어 있지 않음 - API 전용 제품
무료 플랜 ✓ 무료 플랜
요금제 유형 usage
가격 (1 hour) $0.10 USD
기능
realtimespeaker diarization
지원 언어 en, ja
API ✓ 사용 가능 문서 ↗
요금제
Free$0$200 in free credits on signup
Pay-as-you-go$0.0043/minNova-2 model, no commitment
GrowthFrom $4,000/yrVolume discounts, dedicated support
EnterpriseCustomOn-prem, SLA, custom models
지원 플랫폼
api
통합 Twilio, Vonage, AWS, WebSocket streaming, Node.js / Python SDK
공식 사이트 https://deepgram.com

AI 해설

Deepgram의 Nova-2 모델은 영어 오디오의 정확도와 지연 면에서 독립적인 STT 벤치마크에서 지속적으로 최상위권을 기록합니다. WebSocket 기반 실시간 스트리밍은 라이브 자막, 콜센터 분석, 음성 우선 앱 개발자에게 선호됩니다. 포괄적인 SDK, 우수한 문서, 넉넉한 무료 크레딧으로 강한 커뮤니티를 구축했습니다. 다국어 폭은 Azure Speech에 비해 아직 격차가 있습니다.

비교 대상: Deepgram