Deepgram vs Rev.ai

音声認識

D
Deepgram
R
Rev.ai
無料プランあり ✓ 無料プランあり ✓ 無料プランあり
料金モデル usage usage
価格 $0.10 (1 hour) $0.02 (per minute)
機能
realtimespeaker diarization
asyncreal timespeaker diarizationwebhooks
対応言語 en, ja en
API ✓ 利用可能 ドキュメント ↗ ✓ 利用可能 ドキュメント ↗
公式サイト Deepgram ↗ Rev.ai ↗
料金プラン
Free$0$200 in free credits on signup
Pay-as-you-go$0.0043/minNova-2 model, no commitment
GrowthFrom $4,000/yrVolume discounts, dedicated support
EnterpriseCustomOn-prem, SLA, custom models
Free$0300 minutes free on signup
Pay-as-you-go$0.02/min asyncStreaming at $0.021/min
EnterpriseCustomVolume discounts, dedicated infrastructure
対応環境
api
api
連携 Twilio, Vonage, AWS, WebSocket streaming, Node.js / Python SDK Webhooks, Python SDK, Node.js SDK, REST API
Deepgram
✓ メリット
  • クラス最高のリアルタイム文字起こし遅延 (<300ms)
  • Nova-2 モデルは、ノイズの多い音声に対して最高の精度を実現します
  • 話者のダイアライゼーション、スマート フォーマット、トピック検出が含まれています
  • サインアップ時にたっぷり 200 ドルの無料クレジットをプレゼント
✗ デメリット
  • 多言語サポートは Azure Speech や Google STT よりもまだ狭い
  • エンタープライズ層のみのオンプレミス展開
  • 会議レコーダーは内蔵されていない - API のみの製品
Rev.ai
✓ メリット
  • Rev のヒト転写品質ベースラインによる裏付け
  • 信頼性の高い非同期およびリアルタイムの文字起こし
  • 話者のダイアライゼーションとカスタム語彙のサポート
  • 新規アカウントの場合は 300 分間無料
✗ デメリット
  • 英語のみ - 多言語サポートなし
  • ノイズの多い音声での精度は Deepgram Nova-2 をわずかに下回ります
  • AssemblyAI よりも AI インテリジェンス機能が少ない

AI解説

Deepgram

DeepgramのNova-2モデルは、英語音声の精度と遅延において、独立したSTTベンチマークで常にトップかそれに近いスコアを記録しています。WebSocketベースのリアルタイムストリーミングは、ライブキャプション、コールセンター分析、音声ファーストアプリ開発者に好まれています。包括的なSDK、優れたドキュメント、寛大な無料枠によるDXの良さが強いコミュニティを築いています。多言語の幅はAzure Speechに比べてまだ課題があります。

Rev.ai

Rev.aiは人間によるトランスクリプション企業としてのRevの長い歴史から恩恵を受け、メディアおよび法律顧客に響く品質重視の評判を持っています。APIは統合が簡単でSDKサポートも充実しています。ただし英語のみで、AssemblyAIが提供するAIインテリジェンス層(要約、感情分析)がありません。速度ではDeepgram、機能ではAssemblyAIに負けがちな競争的な中間地点に位置しています。

同カテゴリの比較 音声認識