Japan

メディアインテリジェンスサービス 音声認識サービス/音声合成サービス

トップ/特長

お問い合わせ

音声認識サービス/音声合成サービス

高品質な音声活用基盤をクラウドで提供
人に優しいシステムづくりをお手伝いします 「声」で、つながる、まもる、ささえる
介護・医療・シニア見守り

介護・医療・シニア見守り
記録や機器のコントロール

会議・セミナー

会議・セミナー
字幕表示や同時通訳

行政機関・観光地

行政機関・観光地
多言語案内サービス

企業・点検保守

企業・点検保守
コールセンター、音声記録


音声活用で創る、もっと優しいICTソリューション

ご提案します

東芝の音声・言語処理技術を集結した、高品質な音声合成・音声認識エンジンのクラウドサービスです。

音声合成・音声認識機能をクラウドサービスで提供

  • クラウドだから・・・スモールスタートから大規模システムまで対応可能
  • クラウドだから・・・短期間でシステムを構築可能
  • クラウドだから・・・他のサービスとも容易に連携可能

東芝の音声+大規模データ分析+知識処理技術で実現する、高品質な音声インタフェース

  • 話しことばでも精度よく認識
  • 肉声感の高い自然な音声を安定して生成する音声合成
  • 認識率や合成音声の表現力向上に必要なカスタマイズも従来の3分の1以下の作業量で可能

柔軟な課金体系とサービスレベルで使いやすい

  • 共用サービス型 : 音声認識/音声合成エンジンを複数のお客様で共有するサービス
  • 専用サービス型 : 音声認識/音声合成エンジンをお客様専用に提供するサービス

特長

音声認識サービス/音声合成サービスの特長図

人と人との会話を精度良く認識(音声認識)

表現力豊かな音声を短期間で作成可能(音声合成)

少ない手間でカスタマイズ可能

主な仕様

音声認識サービス

  • 対応言語: 日本語
  • 入力音声形式: ADPCM, リニアPCM(サンプリング周波数16kHz, ビット数16bit, モノラル)
  • API: REST API (*1)
  • 管理者向け機能: 利用状況の確認

音声合成サービス

  • 対応言語/話者: 日本語(女7,男5), 米英語(女1,男1), 北京語(女2,男1), 広東語(女1) (*2)
  • 出力音声形式: M4A(AAC-LC profile), OGG(Ogg Vorbis), WAV(リニアPCM, ADPCM)
  • API: REST API (*1)
  • 管理者向け機能: 利用状況の確認
  • *1 REST API: Representational State Transfer API
  • *2 サンプル音声は こちら で視聴できます。