東芝デジタルソリューションズ株式会社

RECAIUSを活用した画期的な音声合成サービスを実現/廣田 克彦

東芝はビジュアルコンテンツ販売・制作のトップカンパニーである株式会社アマナ様との共創に取り組んできました。その最初の成果として、グループ企業の株式会社アマナイメージズ様と共同で、東芝の「RECAIUS(リカイアス)」を活用したクラウド型合成音声ナレーションサービス「Narsta(ナレスタ)」を開発。写真や映像などストック素材の販売サイト「amanaimages.com」を通じて、2016年6月からサービスの提供を開始しました。
Narstaは肉声に近い表現力豊かな合成音声をテキストから簡単に作成できるサービスです。従来、相応の時間と費用が必要だったナレーション制作の課題を解決すると同時に、ビジネスモデルとしても共創だからこそなし得た画期的な側面を持っています。

Narstaの概要

RECAIUSを活用し、リアルな合成音声を簡単作成

 話し言葉は、複雑な要素の組み合わせでできています。人は、アクセントやイントネーション、個人差のある声質などの材料を無意識のうちに操ることで、豊かな感情表現を行っています。こうしたリアルな肉声にどこまで迫れるかが、音声合成サービスのテーマです。

 「Narsta(ナレスタ)」は、Webブラウザ上でのテキスト入力と簡単な画面操作だけで、感情のこもった表現力あふれるナレーションをその場で作成し、購入できる画期的なサービスです。アマナイメージズ様が展開する国内最大級の写真・イラスト・映像などストック素材の販売サイト「amanaimages.com」を通じて、プロの制作者や一般のユーザーの方々に向けて広く提供されています。

 このサービスの基盤ともいえる高度な音声合成には、東芝の音声・映像活用クラウドAIサービス「RECAIUS(リカイアス)」の音声合成サービスが利用されています。先進のメディアインテリジェンス技術で、テキストを多様な話者と感情表現で自由自在に音声化。音声合成を使った各種製品やサービスの中でもひときわ肉声に迫る高い品質を実現しています。

共創の経緯

東芝の音声合成技術にアマナ様のノウハウを融合
新サービス創出を目指す

図1 東芝の音声合成技術

 Narstaとして結晶したアマナ様との共創が始まったのは、2014年のことでした。

 アマナ様は写真撮影や映像制作、さらにはブランディングやプロモーション制作まで行うビジュアルコミュニケーションのトップカンパニーです。中でもグループのアマナイメージズ様が手がけるamanaimages.comでは、世界中から厳選された写真やイラスト、映像などのストック素材をいつでも簡単に購入できるビジネスモデルを確立。圧倒的な競争力を既に築かれていました。

 しかし当時は、動画投稿サイトの普及など一般の人の動画制作ニーズが高まり始めたころ。スマートフォンやデジタルサイネージの普及を背景に、ブランディングや販売促進の手法も紙から映像へと劇的なシフトを始めていました。アマナ様では市場環境の変化をとらえ、さらなる成長と躍進に向けた新たなビジネスの芽を模索していました。

 一方、東芝では、1960年代から研究開発してきた「音声」「映像・画像」「言葉と知識」の技術による、音声認識や音声合成、対話、翻訳、画像認識、意図理解といったメディアインテリジェンス技術を基盤とした新しいサービスの開発が直近の課題でした。既に音声合成では、CMやプロモーションビデオ、カーナビゲーションシステムなどにおいて受託型でオリジナル音声の制作を行い、クラウドサービスで音声合成エンジンの提供を行うなど、各種取り組みを進めていましたが、東芝グループの事業拡大に寄与するためには、恒常的に価値を生み出し続けるコンテンツサービスへの参入が必須と捉えていました(図1)。

 そんな東芝にとって、兼ねてよりお付き合いのあったアマナ様の豊富なコンテンツサービスの知見と販売チャネルは大変魅力的でした。そこでアマナ様に、東芝の音声合成を活用した新たな事業開発を提案。サービスメニューを広げたいアマナ様のニーズと合致して、両社による共創が始まりました。

共創の実現

高品質、簡単、安価 音声合成サービスに新たな価値を

図2 Narstaのサイトイメージ

 東芝では営業担当と技術担当が混在した専任チームを結成。アマナ様の新事業領域開発室と共に、プロジェクトをスタートさせました。市場環境や競合企業、顧客の状況などに関して密に情報交換を繰り返しながら、ゴールに設定したのは、高品質な音声合成に加え、ユーザーに高い経験価値を与えるコンテンツサービスの創出でした。

 それまで放送・広告・Webなどの制作会社や一般企業などにおいて映像コンテンツを制作する際は、プロの声優やナレーターによる録音か、費用をかけてオリジナルの合成音声を作るのが一般的でした。こうした敷居の高さを解決するため、プロの制作者はもちろん、一般の人もリアルな肉声に近い品質の合成音声を手軽に作成できるインターネットサービスを構想。東芝のRECAIUS音声合成サービスに、アマナ様の優れたサービスノウハウを融合させて、課題解決を目指しました。

 開発にあたっては、アマナ様のグループ会社であるアマナイメージズ様がインターフェースを担当。テキストの入力と直感的な画面の操作だけで、合成音声を簡単に作成して購入できる優れたユーザビリティーを多彩に実装しました(図2)。

 これにより男女八つの声質から最適な声を選び出し、読み上げるスピードや感情、アクセントを調整するだけで、理想に近いナレーションを手に入れることが可能になったのです。また今後拡大が予測されるインバウンド市場をビジネス機会と捉え、英語、韓国語、北京語、広東語の多言語にも対応。これをアマナイメージズ様が手がけるamanaimages.comで展開することで、膨大な既存ユーザーに対して早期にアプローチできる体制を整えました。

 こうして完成したNarstaは、プロのコンテンツ制作者や一般のユーザーの方々に大きな驚きを与えました。手間とコストのかかる録音・編集作業を経ることなく、肉声に近い高品質な合成音声を、フレーズ単位の安価な価格で、いつでも簡単に入手できるようになったからです。

 しかし、共創により叶えられたのは豊かな顧客価値だけではありません。Narstaでは、RECAIUSの使用料から収益を生み出すのではなく、ダウンロード数に応じてアマナ様とのレベニューシェアを行います。こうした課金タイプの収益モデルの実現は、東芝にとっては非常に画期的なものでした。東芝グループに先駆けてサービスビジネス開発を推進する東芝デジタルソリューションズ株式会社にとっても、新たな顧客価値とビジネス価値を両立させた先進的な事例となりました。

 今後はこのNarstaを通じて、東芝のメディアインテリジェンス技術の品質がより多くのお客さまに認知されることを期待すると同時に、アマナ様との共創をより深め、前に進めながら、暮らしやビジネスのさまざまなシーンに質の高いサービスによるうれしさと感動を広げていきたいと考えています。

  • ※ 感情は、日本語のみの対応です
お問い合わせ
東芝デジタルソリューションズ株式会社
電子メール
e-mail:INS-info@ml.toshiba.co.jp
FAX
044-548-9522
所在地
〒212-8585 神奈川県川崎市幸区堀川町72番地34
INDEX【T-SOUL 19号】

東芝の共創

このページのトップへ