ソニー「ニュースマネージャー」の狙い:デジタルアナウンサー、1人で制作できるニュース番組

理想は“1人で制作できるニュース番組”--ソニー「ニュースマネージャー」の狙い

ソニーは、文字のニュース原稿を音声とCGに変換し、自動で読み上げる「ニュースマネージャー」の実証実験を、渋谷の大型街頭ビジョン「ソニービジョン渋谷」で実施。その試みや狙いについて聞いた。

ニュースマネージャーは、文字情報として入力されたニュース原稿をソニーのボイステクノロジー(音声対話技術)を応用して自然な音声発話に変換。さらにCGで生成されたデジタルアナウンサーの表情と連動させて読み上げる、ニュースの提供に特化したアプリケーションとして開発されたもの。

 実証実験では、共同通信デジタルが提供するニュース原稿を、アニメ制作で知られるA-1 Picturesがデザイン・監修したデジタルアナウンサーが読み上げるというもので、実社会での有用性や、自動読み上げによるニュースの伝わり方などの検証が目的。約2分程度の番組を1日9回放送し、この実験は8月6日から22日までの17日間行われた。

ニュースを読み上げて提供するソリューションの可能性を探る

 今回のプロジェクトの中心人物であり、ボイステクノロジーの開発も手かげているソニー クラウド&サービスアプリ開発運用部門 エージェント企画開発室の倉田宜典氏は、そもそものきっかけとしてソニー・ミュージックコミュニケーションズからリリースされている音声対話型エージェントアプリ「めざましマネージャー」にあるという。

 同アプリは朝の目覚めなどをキャラクターが声でサポートするというもので、そのなかに日々の天気予報をキャラクターが読み上げる機能がある。この天気予報は共同通信社から提供されていたことで、そこからニュースを読み上げて提供するソリューションの可能性を共同通信デジタルが見いだし、ソニービジョン渋谷という実験の場もソニー側から提供できることから、プロジェクトが立ち上がったと振り返る。

 倉田氏によれば、共同通信デジタルはデジタルサイネージ向けにニュースコンテンツを配信する事業を手がけており、そのコンテンツの価値向上や新たな可能性を探る狙いがあるのではないかと推察。ソニー側としては合成音声を活用したビジネスソリューションのさらなる技術向上や発展性を探ることを目的としているという。

 実証実験のおおまかな流れとして、共同通信デジタルがニュース原稿と写真1枚を提供。それを受け、まず原稿を音声合成に変換。尺やイントネーションの確認と調整を行い、ツールを活用して番組を生成。尺の調整のためにワンフレーズ程度のコメントをライブラリから選択し、最終確認を経て納品をするというもの。実証実験ではシステムや運用全体の課題、ボトルネックなどビジネス的に必要な情報を集めることも含まれている。

 共同通信デジタルが提供しているニュース原稿はさまざなな長さがあり、「合成音声でニュースを聴く場合、長いとお経のような感覚になる」(倉田氏)として、集中して聴くことができる時間や文字数をシミュレーションした結果、現状では合成音声向けには100文字から200文字が適していると語る。

ソニーグループのツテをたどって一線級のクリエーターが参加

 実証実験でプロトタイプレベルでは大きなコストはかけにくいという状況ではあったが、ソニーグループのツテをたどって一線級のクリエイターが参加。デジタルアナウンサーのCGキャラクター映像はA-1 Picturesが担当、キャラクターデザインはアニメ「ソードアート・オンライン」などを手がけた足立慎吾氏が担当している。

キャラクターに関しては、ニュースを読ませるデジタルアナウンサーという性質と、渋谷という場所柄や老若男女全年齢を対象していることから、キャラクターとしてのキャッチーさはあえて出さない方向で依頼をしたという。一方、当初は1キャラクターのみで実施する予定が、足立氏から複数のキャラクター案が提示され、キャラクターによる心象の比較もできるという観点から、最終的に2キャラクターで実施することになった。

 音声合成エンジンには東芝製のToSpeakG3を採用。合成音声のもととなる声には、「けいおん!」の琴吹紬役や「ドキドキ!プリキュア」の菱川六花(キュアダイヤモンド)役などで知られる寿美菜子さんと、「七つの大罪」のエリザベス役や「アイドルマスター ミリオンライブ!」の北沢志保役などで知られる雨宮天(そら)さんという人気声優を起用した。

 倉田氏によれば、寿さんの声は合成音声との相性がとてもよく、これまで作ってきた合成音声の評判としてもいいのだとか。一方雨宮さんの声のニュアンスを合成音声で表現することには苦心したところもあったが、ノウハウの蓄積として役立つところが多かったと振り返る。

デジタルサイネージ市場の増加を見据えた新しいメディアの可能性

 こうしたソニューション開発の狙いは、一言で言うなら「新しいメディアの可能性」と語る。ことデジタルサイネージ市場は2020年に向けて大幅な拡大も見込まれており、そこに向けたコンテンツの需要増も想定されている。「デジタルサイネージは今のところCMや止め絵と文字でのインフォメーションがほとんど。それが動いて、なおかつしゃべるなら面白くなり価値も上がる」と語る。

 もちろん音を出せるサイネージばかりではなく、フキダシにして漫画的に読ませる手法も考えられ、サイネージのコンテンツとして、人をあまりかけずニュースを作るところから出先となる部分まで一気通貫で提供できるのであれば、それはビジネスとしての価値として十分なものになるという。

 ニュースマネージャーは「ニュースを聞く」という用途で制作されているが、さまざまな応用も考えられる。そのなかにはガイドやインフォメーション用途も想定されており、そういったガイドに人格を持たせる“アバター化”も進んでいくだろうという読みも倉田氏は持っている。

 ちなみに実証実験で印象的だったことひとつに、「海外の人ほど珍しそうに写真を撮っていた」ということを挙げた。アニメ調のキャラクターが日本をイメージさせるものの象徴としてあるなかで、デジタルサイネージを通じ、外国語に対応できるガイドキャラクターに案内させるといった展開も、特に2020年を見据えれば需要はあると推察している。

 「今の段階はソニー側として、いかに魅力的にキャラクターを動かしたり、合成音声をよく聞こえるようにするか。これはやればやるほどデータとして蓄積できるものなので、数をこなせばきれいに読める確率が上がっていき、それがコスト低減にもつながる。さらにサイネージで鍛えた技術を応用することで、ほかのサービスよりも質のいいものが商用向けにも個人向けにも提供できるようになる。プロの仕組みで作った土台を活用して、さまざまなコンテンツが生み出されるようになる」(倉田氏)

目指すは「1人ニュース番組制作」

 実証実験の目的でもある心証調査については、まだ速報レベルとしながらも拒否反応を示すような報告はなく「こちらが想定していたよりも良好なもの」(倉田氏)としている。人間の心理として、広告ではなくインフォメーション(情報)として、自分にとって価値があるものと判断できれば耳を傾けるということが大きいと推察しているという。

 まだまだプロトタイプ段階であるため、課題もさまざまな面から浮かびかがっているという。シンプルに読み上げの音質とイントネーションの向上ももちろんだが、ニュースとアニメーションの組み合わせ、特に「キャラクターがニュースを読む場合、ニュースの選択に制限がある」ということを挙げた。ニュースにはお祝い事のようなポジティブなものもあれば、事件や事故のようなネガティブな内容のものもある。テスト段階でアニメ調のキャラクターにネガティブな要素を持つニュースを読ませると、抵抗感を感じるという指摘があったため、実証実験では比較的ニュートラルやポジティブ寄りなスポーツニュースに絞って展開した。

 またしゃべるときの表情についても言及。番組では最初のあいさつで少しにこやかにしているものの、ニュース中はきりっとしてしゃべらせている。そこだけ切り取って見ると表情が固いと受け取られ、目つきが鋭いという指摘も多くあったと振り返るが、このあたりは実際のニュース番組のアナウンサーの表情を研究した結果だという。こういう表情の細かいところは、ニュースの振れ幅にも直結することだとして、ディティールも含めて突き詰めたいとしている。

 もっとも、表情のバリエーションを増やすことそのものは問題なくできることであっても、そうすることによって表情を付けていく作業が発生し、手間が増える要因になる。そのため、ニュース原稿の内容を人工知能(AI)が判断し、違和感のないものを自動的に付けられるようになれればと語る。

 「記事を入れる、あるいは伝えるべきニュースを選んだら、番組が自動生成されニュース番組が完成する。特別なスキルセットが必要なく、ディレクター1人だけで独自のニュース動画番組が作れるようになるのが、先にある到達点。と同時に、こういったニュース番組がごく自然に、普通と受け止められるようになる未来が理想」

ニュースマネージャー:「ニュースマネージャーはじめます」森下真帆編【ソニー公式】

🍎たったひとつの真実見抜く、見た目は大人、頭脳は子供、その名は名馬鹿ヒカル!🍏