増える機械音声合成放送の放送

最近、駅自動放送の収集、研究を趣味にする方々に最近アツイのが、機械音声合成音声(以下「合成音声」と表記)を用いた自動放送です。

皆様ご存知かと思いますが、機械音声で文章を読み上げて出力した音のことを指します。

広く知られている「ゆっくり」こと「Softalk」も、自然な読み上げとしてはすこし劣りますが合成音声の1つです。

技術の進歩によって高品質な合成音声が登場し、今、駅自動放送の姿が大きく変わろうとしています。

肉声合成から機械合成音声へ

日本初の自動放送が新宿駅に導入されたというお話からすでに半世紀以上。駅放送は元来、事前に用意した肉声を流すというものが普通でした。

通常の駅放送は、予め録音した音声パーツを組み合わせることで1つの放送としています。

たとえば大阪駅の例でいうと、以下のように

まもなく / 8番のりばに / 11時 / ちょうど発 / 新快速 / 湖西線経由 / 敦賀 / 行きが / 12両で / まいります。

といった感じで、細分化された音声パーツを組み合わせていくことにより、1つの文章を作り上げるようになっています。

黎明期の自動放送は1文でしか登録できなかった(要するに上の文章を列車ごとに1パターンずつ作る必要があった)わけですから、これだけでも随分と技術は進歩しています。


しかし万が一にも放送を変える場合には、音声パーツを並び替えてできる場合にはそれでまかなえますが、できない場合には声優さんを呼び、新しく吹き込んでもらう必要が出てきます。

今までの自動放送はこのように、事前に用意した文言の範疇でしか動作しないという点において、万能なように見えて実は制限だらけでした。


そこで鉄道会社が目を付けたのが合成音声です。

合成音声の利点はいくつもありますが、一番大きいメリットがこの「文言の変更が容易である」というところです。

事前の録音が必要な従来の方式に対し、合成音声は登録してある文言を変更するだけで内容が変わります。声優さんを呼ぶ必要もなく、ワンクリックで駅ごとに自由に変更できます。

これは別に通常の放送に限らず、遅延時にその旨を流す放送でも同じことが言えます。

合成音声であれば、遅延時でも文章さえ設定すれば、同じ内容を何度も自動放送で流すことができます。振替輸送の対象会社を無限に吹き込む必要もありません。
こういう点において非常に都合がいいのです。


しかし欠点もございます。機械も機械で万能ではありません。

まずよく言われるのが「発音が不自然である」という点です。地名ですと実際の読まれ方と相違が出てきたり、文脈を誤ってイントネーションを付ける位置が変わったりという、肉声放送では考えられない初歩的なミスも生まれてきます。

幸いこの点については、編集する駅員さんがうまく設定できれば全く問題ない話です。ですから大きな問題ではありません。


もっと大きな問題はありまして、それが「声に張りがない」というところです。

駅構内は騒音に包まれている特殊な環境です。しかし合成音声は編集しやすくするため、透き通った音を極力排除する傾向があります。

ですので、騒音に紛れて聞き取りづらくなることや、もしくはかき消されてしまうことが考えられます。

駄作と言われた「旭型放送」

合成音声の放送が導入され始めたのは、今に始まったことではありません。
先例はいくつもあります。

その中でも特に最近、駅放送を生業とする方々に衝撃を与え、そしてトラウマを与えたのが、通称「旭型放送」と呼ばれる合成音声を用いた駅放送の登場でした。

YouTube 等で調べていただければ動画が見つかると思います。


JR東日本が導入した、旧型放送を更新するための最新鋭のシステム…のはずでしたが、合成音声としてはあまりに質が低く、オノマトペで表すなら「もっちゃり」したような、可変性にのみスキルを振ったような非常にお粗末なものでした。

これが旧来の放送を用いていた駅で、特に詳細な案内が可能だった熱海駅に導入されたと同時、阿鼻叫喚の図となったのは記憶に新しい出来事です。

時代の変わり目

ここからも分かる通り、あとは時の流れと技術の進歩に任せ、高品質な合成音声を用いた放送が出てくるのはまさに時間の問題でした。

それがついに姿を現したのは2016年3月、岡山地区に導入された新CTC(列車集中制御装置)連動の自動放送です。


この放送システムでは、HOYA社が提供する VoiceText という音声合成システムを使用しています。

日本語のみではなく英語、中国語、韓国語と多彩な言語を同一フォームで設定できるというところが決め手となったようです。


こちらも一度、「岡山駅 新放送」などで調べて音声を聞いてみてください。

いままでの合成音声と比べて発音が格段に改善されています。

合成音声でよく見られる音飛びもほとんどなく、また男声は性質上高音が弱くなってしまいますが、女声では高い音も発声されており、肉声放送を淘汰するには十分すぎる品質です。


この後も同様の放送は名鉄喜多山駅、栄町駅JR西日本の北陸方面主要駅、そして最近導入が始まったJR東海静岡地区と相次いで導入されています。

肉声合成音声の放送の終わりも終わりが近いかもしれません。



…とは書いてみましたが、日本に存在する詳細型放送の種類は数百のレベルです。その中のほんの一部が合成音声に変わっただけの話であって、まだ当面の間は心配ないでしょう。


直近で心配なところといえば大阪環状線大和路線の放送でしょうか。

こちらはすでにおおさか東線の延伸が決まっており、その折に新しく音声を収録する必要がありますが、男声担当の津田英治氏は実質引退状態です。

JR西日本はすでに岡山地区や北陸方面で合成音声を導入しており、かなり積極的に肉声合成音声を淘汰する方向に向かっていますから、万が一は起こり得なくもない状況です。

今の放送にも愛着はありますが、英語放送の発音(アクセント位置と息継ぎのタイミング)さえもう少し改善されれば、合成音声でも納得かなぁ…といったところです。


この辺りの改善はJR西日本さんの手腕にかかっていますので、英語に精通した方を放送の編集担当に充ててくれるのを願うばかりです。

現行の環状線の放送で問題となっている「関空紀州路快速」の二の舞は起こさないでほしいですね…()


それでは~!

Written by Yatatetsu ... All Rights Reserved