特集:研究室おじゃまします!
2013年2月1日号
放送音質の改善を目指す
世界初の音声加工技術で 聞き取りやすい声を作り出す
情報通信学部情報メディア学科 程島奈緒 講師 

体育館での朝礼中、遠くで話している校長先生の声が聞き取りにくかった─そんな経験をした人も多いのでは? では、どうすればホールなどの広い場所で正しく情報を伝えることができるのだろうか。コンピューターによる音声加工技術の開発に取り組んでいる、情報通信学部の程島奈緒講師を訪ねた。

駅のホームや商業施設などのアナウンスは、なぜ聞き取りにくいのだろう? 程島講師は、「最大の原因は残響にある」と話す。「コンクリートやガラスなどの硬い物質で囲まれた空間では、人の声は直接相手の耳に入るだけでなく、壁や床に反響して耳に届きます。それが残響です。空間の広さに応じて大きくなり、声を聞き取りにくくする性質を持っているんです」
 
現在、残響を抑えるには、建物の天井や壁に吸音材を張るか、音質のよいスピーカーを設置するなど、設備に頼っている面がある。だが、いずれもコストが高いことが欠点だった。そこで程島講師は、声そのものに着目。声の波長をコンピューターで加工し、聞き取りやすくする技術の開発に取り組んできた。

アナウンス音を加工しさまざまな空間に対応
研究では、さまざまな環境で人の声を収録。母音と子音の波長を加工した後、体育館など特定の空間を想定してシミュレーションする。さらに、幅広い年代の被験者に音声を聞いてもらい、その正答率を分析することで、どのように加工すれば聞き取りやすくなるのかを調べている。
 

2001年には、母音などの波長の中で振幅や周波数が安定している部分(定常部という)を一定の割合で削ると、声が聞こえやすくなることを世界で初めて発見。コンピューターによる音声加工の新しい可能性を開く技術として、大きな注目を集めている。「たとえば『き(Ki)』という音を出す際、人は最初に子音のKを出した後、母音iを続けて発音している。この場合、Kとiの真ん中あたりにある母音の定常部の振幅を絞ると、残響が多い空間でも声が聞きやすくなります」
 
高齢者などを対象に行った実験では、現段階でも加工前後で10%ほど正答率が上がっている。「さらに研究成果を蓄積していけば、空港やデパート、ホールなど幅広い空間に対応できる技術を確立し、汎用性の高い音声加工用の機器を作り出すことも可能になる。従来の方法よりもずっと安価に、放送音質を改善できると期待しています」

大規模災害に備えて緊急放送用の技術も
これと並行して進めているのが、ロンバード効果と呼ばれる現象を利用した音声収録技術の研究だ。人は騒がしい空間の中で会話をするとき、通常よりも声のトーンを上げて話すなど、無意識のうちに声の出し方を工夫している。それがロンバード効果だ。程島講師はこれを応用し、放送室にいる話し手が、人が密集した場所の騒音をヘッドホンで聞いた状態で話すと、より聞き取りやすい放送ができることを科学的に解明。実験を重ね、より効果的な手法を探っている。
 
「2つの研究を組み合わせれば、高齢者など耳が不自由な人にも正しい情報を伝えやすくなる。地震発生時の駅構内や大型店舗で火災が起きた際など、人が大勢いる場所での避難誘導もより正確にできるようになります。緊急時に少しでも多くの人を助けられるよう、一日も早く実用化の道を開いていきたい」と話している。


focus
失敗しても恥をかくだけ
自分なりに考えて行動して


「最近、失敗を恐れて自分から行動しない学生が増えているように思うんです」。たとえば授業でコンピューターのプログラミングを教えると、動作テストをする前に「これで合ってますか?」と聞かれることが多くなったという。「何かをやって失敗をしても、恥をかくだけで経験にもなる。やらないよりは、やるほうがずっといいと思うんです」。小さいころから、面白そうなことがあれば、思い悩む前に試してみる性格だった。「まずはやってみて、好き嫌いを見極める。好きなら続けるし、いやだったら無理せずやめる。両親も、そんな私を全面的に応援してくれました」。
 
高校時代は友人とバンドを組んで、ポップスやロックに熱中した。音楽関係の仕事にも憧れたが、より幅広く音響について勉強したいと、大学は理工学部を選択。在学中にはアーチェリーにも挑戦した。
 
卒業研究では、「大好きな音で社会の役に立てる」ことから音響学のゼミを選択。「試行錯誤を続け、新しい謎に挑んでいるうちに、研究者の道を歩むようになっていた」。研究室の学生には、自分なりに考えながら行動するよう指導している。「社会人になれば、自分で考え、判断しなければならないことが多くなる。だからこそ在学中にその習慣を身につけてもらいたい。もちろん私も、新しいことに挑み続けますよ」。

 
ほどしま・なお
1979年東京都生まれ。上智大学大学院理工学研究科電気・電子工学専攻博士後期課程修了。博士(工学)。Norwegian University of Science and Technology客員研究員などを経て、2010年に東海大学に着任。専門は音響学。
Key Word 人の声が聞こえる仕組み
人の声は、音波という振動になって空気中を伝わる。耳に入った声は、内耳にある内有毛細胞と呼ばれる「毛」で感知され、脳内で過去に得た知識や記憶をもとに言葉として理解されている。歳をとると「毛」が抜け落ち、脳神経の機能が衰えることで、うるさい場所での話や早口の会話が聞きづらくなる。