音に付加価値を埋め込む」

オーディオ・データハイディング研究

東京情報大学総合情報学部 准教授
西村 明 (にしむら あきら)

1968年高知県生まれ。九州芸術工科大学(現九州大学芸術工学部)大学院博士後期課程修了。
東京情報大学総合情報学部情報文化学科(映像・音響研究室)准教授、 専門分野:音響学

研究テーマ:音響メディアと人間の知覚/認知/感性情報処理に関する研究

データハイディングとは、なんらかのデータ(媒体:メディア)の中に別のデータを隠すことをいう。ここでは、音にディジタル情報を埋め込んで、必要なときに取り出して活用する、オーディオ・データハイディング(音響情報秘匿)の研究について、筆者が開発した新技術を含めて紹介したい。

「非可視透かし」の手法

ローマ時代、頭髪を剃って秘密の伝言を刺青し、頭髪が揃ってから密使として放ったという伝説がある。これもデータハイディングだったと言えるだろう。最近では自動車の車検証に、目に見えない印刷(非可視透かし)が採用されていて、コピー機で複写するとCOPYという文字が浮き出てくる。複製を防ぐ工夫である。  こうした印刷物だけでなく、ディジタルコンテンツ(音、画像、映像、文字)に透かしデータを埋め込んでおけば、インターネット上で不正コピー等が出回っても、どこからどの作品が流出したかを、透かしデータを検出することによって自動的に検出することができる。ディジタルメディアとインターネットの発達に伴い、こういったコンテンツの不正流通を防ぐ用途での透かしの利用は、画像や映像を中心に盛んになってきている。

データの抜き取り、書き換えも

ディジタル音信号(たとえば音楽CD)にデータを埋め込むオーディオ・データハイディングの最も単純な手法は、つぎのとおりである。音楽CDには、0あるいは1を16個組み合わせて表現した音のデータ(16ビット)が1秒間あたり44100個の割合で記録されている。この16個でひとまとまりとなる0あるいは1のうち、最後の16個目を、埋め込む情報(これも0か1で表現される)に置き換えると、左右の信号で1秒当たり約5500文字分の情報を埋め込むことができる。かなりの情報量が埋め込まれているのだが、耳で聞いても元の音との聞き分けは非常に困難である。  ところが、このような方法では、埋め込んだデータの抜き取り、書き換えが簡単なだけでなく、ごくわずかな雑音を加えるだけで埋め込んだデータは検出不能になる。また、携帯音楽プレーヤに保存したりインターネットで流通させたりするため音楽CDデータを圧縮しても、埋め込んだデータは検出不能になる。実際のデータハイディングの手法はもっと複雑かつ巧妙なので、埋め込んだデータを簡単に書き換えたり無効にしたりすることはできない。しかし、透かしデータを埋め込んでいることが分かると、悪意ある不正利用者はさまざまな変換攻撃を行って透かしデータを無効にしてしまうかも知れない。すでに一部の映画音声には、実際に透かしデータが入っているらしいが、こういった事情もあり、本当に埋め込まれているのかどうかは明らかにされていない。

音声を受け取る側の利用法

オーディオ・データハイディング技術は、違法コピー防止の必要性の高まりから、コンテンツ(音楽)の権利者がデータを埋め込み、その検出を行う透かしとしての利用法が主に考えられてきた。しかし、最近では音に付加価値となる情報を埋め込み、その音を受け取る側で埋め込まれたデータを利用する方法が提案されるようになった。  たとえば、既存の情報通信手段が使用不能になった災害時などに、緊急車両等のサイレン音に避難情報を埋め込む利用法があり得る。また、テーマパークや博物館などで音楽にアトラクションや展示物の情報を埋め込む利用、CMのBGMに商品情報にアクセスするデータを埋め込んでおく、いわゆる音のQRコードといった利用法なども考えられている。

さらに、鉄道駅などの騒々しい場所で、聴覚障がい者に必要な情報を提供する手段としても有効である。つまり、アナウンス音声が補聴器を使用しても十分に聞き取れない場合、音声に伝えたい内容をデータとして埋め込んでスピーカから再生する。利用者が持つ携帯電話などのマイクで受音してデータを検出表示すれば、情報を受け取ることができる(図1参照)。  情報を伝えて受け取るだけであれば、音声や音楽とは別の通信手段、たとえば無線通信や最近開発された可視光通信によっても実現可能であるが、音に情報を埋め込めば、新たな通信設備を必要とせずに、スピーカや携帯電話といった既存の機器にデータ埋め込み器と検出ソフトを搭載すればよい。

新しい利用法に適した技術開発

しかし、こういった新しい利用法に、従来の音楽に埋め込む透かし目的に開発されたデータハイディング技術のほとんどは、残念ながら、そのまま適応することができない。なぜなら透かし技術は、データを埋め込んだ音がスピーカから再生してマイクで収音するといったような、大きく音質が変化する状況を前提にはしていない。さらにスピーカからマイクまで届く間に、周りの雑音を同時に拾ったり、壁などに音が反射を繰り返すことによって響きがついたりして、埋め込んだデータを検出するのに困難な状況が重なる。  筆者は、雑音に強く、反射音や響きが付け加わっても埋め込んだデータを十分検出できる能力をもつオーディオ・データハイディング技術を開発した。スピーカ再生された音に埋め込まれている情報を、マイクで収音してから検出する、という利用条件に適していると言える。

この技術を用いて、カラオケの伴奏音楽に歌詞の情報を埋め込んでおき、伴奏の再生にタイミングを合わせて歌詞を表示するシステムを作成した(図2参照)。このシステムは、映画の音声トラックに登場人物のセリフの情報を埋め込んでおき、映画の進行に伴いタイミングを合わせて字幕を表示することもできる。また、情報が埋め込まれた音声を受け取る側で利用する新しい利用法のいずれにも、使用可能なシステムである。

今後の発展と課題

オーディオ・データハイディング技術自体ここ十数年の新しい技術であり、ここで挙げた新しい応用例に関する研究もまだ始まったばかりである。データを埋め込むことに伴う音質劣化を客観的に評価し低減する技術、効率よく少ない情報量を埋め込む符号化技術、大きく変動する雑音への対応など、課題も多い。今後は、社会のニーズについての調査や実環境での技術の評価を行い、実社会において使われ役に立つ技術へむけて、実学としての基礎を固めていきたいと筆者は考えている。


×CLOSE