私とマルチメディアMPEGラボMXFラボ

TOP

VIDEO-ITを取り巻く市場と技術

2007年11月29日掲載

第17回 著作権保護からセキュリティ用途まで〜電子透かしのご紹介
- 「技術概要〜音声データの例」

コラム執筆:株式会社メディアグリッド 岡村一寛
執筆者のプロフィール

■透かし技術の特徴

静止画像の透かし技術の考え方はご理解頂けたかと思います。さて、音声/動画コンテンツへの技術適用の前に透かし技術の特徴として以下の点をご説明いたします。この特徴によって画像/音声データの処理の考え方が理解出来ることと思われます。

静止画透かし技術でご説明いたしましたように、画素単位で処理というのはご理解いただけたとことでしょう。このことより、画素が存在している限り情報は保持されることも理解できることでしょう。例えば静止画像の場合、画素情報を圧縮アルゴリズムが変化させることもあります。画素を間引いたり/足したりすることで解像度を変化させることもあります。しかし、オリジナル(透かし入り)画素自体が消失してしまうことはありません。
これは画像フォーマットが変化しても透かし情報が存在することを意味します。つまりBMPファイルに透かし処理した画像をTIFFファイルに変更しても画素情報は存在していますから、透かし情報は存在します。同様にJPEGファイルにしても、GIFファイルにしても透かし情報は存在します。つまり皆さんのディスプレイに描画されている画素単位で考えれば、画像形式の依存度は低いわけです(画像形式によって画素単位の情報は変化しますが、それに耐えうるだけの透かし処理でカバーされています)。

この考え方からお判りいただける通り、デジタルデータに対して透かし処理した結果は、ファイル形式に比較的依存度が低い訳です。またファイル形式への依存度だけではなく、デジタルデータから印刷するというアナログで出力されたとしても、デジタルデータ時の画素単位の情報が保持されていれば、印刷(アナログ)状態からでも透かし情報は検出されることになります。

同様の考え方を音声データで考えることが出来ます。様々な音声データ形式があります。しかしアナログで周波数を見てみますと、データ形式に依存することはありません(解像度、帯域による品質の違いはありますが)。音楽CDを聴いて、音声圧縮をしたら違う曲になっているということは無いわけです。

では、静止画像の画素に相当する音声情報は何でしょうか?
例えば音声の周波数もそれに相当します。非圧縮の音源を44.1khz/16bitの形式で周波数を見た際に、基本的に人間の可聴域での曲線が描かれます。当然音楽ですから時間という概念があります。尺に合わせて周波数が変化します。ある一定の尺の間で存在するデータ量を書き換えてみると、どうでしょうか?そこに情報を記述することができます。

静止画像の透かし処理をご理解された方は、すぐにお判り頂ける事でしょう。一定の尺の間に存在するデータをちょっとだけ書き換えても、人間の耳では違いが認識出来ないかもしれない、ということが容易に想像できるでしょう。

図1:キャプション(仮)

図1:音の大きさの推移

例えば上の図をご覧ください。音の大きさの推移を時間に即してグラフ化の一例です。一定時間の中で任意にこのグラフを書き換えてみます。例えば、ピークの大きさや急激に減衰する曲線の角度など。人間では理解しにくい程度の書き換えを行うことで情報の書き込みができるというのが、静止画像と同様な考え方を用いた「音声透かし」の一例です。

この図表では、オリジナルの音声曲線を黒として記載し、後から書き込む情報を赤として記載しました。静止画像の際に記載しましたHuman Visual Systemという人間の視覚特性を利用するように、音声においてもHuman Audio Systemと称する聴覚特性が存在します。
この特性のいくつかは以下に大別できます。
・ アナログ形式の電子透かし
・ 音声量子化値への電子透かし
・ 音声マスキングによる電子透かし
・ 予測符号ランレングスによる電子透かし
・ ベクトル量子化による電子透かし
・ 音源パルスによる電子透かし

例えば音声マスキングというもので言えば、皆さんは大きな音の直後に存在する極めて小さい音を認知することは困難です。会議室で議論を交わしている中で蛍光灯の音を常に意識している人も稀と思われます。人間の耳は大変性能が良く、意識の集中する部分とそうでない部分の認識力が異なります。様々なマスキング効果を活用し、人は的確に音声情報を捕らえているのです。この特徴を利用することが音声透かしとして情報を書き込む方法の1つと言えます。

動画情報に対する適応は、簡単に申せば静止画透かしと音声透かしのミックスとなります。しかし当然ですが静止画とはデータ化の構造が異なります。動画コーデック(格納方法)によって記述方法が異なりますし、音声データも同様です。

<< 1 2

(コラム記事/メディアグリッド 岡村一寛)

製品・システム・技術に関するお問い合わせ