業者による電子媒体の透かし

電子書籍は簡単にデータを複製することが可能ですが、業者によっては画像データ内に様々な情報が含まれている場合があります。 これらの情報には購入者番号など、業者側から個人を特定できるようなデータが含まれている可能性があります。 以下に示す4社の電子書籍では、それぞれ異なった方法で透かしが埋め込まれています。ここでは、透かしの確認方法と除去方法を掲載します。

例1: 単純な購入者IDの透かし

元画像
透かし強調

最も単純な透かしの例です。しきい値255で二値化処理(※1)をすることにより、下部中央に識別子が浮かび上がりました。 背景色を255とすると、254の文字色でデータが埋め込まれているため、このような処理をしなければデータが存在することを確認できません。

例2: 背景色に依存しない透かし

元画像
透かし強調

この例では、背景色が必ずしも白(255)である必要はないことを示しています。電子書籍の販売業者は、透かしを入れる以前の元画像データを所持しており、 出回っている透かし入りの画像との差分を取ることで完全な状態の識別子を取得できます(その場合、通常画像はすべてのピクセルにおいて1以上の値にする必要があります)。 また、二値化処理のしきい値を254にしなければ上手く読むことができませんでした。

例3: 透かし内容の暗号化

元画像
透かし強調

この例では、透かし内容を通常のアスキー文字列ではなく、0または1の二値を用いた二次元バーコード形式として4箇所に埋め込まれています。 ただし、この例では1つのページにつき36ビットの情報しか表現することができません。

例4: やや高度な透かし

元画像
透かし強調

例3のように暗号化したデータを透かしとして用いていますが、この業者はすべてのページのすべてのピクセルに透かしを入れています。 透かし内容は極めて難解で、少なくとも以下の300種類以上の記号を用いて何らかのデータを埋め込んでいるものと考えられます。 単純な文字列の置き換えによる暗号化ではなく、復号化のために暗号化キーを必要とするような共通鍵暗号方式が用いられている可能性があります。

対策

これらの透かしを機械的に除去するための方法としては、透かしデータの挿入位置が固定であり、なおかつその位置が既知であることを前提に、 すべてのページの画像ファイルに対して、特定の位置を完全に隠したり、軽度のガウシアンフィルタ処理を施したりするものが考えられます。 ただし、この方法ではページ全体に分布しているケースや、透かし位置を特定できないケースに対応できないため、 コントラスト/明るさの値を両方とも10ポイント程度上昇させるなどすることで二値化処理によるデータの読み出しができないようにする方法が考えられます。 更に、透かしデータの内容が既知であり、かつ固定である場合、ピクセルマスクを用いて特定の情報のみを取り除くような処理方法も考えられます。

※1 Photoshop CS6では、Image -> Adjustment -> Threshold をクリックします。