暗号学的ハッシュ関数の特性や用途

データが改ざんされていないかを確認したり、パスワードを安全に保存したりするためなどに使われる重要な技術としてハッシュにについて説明をします。

ハッシュ関数の概要

ハッシュは元データから特定のアルゴリズムによって不規則な文字列「ハッシュ値」を生成できます。
元データからハッシュ値に変換する計算を「ハッシュ化」や「ハッシュ関数」といいます。
なお、元データはメッセージでもファイルでも扱えます。

２つの元データが同じであれば、ハッシュ値も同じになります。

ハッシュ値は「メッセージダイジェスト」や「ダイジェスト」という場合もあります。

特徴１：元データの桁数に関わらずハッシュ値の桁数は固定

特徴２：元データが1文字変わるだけで全く違うハッシュ値となる

①原像計算困難性

ハッシュ値から元データを求めることが困難なこと。

②衝突発見困難性

同じハッシュ値になる(衝突する)元データを求めようとしても、計算量が大きいために困難であることをいいます。

③第2原像計算困難性

ある既知の元データとそれに対するハッシュ値が与えられた時に、ハッシュ値が一致する別の元データを見つけることは困難なこと。
この「別の元データ」を第2現像と言います。

ハッシュ関数の規格はいくつかあります。
古い規格のハッシュ関数で現在では非推奨になっているものもありますので注意が必要です。

名称	説明
SHA-2	NISTが開発したハッシュ関数で、現在最も利用されている。 SHA-2は、以下の種類があります。・SHA-256・・・ハッシュ値が256bit ・SHA-384・・・ハッシュ値が384bit ・SHA-512・・・ハッシュ値が512bit
SHA-3	NISTが開発したSHA-2の後継として決められたハッシュ関数です。
MD5	128bitのハッシュ値を出力するハッシュ関数です。衝突発見困難性を実現できなくなっているので、現在では非推奨となっています。