单向散列函数(go语言实践)

1. 单向散列函数的含义

单向散列函数(one-waynction)有一个输入和一个输出,其中输入称为消息(message),输出称为散列值 (hashvalue)。单向散列函数可以根据消息的内容计算出散列值,而散列值就可以被用来检查消息的完整性。

这里的消息不一定是人类能够读懂的文字,也可以是图像文件或者声音文件。单向散列函数不需要知道消息实
际代表的含义。无论任何消息,单向散列函数都会将它作为单纯的比特序列来处理,即根据比特序列计算出散
列值。

散列值的长度和消息的长度无关。无论消息是1比特,还是100MB,甚至是IOOGB,单向散列函数都会计算出固 定长度的散列值。以SHA-I单向散列函数为例,它所计算出的散列值的长度永远是160比特(20字节)。

单向散列函数的相关术语有很多变体,不同参考资料中所使用的术语也不同,下面我们就介绍其中的儿个。 单向散列函数也称为消息摘要函数(message digest function)哈希函数或者杂凑函数。 输入单向散列函数的消息也称为 原像 (pre-image)

单向散列函数输出的散列值也称为消息摘要(message digest)或者指纹(fingerprint)。 完整性 也称为一致性。

2. 单向散列函数的性质

  • 根据任意长度的消息计算出固定长度的散列值
  • 能够快速计算出散列值
  • 消息不同散列值也不同
  • 难以发现碰撞,称为抗碰撞性
  • 备单向性,无法通过散列值反算出消息

3. 单向散列函数的实际应用

  • 检测软件是否被篡改

  • 消息认证码
    消息认证码是将“发送者和接收者之间的共享密钥”和“消息,进行混合后计算出的散列值。使用消息认证码可以 检测并防止通信过程中的错误、篡改以及伪装。
    消息认证码在SSL/TLS中也得到了运用。

  • 数字签名
    数字签名是现实社会中的签名(sign)和盖章这样的行为在数字世界中的实现。数字签名的处理过程非常耗时, 因此一般不会对整个消息内容直接施加数字签名,而是先通过单向散列函数计算出消息的散列值,然后再对这 个散列值施加数字签名。

  • 伪随机数生成器
    密码技术中所使用的随机数需要具备“事实上不可能根据过去的随机数列预测未来的随机数列”这样的性质。为 了保证不可预测性,可以利用单向散列函数的单向性。

  • 一次性口令
    一次性口令经常被用于服务器对客户端的合法性认证。在这种方式中,通过使用单向散列函数可以保证口令只 在通信链路上传送一次(one-time),因此即使窃听者窃取了口令,也无法使用。

4. 常用的单向散列函数

4.1. MD4、MD5

MD4是由Rivest于1990年设计的单向散列函数,能够产生128比特的散列值(RFC1186,修订版RFC1320)。不 过,随着Dobbertin提出寻找MD4散列碰撞的方法,因此现在它已经不安全了。

MD5是由Rwest于1991年设计的单项散列函数,能够产生128比特的散列值(RFC1321)。

MD5的强抗碰撞性已经被攻破,也就是说,现在已经能够产生具备相同散列值的两条不同的消息,因此它也已
经不安全了。

MD4和MD5中的MD是消息摘要(Message Digest)的缩写。

4.1.1 Go中使用MD5
func GetMD5ToHexStr(src []byte) string {
    result := md5.Sum(src)
    return hex.EncodeToString(result[:])
}

4.2. SHA-1、SHA-224、SHA-256、SHA-384、SHA-512

SHA-1是由NIST(NationalInstituteOfStandardsandTechnology,美国国家标准技术研究所)设计的一种能够产生 160比特的散列值的单向散列函数。1993年被作为美国联邦信息处理标准规格(FIPS PUB 180)发布的是 SHA,1995年发布的修订版FIPS PUB 180-1称为SHA-1。

SHA-1的消息长度存在上限,但这个值接近于2^64比特,是个非常巨大的数值,因此在实际应用中没有问题。

SHA-256、SHA-384和SHA-512都是由NIST设计的单向散列函数,它们的散列值长度分别为256比特、384比特和
512比特。这些单向散列函数合起来统称SHA-2,它们的消息长度也存在上限(SHA-256的上限接近于 2^64 比特,
SHA-384 和 SHA-512的上限接近于 2^128 比特)。这些单向散列函数是于2002年和 SHA-1 一起作为 FIPS PUB 180-2 发布的 SHA-1 的强抗碰撞性已于2005年被攻破, 也就是说,现在已经能够产生具备相同散列值的两条不同的消 息。不过,SHA-2还尚未被攻破。

4.2.1 Go中对SHA-1、SHA-2的使用
func GetHashFromBytes(src []byte, kHashType KHashType) (string, error) {
    result := []byte("")
    switch kHashType {
        case KHashTypeMd5:
            temp := md5.Sum(src)
            result = temp[:]
        case KHashTypeSha1:
            temp := sha1.Sum(src)
            result = temp[:]
        case KHashTypeSha256:
            temp := sha256.Sum256(src)
            result = temp[:]
        case KHashTypeSha512:
            temp := sha512.Sum512(src)
            result = temp[:]
    }
    if result == nil{
        return "", errors.New("ERROR:WRONG kHashType")
    }
    return hex.EncodeToString(result),nil
}

func GetHashFromFile(filename string, kHashType KHashType) (string, error) {
    // 打开文件
    file, err := os.Open(filename)
    if err != nil {
        return "", err
    }
    defer file.Close()

    hash := func() hash.Hash {
        switch kHashType {
        case KHashTypeMd5:
            return md5.New()
        case KHashTypeSha1:
            return sha1.New()
        case KHashTypeSha256:
            return sha256.New()
        case KHashTypeSha512:
            return sha512.New()
        default:
            return nil
        }
    }()

    if hash == nil {
        return "", errors.New("ERROR:WRONG kHashType")
    }

    // 将文件数据拷贝给哈希对象
    num, err := io.Copy(hash, file)
    if err != nil {
        return "", err
    }
    fmt.Println(num)

    return hex.EncodeToString(hash.Sum(nil)), nil

}

推荐阅读更多精彩内容