CityHash算法冲突率测试

CityHash介绍

Google 2010年开始开发并开源的字符串哈希算法,主要包含CityHash32()、CityHash64()和CityHash128(),分别对应32位、64位、128位哈希算法。

测试样本数据

16630591行不重复字符串,每一行内容为以制表符分隔的下载地址和引用页。

cityhash64测试结果

没有冲突

cityhash32测试结果

共32246次冲突,冲突率约为千分之二。同一哈希值上55次冲突二次,32136次冲突一次。