Hive的内置HASH()函数使用哪种哈希算法

用户名

内置的HASH()函数使用哪种哈希算法?

我理想情况下是在寻找SHA512 / SHA256哈希,类似于SHA()函数在Pig的linkedin datafu UDF中提供的功能。

奈杰尔·图弗内尔

HASH函数(从Hive 0.11开始)使用类似于java.util.List#hashCode的算法

其代码如下所示:

int hashCode = 0; // Hive HASH uses 0 as the seed, List#hashCode uses 1. I don't know why.
for (Object item: items) {
   hashCode = hashCode * 31 + (item == null ? 0 : item.hashCode());
}

基本上,这是有效Java一书中推荐的经典哈希算法。引用一个伟人(和一本好书):

选择值31是因为它是奇数质数。如果是偶数并且乘法运算溢出,则信息将丢失,因为乘以2等于移位。使用质数的优势尚不清楚,但这是传统的。31的一个很好的属性是乘法可以用移位和减法来代替以获得更好的性能:31 * i ==(i << 5)-i。现代VM自动执行这种优化。

我离题了。您可以在这里查看HASH源代码

如果要在Hive中使用SHAxxx,则可以使用Apache DigestUtils类和Hive内置reflect函数(我希望这可以工作):

SELECT reflect('org.apache.commons.codec.digest.DigestUtils', 'sha256Hex', 'your_string')

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在Spring中使用哪种“ EventBus”?内置反应堆,Akka?

来自分类Dev

@Password公式正在使用哪种哈希算法?

来自分类Dev

python实际使用哪种GC算法?

来自分类Dev

QString的内置64位哈希函数?

来自分类Dev

TTTD分块算法中使用的哈希函数?

来自分类Dev

MongoDB对_id使用哪种算法

来自分类Dev

在变量上使用加密(哈希算法)

来自分类Dev

MongoDB使用什么算法来哈希ObjectId?

来自分类Dev

.NET中使用哪种货币舍入算法?

来自分类Dev

xargs仅使用内置函数

来自分类Dev

如何使用all()内置函数?

来自分类Dev

javascript关联数组使用哪种哈希函数/算法?

来自分类Dev

Windows 10使用哪种哈希算法存储密码?

来自分类Dev

该javascript函数是哪种类型的排序算法?

来自分类Dev

为什么哈希算法可以安全使用?

来自分类Dev

使用内置的crypt验证哈希密码与用户输入

来自分类Dev

laravel / fortify密码哈希中使用哪种方法?

来自分类Dev

如何使用内置的round()函数

来自分类Dev

qsort()使用哪种排序算法?

来自分类Dev

哪种PHP最好的密码哈希算法?

来自分类Dev

如何使用Hive内置函数“ test in(val1,val2)”?

来自分类Dev

内核使用哪种调度算法?

来自分类Dev

SSL使用哪种对称密钥算法?

来自分类Dev

Hive的内置HASH()函数使用哪种哈希算法

来自分类Dev

STL集使用哪种哈希函数?

来自分类Dev

为LSH Minhash算法生成随机哈希函数

来自分类Dev

DISM / SFC使用哪种哈希类型?

来自分类Dev

“加密主目录”使用哪种算法?

来自分类Dev

我应该使用哪种哈希算法检查文件的重复性

Related 相关文章

热门标签

归档