假设我要构建以下数据透视表:
// count by age
age male female
1-25 18 23
26-100 19 10
为此,我可以进行如下基本聚合:
SELECT age, gender, count(*) GROUP BY age, gender
并得到如下结果:
gender age count
male 1-25 18
male 26-100 19
male 1-25 23
male 26-100 10
然后我可以在 BigQuery/SQL 之外“构建结果”(例如在 javascript 甚至 Pandas 中)以获得旋转结果。
但是,当这些值不能简单地“相加”或以某种直接的方式计算时,我遇到了麻烦。例如:
// distinct users by country
country male female
us 192,293 64,000
jp 1,203,203 1,000,000
有没有办法在 BigQuery 中获取一个值,以便我们可以在 BigQuery 之外进行这个计算?我已经在这里发布了一个前面的问题,其中似乎您不能使用HLL_COUNT
,因为它在. [或者是否有其他类型的算法可用于构建某种可以在 SQL 之外合并的独特草图?]。
或者是否有另一种方法来构建我缺少的数据透视结果(在 BigQuery 之外)?
更新:以上示例更多地是为了概述问题。实际的数据透视查询将是这样的:在 X 和 Y 轴上获取 BQ 公共数据集中的顶级专利国家、代码。
我不明白。为什么不这样做里面的BigQuery?
SELECT age,
COUNTIF( gender = 'male' ) as males,
COUNTIF( gender = 'female' ) as females
GROUP BY age;
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句