熊猫:数据透视表

恶魔

我有df:

ID,url,used_at,active_seconds,domain,search_engine,diff_time,period,code, category
08cd0141663315ce71e0121e3cd8d91f,market.yandex.ru/product/12858630?hid=91491&track=fr_same,2016-03-20 23:19:49,6,yandex.ru,None,78.0,515,100.0, Search system
08cd0141663315ce71e0121e3cd8d91f,market.yandex.ru/product/12858630?hid=91491&track=fr_same,2016-03-20 23:20:01,26,yandex.ru,None,6.0,515,100.0, Social network
08cd0141663315ce71e0121e3cd8d91f,market.yandex.ru/catalog/54726/list?hid=91491&track=pieces&gfilter=1801946%3A1871375&exc=1&regprice=9&how=dpop,2016-03-20 23:20:33,14,yandex.ru,None,6.0,515,100.0, Social network
08cd0141663315ce71e0121e3cd8d91f,market.yandex.ru/product/12858630/offers?hid=91491&grhow=shop,2016-03-20 23:20:47,2,yandex.ru,None,14.0,515,100.0, Internet shop
08cd0141663315ce71e0121e3cd8d91f,market.yandex.ru/product/12858630/offers?hid=91491&grhow=shop,2016-03-20 23:24:05,8,yandex.ru,None,196.0,515,100.0, Internet shop
08cd0141663315ce71e0121e3cd8d91f,market.yandex.ru/catalogmodels.xml?hid=91491&CAT_ID=160043&nid=54726&track=pieces,2016-03-20 23:24:13,32,yandex.ru,None,8.0,515,100.0, Search system
08cd0141663315ce71e0121e3cd8d91f,market.yandex.ru/catalog/54726/list?hid=91491&track=fr_cm_shwall&exc=1&how=dpop,2016-03-20 23:24:45,16,yandex.ru,None,32.0,515,100.0, Internet shop
08cd0141663315ce71e0121e3cd8d91f,market.yandex.ru/catalogmodels.xml?hid=91491&CAT_ID=160043&nid=54726&track=pieces,2016-03-20 23:25:01,4,yandex.ru,None,16.0,515,100.0, Search system
08cd0141663315ce71e0121e3cd8d91f,market.yandex.ru/catalog/54726/list?hid=91491&track=fr_cm_pop&exc=1&how=dpop,2016-03-20 23:25:05,10,yandex.ru,None,4.0,515,100.0, Social network
08cd0141663315ce71e0121e3cd8d91f,market.yandex.ru/product/11153512?hid=91491&track=fr_same,2016-03-21 06:52:44,2,yandex.ru,None,14.0,516,100.0, Internet shop
08cd0141663315ce71e0121e3cd8d91f,market.yandex.ru/catalog/54726/list?hid=91491&track=pieces&gfilter=1801946%3A1871375&exc=1&regprice=9&how=dpop,2016-04-04 21:08:41,24,yandex.ru,None,20.0,562,100.0, Internet shop
0bc0898d3fe2e46158621c674effb458,market.yandex.ru/product/12259780?hid=91491&show-uid=56508001849064882783001,2016-02-26 20:34:20,28,yandex.ru,yandex,10.0,1217,100.0, Social network
0bc0898d3fe2e46158621c674effb458,market.yandex.ru/product/12259780?hid=91491&show-uid=56508001849064882783001,2016-02-26 20:34:50,1,yandex.ru,None,2.0,1217,100.0, Internet shop

我需要建造pivot_table我用

table = pd.pivot_table(df, values='domain', index=['ID'], columns=['category'], aggfunc=np.sum)

但是问题在于它串联在一起domain,但是我想计算唯一域的数量。我怎样才能做到这一点?

耶斯列尔

看起来像需要:

table = pd.pivot_table(df, values='domain', 
                           index=['ID'], 
                           columns=['category'], 
                           aggfunc=lambda x: x.nunique())
print (table)

category                           Internet shop   Search system  \
ID                                                                 
08cd0141663315ce71e0121e3cd8d91f             1.0             1.0   
0bc0898d3fe2e46158621c674effb458             1.0             NaN   

category                           Social network  
ID                                                 
08cd0141663315ce71e0121e3cd8d91f              1.0  
0bc0898d3fe2e46158621c674effb458              1.0 

另一个更快的解决方案:

print (df.groupby(['ID','category'])['domain'].nunique().unstack())
category                           Internet shop   Search system  \
ID                                                                 
08cd0141663315ce71e0121e3cd8d91f             1.0             1.0   
0bc0898d3fe2e46158621c674effb458             1.0             NaN   

category                           Social network  
ID                                                 
08cd0141663315ce71e0121e3cd8d91f              1.0  
0bc0898d3fe2e46158621c674effb458              1.0  

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

熊猫数据透视表

来自分类Dev

熊猫数据透视表

来自分类Dev

重塑熊猫的数据透视表

来自分类Dev

熊猫数据框上的数据透视表操作

来自分类Dev

着色数据透视表熊猫数据框

来自分类Dev

熊猫转换数据框数据透视表

来自分类Dev

熊猫数据透视表排列不聚合

来自分类Dev

熊猫; 棘手的数据透视表

来自分类Dev

熊猫数据透视表嵌套排序

来自分类Dev

Python熊猫模仿Excel数据透视表

来自分类Dev

熊猫按值过滤数据透视表

来自分类Dev

转置熊猫数据透视表

来自分类Dev

熊猫计数中的数据透视表聚合()

来自分类Dev

格式化熊猫数据透视表

来自分类Dev

熊猫合并多个数据透视表

来自分类Dev

熊猫groupby和数据透视表绘图

来自分类Dev

筛选出熊猫数据透视表行

来自分类Dev

熊猫; 棘手的数据透视表

来自分类Dev

熊猫数据透视表最大值

来自分类Dev

熊猫数据透视表降序python

来自分类Dev

MultiIndex数据透视表熊猫python

来自分类Dev

熊猫计数中的数据透视表聚合()

来自分类Dev

如何重新索引熊猫数据透视表

来自分类Dev

熊猫数据框数据透视表和分组

来自分类Dev

计数在熊猫数据框的数据透视表中

来自分类Dev

熊猫:将数据透视表打印到数据框

来自分类Dev

使用数据透视表的列上的熊猫数据框总计

来自分类Dev

用数据透视表重塑熊猫中的数据框

来自分类Dev

熊猫,避免数据透视表中的层次结构