我在一个数据框中有调查数据。我可以使用print(list(survey_data.columns.values))获取标题(这里没有列出所有27列,但这里是示例)
[“年龄”,“性别”,“国家”,“家庭历史”]
我可以使用以下方法在for循环中获取每一列的唯一值,如下所示:
对于survey_data中的col:
print(survey_data[col].unique())
[37 44 32 31 33 35 39 42 23 29 36 27 46 41 34 30 40 38 50 24 28 26 22 19 25 45 21 43 56 60 54 55 48 20 57 58 47 62 51 49 53 61]
我想打印列标题和唯一值,如下所示
所需的输出:
年龄= [37 44 32 31 33 35 39 42 23 29 36 27 46 41 34 30 40 38 50 24 28 26 22 19 25 45 21 43 56 60 54 55 48 20 57 58 47 62 51 49 53 61]
性别= ['F''M''T']
国家= ['美国''加拿大''英国''保加利亚''法国''葡萄牙''瑞士''波兰''澳大利亚''德国''墨西哥''巴西''斯洛文尼亚''哥斯达黎加''奥地利''爱尔兰''印度''南非''俄罗斯''意大利''荷兰''瑞典''哥伦比亚''拉脱维亚''罗马尼亚''比利时''新西兰''西班牙''芬兰''乌拉圭''以色列''波斯尼亚和黑塞哥维那''匈牙利''新加坡''日本'尼日利亚''克罗地亚''挪威''泰国''丹麦''希腊''摩尔多瓦''乔治亚''中国''捷克共和国的“菲律宾人”]
我以为下面的陈述会让我到那里。
在survey_data [col] .unique()中打印(列表(survey_data.columns.values)为col
相反,我得到<发电机对象位于0x0000031EF53F3C80>
有很多方法可以在所有列中显示唯一值。请看下面,可以使用:
for col in survey_data.columns:
print(survey_data[col].unique().tolist())
要么
for col in survey_data.columns:
print(col, survey_data[col].unique().tolist())
要么
for col in survey_data.columns:
for unique_val in survey_data[col].unique():
print(col, unique_val)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句