我有一个给定的数据框,如下例所示:
0 1 2 3 4 5 6 7 8
0 842517 M 20.57 17.77 132.9 1326 0.08474 0.07864 0.0869
1 84300903 M 19.69 21.25 130 1203 0.1096 0.1599 0.1974
2 84348301 M 11.42 20.38 77.58 386.1 0.1425 0.2839 0.2414
3 843786 M 12.45 15.7 82.57 477.1 0.1278 0.17 0.1578
4 844359 M 18.25 19.98 119.6 1040 0.09463 0.109 0.1127
我编写了一个函数,该函数应该根据特定列中的值和特定值的比较将数据集拆分为 2 个数据帧。例如,如果我有col_idx = 2
并且value=18.3
结果应该是:
df1 - 低于值:
0 1 2 3 4 5 6 7 8
2 84348301 M 11.42 20.38 77.58 386.1 0.1425 0.2839 0.2414
3 843786 M 12.45 15.7 82.57 477.1 0.1278 0.17 0.1578
4 844359 M 18.25 19.98 119.6 1040 0.09463 0.109 0.1127
df2 - 高于值:
0 1 2 3 4 5 6 7 8
0 842517 M 20.57 17.77 132.9 1326 0.08474 0.07864 0.0869
1 84300903 M 19.69 21.25 130 1203 0.1096 0.1599 0.1974
该函数应如下所示:
def split_dataset(data_set, col_idx, value):
below_df = ?
above_df = ?
return below_df, above_df
有人可以完成我的脚本吗?
below_df = data_set[data_set[col_idx] < value]
above_df = data_set[data_set[col_idx] > value] # you have to deal with data_set[col_idx] == value though
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句