用于均匀拆分列值的子集数据框

用户3476463

我在“bus_rev”下面有数据框。我想对数据框进行子集化,以便我有偶数个记录,其中 good_reviews==True 和 good_reviews==False。谁能建议一种巧妙的方法来做到这一点?

Sample Data:

print(bus_rev[1:3])

                  user_id             business_id  stars_x  \
1  CxDOIDnH8gp9KXzpBHJYXw  XSiqtcVEsP6dLOL7ZA9OxA        4   
2  CxDOIDnH8gp9KXzpBHJYXw  v95ot_TNwTk1iJ5n56dR0g        3   

               address                                         attributes  \
1     522 Yonge Street  {u'BusinessParking': {u'garage': False, u'stre...   
2  1661 Denison Street  {u'BusinessParking': {u'garage': False, u'stre...   

                        categories     city  \
1   [Restaurants, Ramen, Japanese]  Toronto   
2  [Chinese, Seafood, Restaurants]  Markham   

                                               hours  is_open   latitude  \
1  {u'Monday': u'11:00-22:00', u'Tuesday': u'11:0...        1  43.663689   
2                                                 {}        0  43.834295   

   longitude                            name   neighborhood postal_code  \
1 -79.384200                     Kenzo Ramen  Downtown Core     M4Y 1X9   
2 -79.305282  Vince Seafood Restaurant & BBQ       Milliken     L3R 6E4   

   review_count  stars_y state good_reviews  
1            76      3.5    ON         True  
2            23      3.5    ON        False  


Code:

bus_rev['good_reviews'].value_counts()

Output:

False    482
True     168
Name: good_reviews, dtype: int64
捷豹

要创建具有相等值的 DataFrame,您可以使用:

bus_revs_false = bus_revs[bus_revs['good_reviews'] == False]
bus_revs_false = bus_revs_false.iloc(:168,:)
bus_revs_true = bus_revs[bus_revs['good_reviews'] == True]

bus_revs_new = bus_revs_true.append(bus_revs_false)

在这种情况下, bus_revs_new 将是您的新 DataFrame 具有相同数量的 Trues 和 Falses。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Julia:子集数据框

来自分类Dev

如何将对子集数据框的更改应用于源数据框

来自分类Dev

子集数据框:从原始df中获取先前值,但不在子集中

来自分类Dev

基于字段的子集数据框

来自分类Dev

子集数据框导致错误输出

来自分类Dev

基于列表对象的子集数据框

来自分类Dev

基于缩放交互的子集数据框

来自分类Dev

基于最小值的子集数据

来自分类Dev

MySQL拆分列值用于子查询?

来自分类Dev

拆分列并生成数据框

来自分类Dev

子集数据框,以便包含每一行的最大值和列名

来自分类Dev

数据框拆分列值,如何解决错误信息?

来自分类Dev

子集数据

来自分类Dev

循环内的线性模型(循环用于子集数据)

来自分类Dev

子集数据框时选择了未定义的列

来自分类Dev

在R中子集数据框-意外结果

来自分类Dev

子集数据框以在R中绘制iGraph

来自分类Dev

带有用户输入的子集数据框闪亮

来自分类Dev

按条件子集数据框中的索引提取列

来自分类Dev

使用日期/时间因子变量的子集数据框

来自分类Dev

使用 POSIXct 向量 R 的子集数据框

来自分类Dev

R中基于日期的子集数据框

来自分类Dev

基于部分字符串匹配的子集数据框

来自分类Dev

如何选择部分密集数据集的均匀分布子集?

来自分类Dev

有效地拆分熊猫数据框并将方法应用于子集

来自分类Dev

如何使用涉及两个因子变量的天和值的多个条件来子集数据框

来自分类Dev

使用两列值同时相等的子集数据框,以检查所有其他列是否为零

来自分类Dev

根据组的最大值子集数据帧

来自分类Dev

具有逻辑值矩阵的子集数据帧