计算大熊猫DataFrame中带有NaN的行数？

debugcn 发表于 Dev

维塔塔

具有以下运行代码：

import datetime as dt
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

my_funds = [1, 2, 5, 7, 9, 11]
my_time = ['2020-01', '2019-12', '2019-11', '2019-10', '2019-09', '2019-08']
df = pd.DataFrame({'TIME': my_time, 'FUNDS':my_funds})

for x in range(2,3):
    df.insert(len(df.columns), f'x**{x}', df["FUNDS"]**x)

df = df.replace([1, 7, 9, 25],float('nan'))

print(df.isnull().values.ravel().sum())   #5 (obviously counting NaNs in total)
print(sum(map(any, df.isnull())))         #3 (I guess counting the NaNs in the left column)

我正在下面的数据帧。我想总的行数，1个或多个NaN的，这在我的情况下是4，就行- [0, 2, 3, 4]。

耶斯列尔

采用：

print (df.isna().any(axis=1).sum())
4

说明：首先通过DataFrame.isna以下方式比较缺失值：

print (df.isna())
    TIME  FUNDS   x**2
0  False   True   True
1  False  False  False
2  False  False   True
3  False   True  False
4  False   True  False
5  False  False  False

并测试至少每行是否True通过DataFrame.any：

print (df.isna().any(axis=1))
0     True
1    False
2     True
3     True
4     True
5    False
dtype: bool

最后的计数True是sum。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-2

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何计算大熊猫groupby中的所有正值和负值？

来自分类Dev

大熊猫联产NaN

来自分类Dev

查找大熊猫DataFrame值的索引

来自分类Dev

大熊猫中的布尔子集

来自分类Dev

计算大熊猫数据框的元组

来自分类Dev

高效转换大熊猫DataFrame

来自分类Dev

规范大熊猫中的长数据

来自分类Dev

与Matplotlib不同的大熊猫中的散点图

来自分类Dev

大熊猫如何计算指数？

来自分类Dev

透视大熊猫中的数据

来自分类Dev

大熊猫DataFrame中每个单词的频率

来自分类Dev

大熊猫，计算每组的价值？

来自分类Dev

计算日期的大熊猫列清单

来自分类Dev

计算大熊猫的条纹而不适用

来自分类Dev

将带有列的大熊猫DF列到文件中，如何将其读回？

来自分类Dev

大熊猫中的Concat 2列-AttributeError：'DataFrame'对象没有属性'concat'

来自分类Dev

大熊猫DataFrame中的条件操作

来自分类Dev

大熊猫的分组比和计算比率

来自分类Dev

从大熊猫DataFrame加载BigQuery表

来自分类Dev

带有大熊猫日期时间索引的列表理解

来自分类Dev

大熊猫：沿DataFrame识别“部分”

来自分类Dev

如何计算大熊猫groupby中的所有正值和负值？

来自分类Dev

大熊猫联产NaN

来自分类Dev

大熊猫：带有正则表达式的Dataframe.replace（）

来自分类Dev

访问带有大熊猫日期范围的字典

来自分类Dev

大熊猫如何计算指数？

来自分类Dev

存在NaN时，将INT转换为Float的大熊猫有什么解决方法？

来自分类Dev

以大熊猫分组，计算均值

来自分类Dev

大熊猫切片在列中带有冒号

Related 相关文章

文章