パンダのグループサイズに基づいて行を選択できますか？または、SQLを使用する必要がありますか？

debugcn 投稿 Dev

MichM

パンダでは、を使用してグループ化を行うことができますdf.groupby('product_name').size()。しかし、「product_name」が一意である行、つまりgroupby.sizeが1に等しいレコードのみに関心がある場合、そのような行のみを表示するようにdfをフィルタリングするにはどうすればよいですか？つまり、データベースで属性が発生する回数に基づいて、パンダを使用してデータベースでフィルタリングを実行できますか？（SQLでそれを行うことができます。）

MichM

で動作するようにしましたrecords.groupby('product_name').filter(lambda x: len(x['url']) == 1)。単に使用するだけでlen(x)は機能しないことに注意してください。3つ以上の列を持つデータフレーム（おそらく実際のデータフレームのほとんど）では、xの列を指定する必要があります。グループ化する列を除く任意の列です。また、データフレームのインデックスが一意ではなかったため、このコードは最初は機能しませんでした。これがフィルタリングの機能に干渉する理由はわかりませんが、干渉しました。データフレームのインデックスを再作成した後、ようやく機能するようになりました。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-27

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

パンダのグループサイズに基づいて行を選択できますか？または、SQLを使用する必要がありますか？

パンダのグループサイズに基づいて行を選択できますか？または、SQLを使用する必要がありますか？

パンダのセルをタイプに基づいて置き換える方法はありますか？

コンテナをできるだけいっぱいにするアイテムを選択したい場合、それは何と呼ばれますか？また、どのアルゴリズムを使用する必要がありますか？

パンダの列のTrueまたはFalseに基づいてDataFrameから行を選択します

テーブルの行または列のサイズが1より大きい場合、アクションを使用できる必要があります

2行のテキストを5列で表示できるようにする必要があり、各列のテキストはすべて1つのドロップダウンに基づいて異なる必要がありますか？

パンダを使用して、他の条件に基づいて2つの異なる列から行全体で日付をグループ化する方法はありますか？

コードの配列で選択したオプションに基づいて国を動的に印刷する必要があります

ドロップダウン選択に基づいてdivをフィルタリングする - 簡単な方法はありますか?

チェックボックスの設定方法は、angualrjsを使用した条件に基づいて選択する必要がありますか？

スタイルに基づいて要素を選択できる信頼性の高いセレクターはありますか？

パンダの開始日に基づいて、グループごとにすべての条件が真であるかどうかを確認します

C ++ 11のテンプレート引数に基づいて配列サイズを選択しますか？

C ++ 11のテンプレート引数に基づいて配列サイズを選択しますか？

MySQLでは、サブ選択「where」ループに基づいてどのように選択できますか

パンダグループは、2つのグループに基づいて2つの値のみを選択し、残りを0に変換します。

配列に基づいてjsonオブジェクトで選択したプロパティのみを表示する方法はありますか？

jQuery検証プラグインの条件付きチェックで、入力に値があるかどうか、または選択したドロップダウンが選択されているかどうかを確認します

Googleマップの逆ジオコーディングは、都市や場所ごとにサイズの異なる配列を返します。どのアレイを選択するかをどのように推測する必要がありますか

ConstraintLayout要素に制約またはサイズプロパティを使用する必要がありますか？

（スライサーの選択に基づいて）powerpivotでアクティブな関係を動的に切り替える方法はありますか？

Snakemake、RNA-seq：分析されるサンプルの特性に基づいて、パイプラインの1つのサブパートまたは別のサブパートを実行するにはどうすればよいですか？

Enzymeのshallow（）を使用して、コンポーネントがレンダリングするHTML要素についてアサーションを作成できますか（また、そうする必要がありますか）？

プロファイリングは、選択したプラットフォームで実行する必要がありますか、それともすべてのプラットフォームで実行する必要がありますか？

パンダ：グループのサイズが平均よりも大きい場合は、行を削除します

countryCodeに基づいてローカライズされたDateFormatを取得する必要があります。しかし、米国はdd / MM / yyyyを返します

3つの列の基準に基づいて行の値を変更するパンダ/ Pythonのアプローチはありますか？

Python Matplotlibを使用して、グループ化された箱ひげ図にサンプルサイズを表示する良い方法はありますか？

jarファイルの隣にdbフォルダーが必要です。これにより、アプリケーションを実行できます。「javapackager」またはその他のツールを使用してフォルダーをバンドルするにはどうすればよいですか。

インセプションを再トレーニングするには、画像のサイズをどのくらいにする必要がありますか？