Pythonは新しいデータフレームのグループ化と列の要約を作成します

エステバン

各訪問数をユーザー ID ごとに要約する新しいテーブルを作成する以下の SQL クエリがあります。このデータフレームをPythonで作成するにはどうすればよいですか?

create table User_Visits_summary as
select user_id,
sum(case when visit_type = 1 then 1 else 0 end) as Type_One_Counts,
sum(case when visit_type = 2 then 1 else 0 end) as Type_Two_Counts,
sum(case when visit_type = 3 then 1 else 0 end) as Type_Three_Counts,
count(*) as Total_Visits
from user_visits
group by user_id
ジュベリオ

以下のコードは、SQL クエリと同じテーブルを作成する必要があります。コード内のコメントを読み、デバッグ モードで実行して、コードの各行の機能をよりよく理解してください。Pandas の機能に関する便利なガイドについては、このチートシートをチェックしてください-

https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf

import pandas as pd

# example dataset
user_visits = pd.DataFrame({'user_id'   :['A','A','A','A','A','B','B','B','B'],
                            'visit_type':[  1,  1,  3,  3,  3,  2,  2,  2,  2] })

# This summary table already contains the data you want, but on 'long column' format
User_Visits_summary = user_visits.groupby(['user_id','visit_type']).size().reset_index()

# Here we pivot the table to get to your desired format
User_Visits_summary = User_Visits_summary.pivot(index='user_id',columns='visit_type', values=0)

# Calculate total from sub-totals in new column
User_Visits_summary['Total_Visits'] = User_Visits_summary.sum(axis=1)    

# Some formatting
User_Visits_summary.reset_index(inplace=True)
User_Visits_summary.rename(columns={1:'Type_One_Counts',
                                    2:'Type_Two_Counts',
                                    3:'Type_Three_Counts'}, inplace=True)

# Table ready
print(User_Visits_summary)
# ...too wide to paste...

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

パンダのある列にグループ化してデータフレームを要約します

分類Dev

1つの列と新しい列でグループ化された新しいデータフレームを作成します

分類Dev

操作と新しい列の作成を伴うデータフレームの複雑なグループ化

分類Dev

Pythonデータフレームを列ごとにグループ化し、パーセンテージで新しい列を作成します

分類Dev

Pythonでデータフレームをグループ化し、連続する番号のサブグループに要約する方法は?

分類Dev

データフレームを要約し、新しい列を追加します

分類Dev

R-データフレーム内のデータを2列でグループ化し、新しいデータフレームに再配置します

分類Dev

グループ化して、PySparkデータフレームに新しい列を作成します

分類Dev

python pandasデータフレームは、他の列のセルから新しい列を作成します

分類Dev

IDでグループ化しながら、他の列の値に基づいて新しいデータフレームを作成します

分類Dev

pandasデータフレームで単一の列をグループ化して新しい列を作成します

分類Dev

パンダは値でグループ化し、新しいデータフレームを作成しますか?

分類Dev

2つの列の合計をグループ化し、パンダで新しいデータフレームを作成します

分類Dev

Rの元のデータフレームのグループごとの平均の新しい列を作成します

分類Dev

データ フレームの列を日付 (列のタイトルを構成する) でグループ化し、R の 1 と 0 のインスタンスを要約します。

分類Dev

データフレームを週ごとにグループ化し、1週間以内の最小日と最大日を新しい列に取得します

分類Dev

r別の列でグループ化された要素を行で一致させる新しいデータフレームを作成します

分類Dev

データフレームの2列ごとに新しいデータフレームを作成します

分類Dev

あるデータフレームの単一の列をループして別のデータフレームの列と比較し、パンダを使用して最初のデータフレームに新しい列を作成します

分類Dev

データフレームの列でグループ化しますが、それらのグループの一部を1つのグループに要約します

分類Dev

データフレームの列ごとにグループ化し、すべてのグループに個別のcsvを作成します

分類Dev

データフレームの列ごとにグループ化し、グループごとに個別のcsvを作成します

分類Dev

データフレームのリストで各データフレームをグループ化して要約する方法

分類Dev

Pythonのループを使用してデータフレームに新しい列を作成する方法

分類Dev

dplyrは、グループ化されたデータを別の列に要約します

分類Dev

データフレームの列を集約せずに、別のデータフレームに従ってグループ化します。

分類Dev

パンダの合計と平均をグループ化し、データフレームを作成します

分類Dev

for ループ内に pandas データフレームの新しい列を作成します

分類Dev

Pythonのループと、列の値ごとの新しいデータフレームの作成

Related 関連記事

  1. 1

    パンダのある列にグループ化してデータフレームを要約します

  2. 2

    1つの列と新しい列でグループ化された新しいデータフレームを作成します

  3. 3

    操作と新しい列の作成を伴うデータフレームの複雑なグループ化

  4. 4

    Pythonデータフレームを列ごとにグループ化し、パーセンテージで新しい列を作成します

  5. 5

    Pythonでデータフレームをグループ化し、連続する番号のサブグループに要約する方法は?

  6. 6

    データフレームを要約し、新しい列を追加します

  7. 7

    R-データフレーム内のデータを2列でグループ化し、新しいデータフレームに再配置します

  8. 8

    グループ化して、PySparkデータフレームに新しい列を作成します

  9. 9

    python pandasデータフレームは、他の列のセルから新しい列を作成します

  10. 10

    IDでグループ化しながら、他の列の値に基づいて新しいデータフレームを作成します

  11. 11

    pandasデータフレームで単一の列をグループ化して新しい列を作成します

  12. 12

    パンダは値でグループ化し、新しいデータフレームを作成しますか?

  13. 13

    2つの列の合計をグループ化し、パンダで新しいデータフレームを作成します

  14. 14

    Rの元のデータフレームのグループごとの平均の新しい列を作成します

  15. 15

    データ フレームの列を日付 (列のタイトルを構成する) でグループ化し、R の 1 と 0 のインスタンスを要約します。

  16. 16

    データフレームを週ごとにグループ化し、1週間以内の最小日と最大日を新しい列に取得します

  17. 17

    r別の列でグループ化された要素を行で一致させる新しいデータフレームを作成します

  18. 18

    データフレームの2列ごとに新しいデータフレームを作成します

  19. 19

    あるデータフレームの単一の列をループして別のデータフレームの列と比較し、パンダを使用して最初のデータフレームに新しい列を作成します

  20. 20

    データフレームの列でグループ化しますが、それらのグループの一部を1つのグループに要約します

  21. 21

    データフレームの列ごとにグループ化し、すべてのグループに個別のcsvを作成します

  22. 22

    データフレームの列ごとにグループ化し、グループごとに個別のcsvを作成します

  23. 23

    データフレームのリストで各データフレームをグループ化して要約する方法

  24. 24

    Pythonのループを使用してデータフレームに新しい列を作成する方法

  25. 25

    dplyrは、グループ化されたデータを別の列に要約します

  26. 26

    データフレームの列を集約せずに、別のデータフレームに従ってグループ化します。

  27. 27

    パンダの合計と平均をグループ化し、データフレームを作成します

  28. 28

    for ループ内に pandas データフレームの新しい列を作成します

  29. 29

    Pythonのループと、列の値ごとの新しいデータフレームの作成

ホットタグ

アーカイブ