groupbyおよびsizeメソッドを使用してデータフレームを表にします

debugcn 投稿 Dev

horcle_buzz

私は、パンダのデータフレームを持ってout、私は列で上の数を計算し、午前いること、cityおよびraingarden以下のシリーズを使用しました：

out.groupby(['city','raingarden']).size() 出力付き

city raingarden 55405 True 3 Edina True 7 MInneapolis True 8 Minneapolis False 2482 True 847 Minneapolis False 2 True 1 Minneapolis, True 1 Minneapolis, False 2 Minneapolsi False 5 True 3 Minnepolis False 4 Minnespolis False 4 Minnetonka False 1 True 2 Minnneapolis False 5 Mpla True 3 Mpls False 22 True 20 Mpls. False 8 True 17 NE Mpls True 6 Richfield True 1 SLP True 3 St Louis Park True 2 St. Louis Park False 1 Victoria False 1 Wayzata False 2 True 1 minneapolis False 3 mpls True 2 dtype: int64

これをtabulateテーブルに出力したい。

これを行うために、私は次のことを行いました。

headers = ['city','has rain garden', 'n']
print tabulate(out.groupby(['city','raingarden']).size().to_frame(), headers, tablefmt="simple")

問題1：カウントの列名を取得する必要がありますが、運がありません。

問題2（おそらく問題1に関連しています）、出力は次のようになります。

city                          has rain garden
--------------------------  -----------------
(u'55405', True)                            3
(u'Edina', True)                            7
(u'MInneapolis', True)                      8
(u'Minneapolis', False)                  2482
(u'Minneapolis', True)                    847
(u'Minneapolis ', False)                    2
(u'Minneapolis ', True)                     1
(u'Minneapolis,', True)                     1
(u'Minneapolis, ', False)                   2
(u'Minneapolsi', False)                     5
(u'Minneapolsi', True)                      3
(u'Minnepolis', False)                      4
(u'Minnespolis', False)                     4
(u'Minnetonka', False)                      1
(u'Minnetonka', True)                       2
(u'Minnneapolis', False)                    5
(u'Mpla', True)                             3
(u'Mpls', False)                           22
(u'Mpls', True)                            20
(u'Mpls.', False)                           8
(u'Mpls.', True)                           17
(u'NE Mpls', True)                          6
(u'Richfield', True)                        1
(u'SLP', True)                              3
(u'St Louis Park', True)                    2
(u'St. Louis Park', False)                  1
(u'Victoria', False)                        1
(u'Wayzata', False)                         2
(u'Wayzata', True)                          1
(u'minneapolis', False)                     3
(u'mpls', True)                             2

最初の2列はタプルとして指定されていますか？したがって、これらを別々の列に分割するにはどうすればよいですか？また、カウントのラベルを追加するにはどうすればよいですか？私が達成しようとしていることは、私が試みたよりもはるかに単純なはずだと確信しています。

グスタボベゼラ

2つの列を模索することで、マルチレベルのインデックスを作成してSeriesいることになりますが、これはあなたが望んでいるものではないと私は信じています。元のデータがどのように見えるかはわかりませんが（out.head()質問で提供するとよいでしょう）、あなたが探しているのは次のとおりです。

out.groupby('city').sum()['raingarden']

ランダムに生成されたデータの例を次に示します。

import random
import string
import pandas as pd
import numpy as np

city = random.sample(string.lowercase*500,100)
raingarden = np.random.randint(0,10,100)

out = pd.DataFrame({'city':city, 'raingarden':raingarden})

出力：

In [30]: out.groupby('city').sum()['raingarden']
Out[30]:
city
a    17
b     7
c    16
d     8
e    24
f    28
g    16
h    49
i    29
j    24
k     4
l     5
m    17
n    29
p    22
q    14
r    19
s     6
t    21
u     8
v    18
w    25
x    11
y     9
z    40
Name: raingarden, dtype: int64

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-07-8

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

groupbyおよびsizeメソッドを使用してデータフレームを表にします

groupbyおよびsizeメソッドを使用してデータフレームを表にします

'groupby'メソッドを使用した後にデータフレームのすべての列を取得する

'groupby'および 'cut'メソッドを使用してパンダデータフレームの連続分布を使用して列値の範囲でグループ化する方法は？

Spark Scalaは、メソッド呼び出しを介してデータフレームを更新します

ASP.NETMVCイメージエンティティフレームワークを使用してデータベースにレコードをアップロードおよび作成します

2つのデータフレーム（R）を使用して値を一致および置換します

if / else理解を使用して、Pandasデータフレームの行を加算および減算しますか？

データフレームの各行を入力として渡すscalaメソッドを呼び出す

データ型およびカスタムメソッドとして「struct」を使用してPython配列を作成する方法

System.Security.Cryptography.RSACngを使用して、データスレッドセーフに署名および検証していますか？

applyメソッドを使用して、PythonPandasデータフレーム列のタプルのリストをリストの辞書に変換します

クラスメソッドを介してグローバルデータフレームを更新します

plmデータフレームにラグ、リード、および差分変数を作成します

pysparkデータフレームを動的にフィルタリングするメソッド呼び出しを作成します

2つのデータフレームを使用して予測を計算およびプロットし、データフレームに平均を格納します

pandasデータフレームでgroupbyおよびsumした後に列の名前を変更する

Visual Studio の Fakes フレームワークを使用して非同期メソッドをどのようにスタブしますか?

Python-データフレーム列の文字列でnumpyメソッドを呼び出しますか？

Rの条件に従って、データフレームの値を乗算および置換します。

欠落している例| スレッドを使用してデータをプリフェッチおよび前処理します

Python-.iterrows（）以外のメソッドを使用してデータフレームをループする

テレグラムコアAPIのgetFileメソッドにオフセットおよび制限パラメーターとして何を渡す必要がありますか？

テレグラムコアAPIのgetFileメソッドにオフセットおよび制限パラメーターとして何を渡す必要がありますか？

値として存在/不在呼び出しを使用してRデータフレームをワイドフォーマットに変換します

Umbraco MemberService GetAllメソッドを使用して、データをAngularjs呼び出しに返します

カートおよびチェックアウトにWooCommerceカスタム製品フィールドのメタデータを表示します

tidyverseおよびjsonlite-ネストされたJSONティッカーフィードを1行のデータフレームに変換します

Ajaxを使用してコントローラーメソッドにフォームデータを投稿する

Ajaxを使用してフォームデータをコントローラーメソッドに渡す

整数および文字変数を使用してデータ フレームに FUN を行ごとに適用します

整数および文字変数を使用してデータフレームに FUN を行ごとに適用します