時間ごとのデータから毎日の最大値を見つける

モーセン

時間ごとのデータから毎日の最大値を取得するのに問題があります。元のファイルには、名前ごとに毎日24個のデータが含まれています(名前が多すぎます)。例として、ここに1つの名前の24のデータがあります。

Start Time  Period  name    value
2/23/2019 0:00  60  MBTS_H2145X 100
2/23/2019 1:00  60  MBTS_H2145X 100
2/23/2019 2:00  60  MBTS_H2145X 1
2/23/2019 3:00  60  MBTS_H2145X 1
2/23/2019 4:00  60  MBTS_H2145X 1
2/23/2019 5:00  60  MBTS_H2145X 2324
2/23/2019 6:00  60  MBTS_H2145X 2323
2/23/2019 7:00  60  MBTS_H2145X 2323
2/23/2019 8:00  60  MBTS_H2145X 2323
2/23/2019 9:00  60  MBTS_H2145X 2323
2/23/2019 10:00 60  MBTS_H2145X 2323
2/23/2019 11:00 60  MBTS_H2145X 2323
2/23/2019 12:00 60  MBTS_H2145X 1
2/23/2019 13:00 60  MBTS_H2145X 21
2/23/2019 14:00 60  MBTS_H2145X 21
2/23/2019 15:00 60  MBTS_H2145X 23
2/23/2019 16:00 60  MBTS_H2145X 350
2/23/2019 17:00 60  MBTS_H2145X 323
2/23/2019 18:00 60  MBTS_H2145X 23
2/23/2019 19:00 60  MBTS_H2145X 23
2/23/2019 20:00 60  MBTS_H2145X 2323
2/23/2019 21:00 60  MBTS_H2145X 23
2/23/2019 22:00 60  MBTS_H2145X 23
2/23/2019 23:00 60  MBTS_H2145X 2

私が得る結果は次のとおりです:(これは間違っており、2324になるはずです)

    Start Time  name    max value
0   2/23/2019   MBTS_H2145X 350

以下のコードがありますが、間違った結果が得られます

import dask.dataframe as dd
import numpy as np
import pandas as pd

filename='V.csv'
df = dd.read_csv(filename, dtype='str')


#_________changing date format 
df['Start Time'] = df['Start Time'].map(lambda x: pd.to_datetime(x, errors='coerce'))
#_________change to pure date without hour
df['Start Time'] = df['Start Time'].dt.date


grouped_df=(df.groupby(['Start Time','name']).agg({'value':'max'}).rename(columns={'value':'max value'}).reset_index())

grouped_df.to_csv('e1.csv')

print(grouped_df.head(12))

パルマンディープチャッダ

コードをまったく同じに保ちます。この行を次のように変更するだけです。

grouped_df=(df.groupby(['Start Time','name']).agg({'value':'max'}).rename(columns={'value':'max value'}).reset_index())

への変更:

df.value = pd.to_numeric(df.value)

grouped_df= (df.groupby(['Start Time','name'])['value'].max().rename(columns={'value':'max value'}).reset_index()

df = pd.merge(df, grouped_df, on  = ['Start Time','name'])

集計関数で何かが起こっている可能性があります。

または、DTYPEが文字列だけの場合は、pd.to_numeric行を追加し、他のすべてを同じに保ちます。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

時間ごとのデータの場合、毎日の最大値を取得する

分類Dev

Rの毎日の最大値と最小値から1時間ごとの気温をモデル化するためのループコード

分類Dev

データフレームから2つの日付/時刻列の時間差を見つける方法

分類Dev

SQLServerテーブルから1時間ごとまたは毎日1つのデータポイントを選択する

分類Dev

毎日の時系列から最小値と最大値を取得する

分類Dev

Javascript / Momentjs:一連の日付から最小時間と最大時間を見つけるエレガントな方法?

分類Dev

5時間間隔ごとの最小値を見つける

分類Dev

JavaScriptで1時間ごとの値を持つデータセットから1日の平均を計算する方法

分類Dev

データフレームの各列から最大値を見つける

分類Dev

パンダ-日時データフレームの毎日から最初と最後の値を取得する

分類Dev

O(logn)時間に追加の基準が与えられると、どのデータ構造が最大オブジェクトを見つけますか?

分類Dev

最大値を見つけるために連続する1時間ごとの観測を合計する

分類Dev

データテーブルの行で最小/最大日時を見つける

分類Dev

rのカテゴリごとにデータフレームで最大値を見つける

分類Dev

パネルデータの累積値の変化と最後の変化からの時間を見つける

分類Dev

時系列データセットの列の最大値を見つける

分類Dev

データフレームの日時列から日付の範囲を見つける方法は?

分類Dev

データフレーム間隔内の最大値を見つける

分類Dev

配列の配列から毎日の最初と最後のタイムスタンプを見つける

分類Dev

MATLAB:配列データの各間隔で最大値を見つけますか?

分類Dev

同じ列からデルタ値の最大値を見つけるSQL

分類Dev

2つのデータフレームから日時範囲の重複を効率的に見つける

分類Dev

日時を含むデータフレームを毎日の解像度から30分ごとの解像度に変更する方法

分類Dev

R:データフレームのサブセットの中から列の最大値を見つける

分類Dev

メートル法で日時値間の時間を見つける

分類Dev

パンダのデータフレーム内の値のグループごとにn個の最大値の合計を見つける方法は?

分類Dev

毎時から毎日のデータを取得します

分類Dev

Rの毎日のデータで数か月にわたるローリングsdを見つける方法

分類Dev

Rのdata.tableのグループごとの最大値のインデックスを見つける

Related 関連記事

  1. 1

    時間ごとのデータの場合、毎日の最大値を取得する

  2. 2

    Rの毎日の最大値と最小値から1時間ごとの気温をモデル化するためのループコード

  3. 3

    データフレームから2つの日付/時刻列の時間差を見つける方法

  4. 4

    SQLServerテーブルから1時間ごとまたは毎日1つのデータポイントを選択する

  5. 5

    毎日の時系列から最小値と最大値を取得する

  6. 6

    Javascript / Momentjs:一連の日付から最小時間と最大時間を見つけるエレガントな方法?

  7. 7

    5時間間隔ごとの最小値を見つける

  8. 8

    JavaScriptで1時間ごとの値を持つデータセットから1日の平均を計算する方法

  9. 9

    データフレームの各列から最大値を見つける

  10. 10

    パンダ-日時データフレームの毎日から最初と最後の値を取得する

  11. 11

    O(logn)時間に追加の基準が与えられると、どのデータ構造が最大オブジェクトを見つけますか?

  12. 12

    最大値を見つけるために連続する1時間ごとの観測を合計する

  13. 13

    データテーブルの行で最小/最大日時を見つける

  14. 14

    rのカテゴリごとにデータフレームで最大値を見つける

  15. 15

    パネルデータの累積値の変化と最後の変化からの時間を見つける

  16. 16

    時系列データセットの列の最大値を見つける

  17. 17

    データフレームの日時列から日付の範囲を見つける方法は?

  18. 18

    データフレーム間隔内の最大値を見つける

  19. 19

    配列の配列から毎日の最初と最後のタイムスタンプを見つける

  20. 20

    MATLAB:配列データの各間隔で最大値を見つけますか?

  21. 21

    同じ列からデルタ値の最大値を見つけるSQL

  22. 22

    2つのデータフレームから日時範囲の重複を効率的に見つける

  23. 23

    日時を含むデータフレームを毎日の解像度から30分ごとの解像度に変更する方法

  24. 24

    R:データフレームのサブセットの中から列の最大値を見つける

  25. 25

    メートル法で日時値間の時間を見つける

  26. 26

    パンダのデータフレーム内の値のグループごとにn個の最大値の合計を見つける方法は?

  27. 27

    毎時から毎日のデータを取得します

  28. 28

    Rの毎日のデータで数か月にわたるローリングsdを見つける方法

  29. 29

    Rのdata.tableのグループごとの最大値のインデックスを見つける

ホットタグ

アーカイブ