既存の列に基づいてデータフレーム内の新しい累積列を計算する

debugcn 投稿 Dev

lucaskr

予測を評価するために使用したいデータセットがあります。データセットは次のようになります。

tibble(article=rep(21,5), estimated_sales=rep(50, 5), week=c(38,39,40,41,42), stock=c(500, 400, 375, 400, 350), purchase=c(0,0,0,50,0))

# A tibble: 5 x 5
  article estimated_sales  week stock purchase
    <dbl>           <dbl> <dbl> <dbl>    <dbl>
1      21              50    38   500        0
2      21              50    39   400        0
3      21              50    40   375        0
4      21              50    41   400       50
5      21              50    42   350        0

最後に、real_sales次のように計算された新しい変数を含むデータセットが必要です（たとえば、40週目）：375（40週目の在庫）-400（41週目の在庫）+ 50（41週目の購入）= 25、これは、real_sales40週目の変数の観測値です。

望ましい結果データセットは次のようになります。

# A tibble: 5 x 6
  Article estimated_sales  week stock purchase rea_sales
    <dbl>           <dbl> <dbl> <dbl>    <dbl>     <dbl>
1      21              50    38   500        0       100
2      21              50    39   400        0        25
3      21              50    40   375        0        25
4      21              50    41   400       50       100
5      21              50    42   300        0        NA

ロナックシャー

これは、次を使用して実現できますlead。

library(dplyr)
df %>% mutate(real_sales = stock - lead(stock) + lead(purchase))

#  article estimated_sales  week stock purchase real_sales
#    <dbl>           <dbl> <dbl> <dbl>    <dbl>      <dbl>
#1      21              50    38   500        0        100
#2      21              50    39   400        0         25
#3      21              50    40   375        0         25
#4      21              50    41   400       50         50
#5      21              50    42   350        0         NA

とshiftでdata.table：

library(data.table)
setDT(df)[, real_sales := stock - shift(stock, type = 'lead') + 
                          shift(purchase, type = 'lead')]

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-13

コメントを追加

サインイン

分類Dev

既存の列に基づいてデータフレームに新しい累積列を作成する

分類Dev

既存の列に基づいてデータフレームの新しい列を計算する

分類Dev

データフレーム内の既存の時間列に基づいて新しい列を作成します

分類Dev

既存の列の値に基づいてpandasデータフレームに新しい列を追加する

分類Dev

既存の行と列に基づいて、rデータフレームrの新しい行を計算します

分類Dev

pythonpandasデータフレーム内の他の列の値に基づいて新しい列を計算します

分類Dev

既存の列の条件に基づいて、データフレームに新しい列を作成します

分類Dev

R：円内の点を特定し、2つのデータフレームに基づいて新しい列を計算します

分類Dev

他の列の値に基づいてデータフレームの値の合計を計算する

分類Dev

他の2つの列データフレームに基づいて列の値を計算します

分類Dev

別の列の2つの行に基づいてデータフレーム列を計算する

分類Dev

別のデータフレームに基づいてデータフレーム内の列の値を計算する

分類Dev

Python：データフレーム内の既存の列に基づいて日付を含む新しい列を追加します

分類Dev

Rの既存の列のループに基づいてデータフレームの新しい変数を計算するにはどうすればよいですか？

分類Dev

列情報に基づいてデータフレームの統計を計算する

分類Dev

データフレーム内の別の列の条件に基づいて列を合計する

分類Dev

既存のデータフレーム行に基づいて新しいデータフレームの列が作成されるように、既存のデータフレームからSparkデータフレームを作成します

分類Dev

rの列の累積値に基づいてデータを分割する

分類Dev

別々の列の場所に基づいてデータフレームの平均を計算する

分類Dev

R-既存の列と一致する値のインデックスに基づいて新しい列データフレームを作成します

分類Dev

Pandasデータフレーム-複数の条件計算に基づいて複数の列を作成します

分類Dev

pandasデータフレームのラベルに基づいて列の平均を計算します

分類Dev

他の列の値に基づいてデータフレームに新しい列を追加する

分類Dev

複数の列の値に基づいてデータフレームに新しい列を追加する

分類Dev

列の値に基づいて既存のデータフレームに新しい行を追加するにはどうすればよいですか？

分類Dev

データフレームの2つの列に基づいて新しい列を作成する

分類Dev

データフレームの他の列に基づいて新しい pandas 列を作成する方法は?

分類Dev

以前のデータフレームから計算された統計に基づいて新しいデータフレームを作成する

分類Dev

空白行の列に基づいてデータフレームに新しい列を追加する

Related 関連記事

記事

既存の列に基づいてデータフレーム内の新しい累積列を計算する

既存の列に基づいてデータフレーム内の新しい累積列を計算する

既存の列に基づいてデータフレームに新しい累積列を作成する

既存の列に基づいてデータフレームの新しい列を計算する

データフレーム内の既存の時間列に基づいて新しい列を作成します

既存の列の値に基づいてpandasデータフレームに新しい列を追加する

既存の行と列に基づいて、rデータフレームrの新しい行を計算します

pythonpandasデータフレーム内の他の列の値に基づいて新しい列を計算します

既存の列の条件に基づいて、データフレームに新しい列を作成します

R：円内の点を特定し、2つのデータフレームに基づいて新しい列を計算します

他の列の値に基づいてデータフレームの値の合計を計算する

他の2つの列データフレームに基づいて列の値を計算します

別の列の2つの行に基づいてデータフレーム列を計算する

別のデータフレームに基づいてデータフレーム内の列の値を計算する

Python：データフレーム内の既存の列に基づいて日付を含む新しい列を追加します

Rの既存の列のループに基づいてデータフレームの新しい変数を計算するにはどうすればよいですか？

列情報に基づいてデータフレームの統計を計算する

データフレーム内の別の列の条件に基づいて列を合計する

既存のデータフレーム行に基づいて新しいデータフレームの列が作成されるように、既存のデータフレームからSparkデータフレームを作成します

rの列の累積値に基づいてデータを分割する

別々の列の場所に基づいてデータフレームの平均を計算する

R-既存の列と一致する値のインデックスに基づいて新しい列データフレームを作成します

Pandasデータフレーム-複数の条件計算に基づいて複数の列を作成します

pandasデータフレームのラベルに基づいて列の平均を計算します

他の列の値に基づいてデータフレームに新しい列を追加する

複数の列の値に基づいてデータフレームに新しい列を追加する

列の値に基づいて既存のデータフレームに新しい行を追加するにはどうすればよいですか？

データフレームの2つの列に基づいて新しい列を作成する

データ フレームの他の列に基づいて新しい pandas 列を作成する方法は?

以前のデータフレームから計算された統計に基づいて新しいデータフレームを作成する

空白行の列に基づいてデータフレームに新しい列を追加する

データフレームの他の列に基づいて新しい pandas 列を作成する方法は?