rを使用したトレーニングおよびテストセットの関数とループ

debugcn 投稿 Dev

Stackoverflowuser

1937年から1966年までの複数の時系列と単一の時系列データの実行があり、すべての単一の時系列でループを実行し、トレーニングセット（最初の20セットと残りの10セットをテストセットとして使用）で単純なモデルを構築したいと考えています。テストセットを使用して、単純な平均モデルを予測します。ご協力いただければ幸いです。データ（約30の複数の時系列データがあり、ここでは最初の3つの時系列データを取得します）：

    Plot    Species Year    Count   Ppt Temp
A      BG  1937    81  33.90833333 14.13181818
A   BG  1938    45  48.18333333 15.14727273
A   BG  1939    96  39.95833333 14.92
A   BG  1940    44  48.36666667 14.27363636
A   BG  1941    24  57.975  14.02
A   BG  1942    8   59.55   13.65727273
A    BG  1943    28  38.3    14.28363636
…………………………………….
A BG 1966  30      33.5          12.366666

A  BD  1937    135 33.90833333 14.13181818
A   BD  1938    91  48.18333333 15.14727273
A   BD  1939    171 39.95833333 14.92
A   BD  1940    88  48.36666667 14.27363636
A   BD  1941    59  57.975  14.02
A   BD  1942    1   59.55   13.65727273
A   BD  1943    1   38.3    14.28363636
……………………………………………………..
A BD   1966   36     28         15.23658

B   BG  1937    34  33.90833333 14.13181818
B   BG  1938    16  48.18333333 15.14727273
B   BG  1939    19  39.95833333 14.92
B   BG  1940    35  48.36666667 14.27363636
B  BG  1941    32  57.975  14.02
B   BG  1942    7   59.55   13.65727273
B  BG  1943    2   38.3    14.28363636
------------------------------------
B BG 1966  4 25   12.259

私のコードは：

    data$groups <- paste(data$Plot, data$Species, sep = "_")
data_by_plot <- split (data$Count, data$groups)
ly <- lapply(data_by_plot, function(df)){
D<-nrow(df)
Training<-D[1:20,]
Testing<-D[20:30,]
Mean_model<-lm(count~1, data = Training)
Prediction<-Testing$Count[i]- Mean_model$coefficients
)}

ロナックシャー

あなたDはたった1つの数字からサブセット化しています。おそらくあなたはやろうとしていました：

ly <- lapply(data_by_plot, function(df) {
  Training<-df[1:20,]
  Testing<-df[20:30,]
  Mean_model<-lm(count~1, data = Training)
  Prediction<-Testing$Count[i]- Mean_model$coefficients
  return(Prediction)
})

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-10

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

rを使用したトレーニングおよびテストセットの関数とループ

rを使用したトレーニングおよびテストセットの関数とループ

JPGおよびXMLファイルのデータセットをトレーニングセットとテストセットに分割します

キャレットを使用したトレーニングおよびテストデータの前処理

データセットを分割して、グループの尊重をテストおよびトレーニングする方法

テストおよびトレーニングデータセットで時間ベースの分割を使用してデータを分割する

関数returnObservableおよび非同期パイプを使用したテンプレートバインディング

Rのキャレットを使用してデータをランダムにトレーニングおよびテストする100回分割

LEAST（）を使用したMysqlおよびPHPステートメントのIF関数

同じPCAを適用してセットをトレーニングおよびテストする方法

Android-androidTestおよびtestフォルダー内のインストルメントされたテストおよびユニットテストクラスにプログラムでアクセスすることは可能ですか？

ニューラルネットワークをトレーニングするための損失関数としてステップ関数を使用できますか？

ネストされたループといくつかのnumpy関数呼び出しを使用したマルチプロセッシング

ネストされたテーブル、列内のサブグループの合計、頻度、およびr「テーブル」パッケージを使用したパーセンテージ

スプレッドシートセルで複数のELSEIFおよびELSEとともにIFを使用する

RまたはPythonでIfElseステートメントを使用して、グループ、ブレーク、および条件を作成します

キャレットを使用してトレーニングおよびテストデータを作成するときに値が欠落している

複数のスレッドでテンプレートタイプをスロットおよびシグナルパラメータとして使用するにはどうすればよいですか？

GitHubアクション（およびGitHubパッケージレジストリ）を使用したビルドおよび公開プロセスの自動化

さまざまな損失関数を使用したTensorFlowカスタムトレーニングステップ

トレーニングデータセットとテストデータセットのグループ間で同じ比率を維持します

MLのトレーニングセットとテストセットを設定するためのRでのsample（）関数の使用に関する明確さ。

テンプレート引数として関数を使用したC ++関数呼び出しラッパー

c ++テンプレートを使用した偽の「関数を含むことによる自動ストレージでのローカル変数の使用」？

関数「GridSearchCV」がトレーニングセットとテストセットをどのように分割するかは明確ではありません

グループ化およびRを使用したパーセンテージでの発生頻度のカウント

forループおよびクロスデータセットサブセットの代替。（..高階関数または代替データ構造を使用）

Java構成を使用したSpringルートおよびサーブレットコンテキスト

スライディングウィンドウを備えた多層パーセプトロンとは何ですか？また、どのようにトレーニングおよびテストされますか

unittestおよびpytestパッケージを使用して作成されたテストのユニットテストカバレッジレポート

Astropy：FITSテーブルをトレーニングとテストのセットに分割します