私はこのデータフレームを持っています:
dput(df)
structure(list(Metrics = c("db1.Tablespace_Space_Used_(%)", "db1.Tablespace_Space_Used_(%)",
"db1.Tablespace_Space_Used_(%)", "db1.Tablespace_Space_Used_(%)",
"db2.Tablespace_Space_Used_(%)", "db2.Tablespace_Space_Used_(%)",
"db1.Tablespace_Space_Used_(%)", "db2.Tablespace_Space_Used_(%)",
"db1.Tablespace_Space_Used_(%)", "db2.Tablespace_Space_Used_(%)",
"db2.Tablespace_Space_Used_(%)", "db2.Tablespace_Space_Used_(%)",
"db2.Tablespace_Space_Used_(%)", "db1.Tablespace_Space_Used_(%)",
"db1.Tablespace_Space_Used_(%)", "db1.Tablespace_Space_Used_(%)",
"db1.Tablespace_Space_Used_(%)", "db1.Tablespace_Space_Used_(%)",
"db1.Tablespace_Space_Used_(%)", "db1.Tablespace_Space_Used_(%)"
), Date = c(1416257563.98707, 1416257563.98707, 1416257563.98707,
1416257563.98707, 1416257563.98707, 1416257563.98707, 1416257563.98707,
1416257563.98707, 1416257563.98707, 1416257563.98707, 1416257563.98707,
1416257563.98707, 1416257563.98707, 1416257563.98707, 1416257563.98707,
1416257563.98707, 1416257563.98707, 1416257563.98707, 1416257563.98707,
1416257563.98707), Value = c(0, 0.02, 0.01, 0, 0.01, 0.01, 0.07,
0, 2.02, 0, 0, 9.32, 0.02, 9.27, 0, 12.72, 12.72, 12.72, 0.08,
12.72), Type1 = c("type=rac_database", "type=rac_database", "type=rac_database",
"type=rac_database", "type=rac_database", "type=rac_database",
"type=rac_database", "type=rac_database", "type=rac_database",
"type=rac_database", "type=rac_database", "type=rac_database",
"type=rac_database", "type=rac_database", "type=rac_database",
"type=rac_database", "type=rac_database", "type=rac_database",
"type=rac_database", "type=rac_database")), .Names = c("Metrics",
"Date", "Value", "Type1"), class = "data.frame", row.names = c(10092L,
10097L, 10103L, 10104L, 10107L, 10108L, 10111L, 10112L, 10114L,
10115L, 10116L, 10117L, 10118L, 10120L, 10121L, 10188L, 10189L,
10190L, 10192L, 10216L))
これは、より大きなデータフレームのサブセットです。同じ指標と日付でわかるように、複数の異なる値があります。同じデータとメトリックタイプの最大値のみを選択できるようにしたいと思います。したがって、同じ日付とメトリックの場合、最大ポイントとなる値を1つだけ持つ必要があります。任意のアイデア、このdfをサブセット化するにはどうすればよいですか?
たとえば、メトリックの場合:db1.Tablespace_Space_Used _(%)および日付:1416257564
私のdfには、次の1つのエントリが必要です。
db1.Tablespace_Space_Used_(%) 1416257564 12.72 type=rac_database
ここで与えられたのと同じ答え1つの列の最大値を(グループごとに)見つけて、Rの別のデータフレームに値を挿入する
データフレームが呼び出されたと仮定します df
df_1 <- aggregate(Value ~ Metrics + Date + Type1, df, max)
df_1
#edit: removed 'cbind'
出力
Metrics Date Type1 Value
1 db1.Tablespace_Space_Used_(%) 1416257564 type=rac_database 12.72
2 db2.Tablespace_Space_Used_(%) 1416257564 type=rac_database 9.32
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加