我有一个充满数据的 data.frame,参数的数据在其中重复,但我想使用存储的最新信息。
值得庆幸的是,我在文件中有一个索引,它告诉我 data.frame 中的当前行是哪个副本。
我的问题示例如下:
A B C D
1 1 2 3 1
2 1 2 2 2
3 3 4 2 2
4 3 4 1 3
5 2 3 2 1
6 2 1 1 1
一个小解释...... A 和 B 列可以被认为是键,C 列代表该键的值...... D 列代表测量的索引......但它不必从 1 开始......它可以从 3,6, ... 任何整数开始。发生这种情况是因为数据不完整
所以最后输出应该是这样的:
A B C D
2 1 2 2 2
4 3 4 1 3
5 2 3 2 1
6 2 1 1 1
你能帮我编写一个 R 程序吗,或者给我指明正确的方向,那就是保存所有带有最新索引的键...
我试过使用 for 循环,但没有用....
衷心感谢
如果您有任何问题,请随时提出
duplicated
在基 R 中使用和子集化,你可以做
dat[!duplicated(dat[,1:2], fromLast=TRUE),]
A B C D
2 1 2 2 2
4 3 4 1 3
5 2 3 2 1
6 2 1 1 1
duplicated
返回一个逻辑向量,指示一行(这里是前两列)是否已被复制。该fromLast
参数将启动从data.frame底部这个过程。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句