我总共有21个要加载到R中的csv文件。所以我做到了:
list_of_data = list.files(pattern="*.csv")
tbl_met = lapply(list_of_data, read.csv)
不能给你,dput
因为它有太多的数据...
我要做的是从所有数据集中的第一列中的所有名称中获取一个列表。合并到一个向量/列表,但有两个问题:
这些文件中的所有列首先用“;”分隔 或没有任何分隔标记...我是否必须查看这些文件并以相同方式将它们全部分隔开?
第二个问题是名称可能重复,我想将它们从列表中删除。
你有什么想法吗?我应该再提供一些数据吗?如果是,请告诉我该怎么做。
我找到了解决方案。可能这不是最简单的方法,但它确实有效。首先,我必须将所有的csv文件转换为相同的模式。用R轻松完成任务。
之后:
list_of_data = list.files(pattern="*.csv")
tbl_met = lapply(list_of_data, read.csv)
tbl <- rbindlist(tbl_met) ## binding all of the tables in the list by row
vec_names <- tbl$locus ## name of the column with names which I am interested in
vec <- unique(vec_names) ## removing the duplicates
做得很好!
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句