合并两个大的csv文件

用户名

我有两种类型的csv文件,第一个文件的内容如下:

1 13733776062
2 13535581615
3 13987993374
4 13866603331

第二个文件的内容如下:

13535581615|1
13733776062|0
13866603331|0
13987993374|1

每行的第一个文件格式为:id number每行的第二个文件格式为:number flag他们有一个关系字段:number

每个文件有1000万行。现在我想将两个文件按数字字段组合成一个新文件,该文件包含id,number,flag每行3个字段,我正在使用Java来做到这一点。

有人可以告诉我这项工作消耗更少时间的最佳方法吗?

MVP

此任务更适合SQLite,而不适合Java。您可以按照以下步骤进行操作:

$ sqlite3 database.db
sqlite> CREATE TABLE table1 (id int, number int);
sqlite> .separator " "
sqlite> .import t1.csv table1
sqlite> CREATE TABLE table2 (number int, flag int);
sqlite> .separator "|"
sqlite> .import t2.csv table2
sqlite> CREATE TABLE mytable AS
        SELECT t1.id, t1.number, t2.flag
        FROM table1 t1, table2 t2
        WHERE t1.number=t2.number;
sqlite> SELECT * FROM mytable;
1|13733776062|0
2|13535581615|1
3|13987993374|1
4|13866603331|0

我希望它可以非常快速地为1000万条线路工作。

当然,您可以使用SQLite JDBC从Java创建和访问新数据库。

为了使访问更快,创建适当的索引是个好主意。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何合并两个CSV文件?

来自分类Dev

如何在JavaScript中合并两个.csv文件?

来自分类Dev

通过公共列python合并两个CSV文件

来自分类Dev

Apache Nifi:在两个csv文件中合并行

来自分类Dev

Python合并两个CSV文件Python

来自分类Dev

如何在python中合并两个csv文件

来自分类Dev

在Python中合并两个CSV文件

来自分类Dev

根据匹配的列数据合并两个CSV文件

来自分类Dev

基于公共列合并两个csv文件

来自分类Dev

合并两个文件

来自分类Dev

合并两个文件

来自分类Dev

合并两个文件

来自分类Dev

在两个列上合并两个条件文件

来自分类Dev

合并两个csv文件,以使用两个现有csv文件中的选定行生成第三个csv文件

来自分类Dev

根据python中的两列在python中映射或合并两个csv文件?

来自分类Dev

比较两个不同CSV文件的两列并合并输出

来自分类Dev

awk要求合并两个文件

来自分类Dev

Linux AWK合并两个文件

来自分类Dev

合并两个Sass文件

来自分类Dev

如何合并两个* .srt文件

来自分类Dev

如何合并两个文件

来自分类Dev

Clearcase:合并两个文件

来自分类Dev

合并两个日期相同的文件

来自分类Dev

awk 合并两个文件

来自分类Dev

使用AWK将两个CSV文件合并为一个

来自分类Dev

将两个CSV文件合并为一个

来自分类Dev

比较两个大的csv文件,然后用python编写另一个

来自分类Dev

通过公共行将两个大文本文件合并为一个映射文件

来自分类Dev

python从两个csv文件中提取列并将其合并为一个新的csv文件