使用for循环创建n个数据帧

debugcn 发表于 Dev

用户名

我想知道如何使用下面的代码以不同的方式命名将要创建的数据框。

import pandas as pd
import glob

os.chdir("/Users/path")

dataframes=[]

paths =  glob.glob("*.csv")

for path in paths:
        dataset= pd.read_csv(path)
    dataframes.append(dataset)

我想要这样的东西：

df1
df2
df3
....

为了将它们各自用于不同的分析目的。在文件夹中，我有类似的文件

analysis_for_market.csv, dataset_for_analysis.csv, test.csv, ...

假设我有23csv文件（此长度由数据帧给定，因为它附加了每个df）。对于他们每个人，我想在python中创建一个数据框df以便运行不同的分析。我会为之一：

df=pd.read_csv(path)（路径位于"/path/analysis_for_market.csv"）。然后我可以进行处理（添加列，删除列等等）。但是，我也希望能够使用另一个数据集，比如说dataset_for_analysis.csv，所以我需要创建一个新的数据框df2。如果我想比较行，这可能很有用。等等。可能每个数据集都需要一个df，所以我需要23 df。我认为可以使用for循环来完成此操作，但是我不知道如何调用df（例如，df.describe针对上述两个示例执行）。您能告诉我该怎么做吗？如果您发现与我的问题相关的问题，可以在结束我的问题之前（在解决我的问题之前已关闭上一篇文章）在注释中添加它吗？

感谢您的帮助和理解。

更新：

import os
import pandas as pd
import glob

os.chdir("/Users/path")

paths =  glob.glob("*.csv")

dataframes=[]

df={}
for x in range(1,len(paths)):
    for path in paths:
            df["0".format(x)]=pd.read_csv(path)

        #dataframes[path] = df # it gives me the following error: TypeError: list indices must be integers or slices, not str

df["2"]

它仅适用0于代码中的方法，但是我不知道如何让值介于1和之间len(paths)

曼诺·卡图阿

设置数据帧的名称即可完成这项工作。

import pandas as pd
import glob
import os

os.chdir("/Users/path")

df = {}

paths =  glob.glob("*.csv")

for index, path in enumerate(paths):
      df[str(index)]= pd.read_csv(path)

这对我来说很好。如果我调用df ['0']，则这是第一个数据帧。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-2

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

使用for循环创建n个数据帧

使用for循环创建n个数据帧

使用循环创建多个数据帧

使用循环从多个数据帧的列中创建单个数据帧

使用循环在R中创建多个数据帧

如何使用For循环语句从4个数据帧中创建相似列的一个数据帧

使用for循环或lapply从一个数据帧中的选择列创建多个ggplots

循环多个数据帧

使用循环使用 Pandas 转换多个数据帧

通过使用for循环循环每个数据帧来处理数据帧

Python / Pandas：使用 2 个数据帧消除循环

根据另一个数据帧中的值使用循环创建和填充多列

使用python循环在一个数据帧的一个excel工作簿中创建多个excel表

循环引用两个数据帧

R 循环引用多个数据帧

在循环中绑定多个数据帧

使用嵌套的for循环在R中创建数据帧

使用 R for 循环从数据帧创建不同的矩阵

循环从一个数据帧在matplotlib中创建多个图？

R在此循环内创建一个数据帧

编写一个循环以从 SpatialPointsDataFrame 创建多个数据帧和栅格

熊猫使用for循环创建多个数据框

R-在R函数中创建一个数据帧，并在该数据帧上使用ggplot

R-在R函数中创建一个数据帧，并在该数据帧上使用ggplot

使用 for 循环在多个数据帧上根据 ID 过滤行

使用 for 循环在多个数据帧上应用更改（分组依据）

R为数据帧列表创建循环

通过for循环创建数据帧字典

在循环中创建数据帧的名称

在python中循环创建新的数据帧

如何在循环的每次迭代中使用for循环创建新的数据帧？