ファイル名から日付を抽出して、データフレームのリストに日付を追加します

debugcn 投稿 Dev

eduardo2111

複数のデータフレームのリストがありますdfs。

データフレームは、名前に日付が含まれるファイルから取得されます。例えば。ファイル名YYYYMMDD.xlsx

files = [str(file) for file in Path(/dir)]
dfs = [pd.read_excel(file, header=1)] for file in files]

ファイル名から日付を抽出できます。

date_extract = re.search('[0-9]{8}',files[0...20])
date = datetime.datetime.strptime(date_extract[0...20], '%Y%m%d').date()

しかし、df（「日付」という列を追加して）それぞれの日付にどのように割り当てることができますか？

マイコドリ

使用しpathlibている場合は、辞書を使用してデータフレームを保持し、クイック正規表現を使用して日付を抽出できます。データフレームを連結すると、インデックスが日付に設定されます。

import re
from pathlib import Path
dfs = {
    re.search('(\d{4}.*).xlsx',f.name).group(1): pd.read_excel(f,header=1)
    for f in Path(
        /dir
    ).glob("*.xlsx")
}

print(pd.concat(dfs))

  Unnamed: 0    e    f    c    d
20200610 0            0  0.0  0.0  NaN  NaN
         1            1  0.0  0.0  NaN  NaN
         2            2  0.0  0.0  NaN  NaN
         3            3  0.0  0.0  NaN  NaN
         4            4  1.0  0.0  NaN  NaN
         5            5  0.0  1.0  NaN  NaN
         6            6  0.0  0.0  NaN  NaN
         7            7  0.0  0.0  NaN  NaN
         8            8  0.0  0.0  NaN  NaN
         9            9  0.0  0.0  NaN  NaN
         10          10  0.0  0.0  NaN  NaN
         11          11  0.0  0.0  NaN  NaN
         12          12  0.0  0.0  NaN  NaN
         13          13  0.0  0.0  NaN  NaN
         14          14  0.0  0.0  NaN  NaN
         15          15  0.0  0.0  NaN  NaN
         16          16  0.0  0.0  NaN  NaN
         17          17  0.0  0.0  NaN  NaN
         18          18  0.0  0.0  NaN  NaN
         19          19  0.0  0.0  NaN  NaN
         20          20  0.0  0.0  NaN  NaN
         21          21  0.0  0.0  NaN  NaN
         22          22  0.0  0.0  NaN  NaN
         23          23  0.0  0.0  NaN  NaN
         24          24  0.0  0.0  NaN  NaN
         25          25  0.0  0.0  NaN  NaN
20201012 0            0  NaN  NaN  0.0  0.0
         1            1  NaN  NaN  0.0  0.0
         2            2  NaN  NaN  1.0  0.0
         3            3  NaN  NaN  0.0  1.0

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]