如何创建根据文件名标记非结构化数据集的csv文件

莎拉

我有一个由音频文件组成的非结构化数据集。如何遍历给定目录中的所有文件(包括子文件夹中的所有文件)并根据文件名标记它们,然后将此信息存储在CSV文件中?

我期望CSV文件看起来像这样的CSV文件

在此处输入图片说明

佩德罗·洛比托

目的是我想要获取文件名并以我想要的方式(对于我的所有文件)创建标签,然后将此信息保存在csv文件中

您可以将globpandas to_csv()用于此任务,即:

from os import path
from glob import glob
import pandas as pd

f_filter = ["mp3", "ogg"] # a list containing the desired file extensions to be matched
m = [] # final match list

for f_path in glob('D:/museu_do_fado/mp3/**', recursive=True): # loop directory recursively
    f_name = path.basename(f_path) # get the filename
    f_ext = f_name.split(".")[-1].lower() # get the file extension and lower it for comparison.

    if f_ext in f_filter: # filter files by f_filter 

        label = "Your choice"
        #label = f_name[0] + f_ext[-1] # as per your example, first char of file_name and last of file_ext
        m.append([f_path, f_name, f_ext, label]) # append to match list
        #print(f_path, f_name, f_name, label)

df = pd.DataFrame(m, columns=['f_path', 'f_name', 'f_ext', 'label']) # create a dataframe from match list
df.to_csv("my_library.csv", index=False) # create csv from df

样品csv

f_path,f_name,f_ext,label
D:\museu_do_fado\mp3\MDF0001_39.mp3,MDF0001_39.mp3,mp3,Your choice
D:\museu_do_fado\mp3\MDF0001_40.mp3,MDF0001_40.mp3,mp3,Your choice
...

笔记:

  1. Pandas允许使用多种导出格式,包括to_json()to_pickle()以及to_csv()上面的示例中使用的格式这是一个很棒的库,可以创建多种类型的数据分析/可视化库。如果可以的话,我会建议您学习熊猫。
  2. 这个答案应该为您提供一个起点,请确保在出现问题的情况下阅读GL文档

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用CSV格式的非结构化GPS数据包创建结构化配置单元表

来自分类Dev

将非结构化的CSV文件转换为数据框

来自分类Dev

Jekyll-数据文件和结构化YAML

来自分类Dev

如何在熊猫中读取非结构化的CSV

来自分类Dev

使用sed编辑非结构化文件

来自分类Dev

Junit的不能与星火结构化数据流创建的文件删除@TempDir

来自分类Dev

R导入半非结构化数据CSV

来自分类Dev

如何提取非结构化的excel文件数据(仪表盘数据)并将其导出为结构化的干净数据

来自分类Dev

将数据从非结构化TXT文件移动到CSV中

来自分类Dev

Python-Glob-根据文件名读取.csv数据,并根据文件名用颜色绘制数据

来自分类Dev

从文本文件中读取(某种程度上)非结构化数据以创建Python字典

来自分类Dev

如何格式化非结构化文本文件?

来自分类Dev

如何使用T-SQL在SQL Server中输出非结构化文件?

来自分类Dev

根据文件名解构目录结构

来自分类Dev

如何从目录列表基于文件名创建CSV文件?

来自分类Dev

如何使用python从非结构化HTML中创建结构化数组

来自分类Dev

如何使用Apache Pig构建非结构化数据

来自分类Dev

使用gawk根据CSV列数据创建文件名

来自分类Dev

如何用Python绘制结构化数据文件?

来自分类Dev

使用dictwriter并使用python将非结构化数据写入csv文件

来自分类Dev

如何根据文件名创建多个目录并在linux中更改文件名?

来自分类Dev

根据文件名创建列

来自分类Dev

如何将这些非结构化数据转化为结构化数据?

来自分类Dev

如何在 Java 中读取这个非结构化平面文件?

来自分类Dev

PHP非结构化文件解析器

来自分类Dev

非结构化数据的数据挖掘如何实现?

来自分类Dev

如何根据过滤的内容创建动态目标文件名?

来自分类Dev

如何将非结构化数据文件提取到 json 对象上

来自分类Dev

如何根据文件名合并 2 个 CSV 文件

Related 相关文章

  1. 1

    使用CSV格式的非结构化GPS数据包创建结构化配置单元表

  2. 2

    将非结构化的CSV文件转换为数据框

  3. 3

    Jekyll-数据文件和结构化YAML

  4. 4

    如何在熊猫中读取非结构化的CSV

  5. 5

    使用sed编辑非结构化文件

  6. 6

    Junit的不能与星火结构化数据流创建的文件删除@TempDir

  7. 7

    R导入半非结构化数据CSV

  8. 8

    如何提取非结构化的excel文件数据(仪表盘数据)并将其导出为结构化的干净数据

  9. 9

    将数据从非结构化TXT文件移动到CSV中

  10. 10

    Python-Glob-根据文件名读取.csv数据,并根据文件名用颜色绘制数据

  11. 11

    从文本文件中读取(某种程度上)非结构化数据以创建Python字典

  12. 12

    如何格式化非结构化文本文件?

  13. 13

    如何使用T-SQL在SQL Server中输出非结构化文件?

  14. 14

    根据文件名解构目录结构

  15. 15

    如何从目录列表基于文件名创建CSV文件?

  16. 16

    如何使用python从非结构化HTML中创建结构化数组

  17. 17

    如何使用Apache Pig构建非结构化数据

  18. 18

    使用gawk根据CSV列数据创建文件名

  19. 19

    如何用Python绘制结构化数据文件?

  20. 20

    使用dictwriter并使用python将非结构化数据写入csv文件

  21. 21

    如何根据文件名创建多个目录并在linux中更改文件名?

  22. 22

    根据文件名创建列

  23. 23

    如何将这些非结构化数据转化为结构化数据?

  24. 24

    如何在 Java 中读取这个非结构化平面文件?

  25. 25

    PHP非结构化文件解析器

  26. 26

    非结构化数据的数据挖掘如何实现?

  27. 27

    如何根据过滤的内容创建动态目标文件名?

  28. 28

    如何将非结构化数据文件提取到 json 对象上

  29. 29

    如何根据文件名合并 2 个 CSV 文件

热门标签

归档