如何在python中打开格式为[[skill1,skill2,skill3,...],[skill1,skill4,skill6,...],....]的大文本文件。

严厉的潘瓦尔

如何打开一种格式的大文本文件

[[skill1, skill2, skill3, ...], [skill1, skill4, skill6, ...], ….]

在Python中。我尝试使用Pandas和numpy,但read_csv方法或其他此类方法不起作用。

更新:我能够使用以下代码行读取.txt文件:

f = open("demofile.txt", "r")
print(f.read(5))
乌韦·齐根哈根(Uwe Ziegenhagen)

正如您没有明确提到的那样,该文件包含任何换行符,我将使用以下方法。编写一些自定义Python代码以

  • 加载文件
  • 搜索并将“],[”替换为“ \ n”
  • 搜索并将“ [”替换为“”。
  • 将此文件保存在磁盘上,并以“,”作为分隔符以CSV格式加载。

对于大文件,我可能会使用SED。以下代码完成了上述工作。它通过逐个字符地读取并检查最后读取的字符是什么来工作。基于多个if,我确定要执行的操作。注意:我只花了几分钟时间,可能会对其进行优化。输入文件不需要换行符,输出将具有换行符。

lastreadchar = ''

with open("data.txt",mode='r') as i, open('out.txt','w') as o:
    while True:
        x = i.read(1)

        if x == '': # end of file has been reached
            break 
        elif x==' ':
            pass
        elif x==']':
            pass
        elif x=='[':
            if lastreadchar == '[': 
                # at the beginning of the file, don't do anything
                pass
            elif lastreadchar == '\n': # a new line
                pass   
            elif lastreadchar == ',': # a new line
                pass
        elif x==',':
            if lastreadchar == ']': # at the beginning of the file
                print('\n')
                o.write('\n')
            else:
                print(x, end='')
                o.write(x)
        else:
            print(x, end = '')            
            o.write(x)

        lastreadchar = x

对于很大的文本文件(在数GB范围内),我可能会使用SED这样处理文件。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

将大文本文件输出解析为另一个文本文件

来自分类Dev

在文本文件中访问最后6行C ++

来自分类Dev

如何关闭Xcode 6自动缩进文本文件

来自分类Dev

从Matlab中的文本文件加载大矩阵

来自分类Dev

如何独特的大文本文件内容

来自分类Dev

大文本文件中的词频

来自分类Dev

需要帮助将大文本文件裁剪为带有标题的多个小文本文件

来自分类Dev

如何使用大文本文件中的grep / sed从日期范围中获取文本?

来自分类Dev

BufferedReader中的FileReader与阅读()性能 - 大文本文件

来自分类Dev

如何使用Dask对大文本文件进行排序?

来自分类Dev

如何将Python库导入Alexa Skill

来自分类Dev

如何从python中的.txt文件读取数据框中的大文本文件

来自分类Dev

如何使用大文本文件中的grep / sed从日期范围中获取文本?

来自分类Dev

如何创建索引以解析大文本文件

来自分类Dev

Python生成的文本文件的大小比预期的大

来自分类Dev

在文本文件中访问最后6行C ++

来自分类Dev

如何比较两个文本文件的内容并在另一个文本文件中输出?文字1-文字2

来自分类Dev

如何搜索大文本文件(书)?

来自分类Dev

从文本文件python写入文本文件

来自分类Dev

如何独特的大文本文件内容

来自分类Dev

如何在Powershell中的1个文本文件中输出2个命令

来自分类Dev

文本文件的格式?

来自分类Dev

从文本文件java存储1d数组

来自分类Dev

PHP | 替换大文本文件中的行

来自分类Dev

如何快速显示大(GB)文本文件?

来自分类Dev

检测大文本文件中的奇数字符

来自分类Dev

Wordpress 如何在视图中显示 Skill1_logo

来自分类Dev

在 Alexa Skill 中使用 sessionAttributes

来自分类Dev

从bash中的大文本文件中删除latin-1字符

Related 相关文章

  1. 1

    将大文本文件输出解析为另一个文本文件

  2. 2

    在文本文件中访问最后6行C ++

  3. 3

    如何关闭Xcode 6自动缩进文本文件

  4. 4

    从Matlab中的文本文件加载大矩阵

  5. 5

    如何独特的大文本文件内容

  6. 6

    大文本文件中的词频

  7. 7

    需要帮助将大文本文件裁剪为带有标题的多个小文本文件

  8. 8

    如何使用大文本文件中的grep / sed从日期范围中获取文本?

  9. 9

    BufferedReader中的FileReader与阅读()性能 - 大文本文件

  10. 10

    如何使用Dask对大文本文件进行排序?

  11. 11

    如何将Python库导入Alexa Skill

  12. 12

    如何从python中的.txt文件读取数据框中的大文本文件

  13. 13

    如何使用大文本文件中的grep / sed从日期范围中获取文本?

  14. 14

    如何创建索引以解析大文本文件

  15. 15

    Python生成的文本文件的大小比预期的大

  16. 16

    在文本文件中访问最后6行C ++

  17. 17

    如何比较两个文本文件的内容并在另一个文本文件中输出?文字1-文字2

  18. 18

    如何搜索大文本文件(书)?

  19. 19

    从文本文件python写入文本文件

  20. 20

    如何独特的大文本文件内容

  21. 21

    如何在Powershell中的1个文本文件中输出2个命令

  22. 22

    文本文件的格式?

  23. 23

    从文本文件java存储1d数组

  24. 24

    PHP | 替换大文本文件中的行

  25. 25

    如何快速显示大(GB)文本文件?

  26. 26

    检测大文本文件中的奇数字符

  27. 27

    Wordpress 如何在视图中显示 Skill1_logo

  28. 28

    在 Alexa Skill 中使用 sessionAttributes

  29. 29

    从bash中的大文本文件中删除latin-1字符

热门标签

归档