使用NumPy和pandas的Python文本矩阵

bill999

我一直在进行文本抓取,只是使用循环将文本写入CSV文件。例如(跳过很多代码-这仅用于说明):

for i in range(0,numresults):
    a2 = soup.find_all('td')[0].string
    a3 = soup.find_all('td')[1].string
    file.write(str(i) + '|' + a2 + '|' + a3 + '\n')

然后,我可以使用R之类的格式打开此CSV文件。

但可以说,我想在python中创建一个矩阵。首先,在使用带有大量文本的数据时,最好使用pandas或NumPy吗?

其次,如何修改代码以不写入文件,而是创建熊猫和NumPy数组?

可以说文本最终是:

a11 = 1; a12 = 'a'; a13 = 'Text1'
a21 = 2; a22 = 'B'; a23 = 'Text2'
a31 = 3; a32 = 'c'; a33 = 'Text3'
a41 = 4; a42 = 'D'; a44 = 'Text4'

import numpy as np
import pandas

最后,我该如何将生成的熊猫和NumPy矩阵写入CSV文件?

快乐001

似乎您正在使用BeautifulSoup从HTML获取表。我已经成功地使用Pandas从网页中提取表格。使用pandas doc中的示例(这里是链接):

In [1]: import pandas as pd

In [2]: tables = pd.read_html('http://www.fdic.gov/bank/individual/failed/banklist.html')

在这种情况下,tables只有一个表。您可以print tables[0]查看或tables[0].to_csv(local_csv_output)另存为CSV文件。pd.read_html可以读取URL(http ...)和本地HTML文件。

如果您有多个表格,只需通过打印手动找出所需的表格。

试试看,让我们知道。

如果您已经a11,a11,...分配了变量(看起来很奇怪-应该在中list),则可以创建pandas DataFrame:

    In [38]: df = pd.DataFrame ([[a11,a12,a13],
[a21,a22,a23],
[a31,a32,a33],
[a41,a42,a44]],
columns=['Col1','Col2','Col3'])

In [39]: df
Out[39]: 
   Col1 Col2   Col3
0     1    a  Text1
1     2    B  Text2
2     3    c  Text3
3     4    D  Text4

并且df.to_csv('output_csv_file.csv')将它保存到CSV文件。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用Pandas和Numpy在python中创建矩阵

来自分类Dev

Python numpy 和 pandas 矩阵维度

来自分类Dev

使用 numpy 在 python 中迭代矩阵

来自分类Dev

在Python中一起使用pandas groupby和numpy

来自分类Dev

使用Python进行线性回归(Pandas和Numpy)

来自分类Dev

使用numpy / pandas从两列创建联合命中数矩阵

来自分类Dev

在R中使用文本分类和大稀疏矩阵

来自分类Dev

Python Numpy-矩阵内存错误和限制

来自分类Dev

比较Python,Numpy,Numba和C ++进行矩阵乘法

来自分类Dev

无法复制比较Python,Numpy和Numba矩阵乘法的结果

来自分类Dev

Eigen和Numpy->将矩阵从Python传递到C ++

来自分类Dev

以numpy / Python样式访问OpenCV和C ++中的矩阵元素

来自分类Dev

分区组作为Python和NumPy中的矩阵列表

来自分类Dev

python numpy - 执行向量和矩阵加法的函数

来自分类Dev

使用Numpy和Cython加速距离矩阵计算

来自分类Dev

使用Numpy向量化矩阵中最近邻居的和

来自分类Dev

Sympy和Numpy无法逆转使用Sympy创建的矩阵

来自分类Dev

使用 NUMPY 的雅可比方法和基本矩阵数学

来自分类Dev

Python:Numpy矩阵拆分

来自分类Dev

numpy矩阵到pandas系列

来自分类Dev

矩阵的numpy平方和

来自分类Dev

Numpy 数组和矩阵乘法

来自分类Dev

Python-如何将相等的术语分为两列并在numpy矩阵中的第三列中添加所有术语...使用pandas还是numpy?

来自分类Dev

使用SciPy / Numpy在Python中连接稀疏矩阵

来自分类Dev

使用numpy的genfromtxt用python加载三角矩阵

来自分类Dev

如何使用 numpy 在 Python 中找到矩阵的空空间?

来自分类Dev

Python Numpy 矩阵运算 - 矩阵 [a==b]?

来自分类Dev

使用矩阵作为字典值并在python中执行numpy矩阵运算

来自分类Dev

使用Python和Pandas在文本文件中拆分数据

Related 相关文章

  1. 1

    使用Pandas和Numpy在python中创建矩阵

  2. 2

    Python numpy 和 pandas 矩阵维度

  3. 3

    使用 numpy 在 python 中迭代矩阵

  4. 4

    在Python中一起使用pandas groupby和numpy

  5. 5

    使用Python进行线性回归(Pandas和Numpy)

  6. 6

    使用numpy / pandas从两列创建联合命中数矩阵

  7. 7

    在R中使用文本分类和大稀疏矩阵

  8. 8

    Python Numpy-矩阵内存错误和限制

  9. 9

    比较Python,Numpy,Numba和C ++进行矩阵乘法

  10. 10

    无法复制比较Python,Numpy和Numba矩阵乘法的结果

  11. 11

    Eigen和Numpy->将矩阵从Python传递到C ++

  12. 12

    以numpy / Python样式访问OpenCV和C ++中的矩阵元素

  13. 13

    分区组作为Python和NumPy中的矩阵列表

  14. 14

    python numpy - 执行向量和矩阵加法的函数

  15. 15

    使用Numpy和Cython加速距离矩阵计算

  16. 16

    使用Numpy向量化矩阵中最近邻居的和

  17. 17

    Sympy和Numpy无法逆转使用Sympy创建的矩阵

  18. 18

    使用 NUMPY 的雅可比方法和基本矩阵数学

  19. 19

    Python:Numpy矩阵拆分

  20. 20

    numpy矩阵到pandas系列

  21. 21

    矩阵的numpy平方和

  22. 22

    Numpy 数组和矩阵乘法

  23. 23

    Python-如何将相等的术语分为两列并在numpy矩阵中的第三列中添加所有术语...使用pandas还是numpy?

  24. 24

    使用SciPy / Numpy在Python中连接稀疏矩阵

  25. 25

    使用numpy的genfromtxt用python加载三角矩阵

  26. 26

    如何使用 numpy 在 Python 中找到矩阵的空空间?

  27. 27

    Python Numpy 矩阵运算 - 矩阵 [a==b]?

  28. 28

    使用矩阵作为字典值并在python中执行numpy矩阵运算

  29. 29

    使用Python和Pandas在文本文件中拆分数据

热门标签

归档