无法使用BeautifulSoup Webscrape HTML表并使用Python将其加载到Pandas数据框中

托尼·彭德尔顿

我的目标是访问以下网页https://www.countries-ofthe-world.com/world-currencies.html上的表格,并将其转换为包含“国家或地区”,“货币”列,和“ ISO-4217”。

我能够正确访问列,但是我很难确定如何将每一行追加到数据框。大家对我该如何做有什么建议?例如,在网页上,表中的第一行是字母“ A”。不过,我需要在第一行数据帧是AfghanistanAfghan afghaniAFN

这是我到目前为止的内容:

from urllib.request import Request, urlopen
from bs4 import BeautifulSoup
import pandas as pd
url = "https://www.countries-ofthe-world.com/world-currencies.html"
req = Request(url, headers={"User-Agent":"Mozilla/5.0"})
webpage=urlopen(req).read()
soup = BeautifulSoup(webpage, "html.parser")
table = soup.find("table", {"class":"codes"})
rows = table.find_all('tr')
columns = [v.text for v in rows[0].find_all('th')] 
print(columns) # ['Country or territory', 'Currency', 'ISO-4217']

也请参阅此图片。

在此处输入图片说明

谢谢大家的时间。

托尼

兰迪

完成修复后,可以很容易地通过pd.read_html以下方法来解析它

url = "https://www.countries-ofthe-world.com/world-currencies.html"
req = Request(url, headers={"User-Agent":"Mozilla/5.0"})
webpage = urlopen(req).read()

df = pd.read_html(webpage)[0]
print(df.head())

         Country or territory        Currency ISO-4217
0                           A               A        A
1                 Afghanistan  Afghan afghani      AFN
2  Akrotiri and Dhekelia (UK)   European euro      EUR
3     Aland Islands (Finland)   European euro      EUR
4                     Albania    Albanian lek      ALL

它具有那些字母标题,但是您可以使用类似 df = df[df['Currency'] != df['ISO-4217']]

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Python-BeautifulSoup Webscrape

来自分类Dev

使用python减慢webscrape的速度

来自分类Dev

使用python Webscrape特定段落

来自分类Dev

Python webscrape 无法解析某些超链接

来自分类Dev

如何使用JSoup Webscrape Steam Marketplace

来自分类Dev

如何使用BeautifulSoup在python 3中选择要在webscrape中的html文件中的特定日期“ th”元素?

来自分类Dev

如何使用python删除Webscrape名称的重音符号

来自分类Dev

如何使用python将计划包用于webscrape

来自分类Dev

python Webscrape请求与Selenium

来自分类Dev

使用rvest或RSelenium在框架内部创建表格的自动webscrape

来自分类Dev

Pandas:使用 read_sql - `con` 参数和表名将表加载到数据框中

来自分类Dev

如何通过webscrape更改HTML?

来自分类Dev

Python Webscrape配精美汤

来自分类Dev

Python-Webscrape Linkedin列表

来自分类Dev

从webscrape输出中删除'u

来自分类Dev

如何使用使用AngularJS ng-include的网站在python中Webscrape

来自分类Dev

BeautifulSoup webscrape .asp仅搜索列表中的最后一个

来自分类Dev

尝试使用Selenium Webscrape ncbi时,数据无法加载,并且不包含在具有我可以等待的ID的元素中

来自分类Dev

Python:无法使用 BeautifulSoup

来自分类Dev

CSS选择器无法解析Python Webscrape中的任何内容

来自分类Dev

从 Python webscrape 创建 SQL 数据库

来自分类Dev

无法使用beautifulsoup提取表数据

来自分类Dev

无法使用Beautifulsoup提取项目

来自分类Dev

无法使用 BeautifulSoup 检索 href

来自分类Dev

使用beautifulsoup将硒html表放入pandas数据框

来自分类Dev

使用BeautifulSoup Python无法找到HTML元素

来自分类Dev

从Webscrape过滤和格式化数据框

来自分类Dev

相同的webscrape代码可在一个页面上运行,而在使用rvest的页面上则不能

来自分类Dev

使用标签将每个表数据加载到html表

Related 相关文章

  1. 1

    Python-BeautifulSoup Webscrape

  2. 2

    使用python减慢webscrape的速度

  3. 3

    使用python Webscrape特定段落

  4. 4

    Python webscrape 无法解析某些超链接

  5. 5

    如何使用JSoup Webscrape Steam Marketplace

  6. 6

    如何使用BeautifulSoup在python 3中选择要在webscrape中的html文件中的特定日期“ th”元素?

  7. 7

    如何使用python删除Webscrape名称的重音符号

  8. 8

    如何使用python将计划包用于webscrape

  9. 9

    python Webscrape请求与Selenium

  10. 10

    使用rvest或RSelenium在框架内部创建表格的自动webscrape

  11. 11

    Pandas:使用 read_sql - `con` 参数和表名将表加载到数据框中

  12. 12

    如何通过webscrape更改HTML?

  13. 13

    Python Webscrape配精美汤

  14. 14

    Python-Webscrape Linkedin列表

  15. 15

    从webscrape输出中删除'u

  16. 16

    如何使用使用AngularJS ng-include的网站在python中Webscrape

  17. 17

    BeautifulSoup webscrape .asp仅搜索列表中的最后一个

  18. 18

    尝试使用Selenium Webscrape ncbi时,数据无法加载,并且不包含在具有我可以等待的ID的元素中

  19. 19

    Python:无法使用 BeautifulSoup

  20. 20

    CSS选择器无法解析Python Webscrape中的任何内容

  21. 21

    从 Python webscrape 创建 SQL 数据库

  22. 22

    无法使用beautifulsoup提取表数据

  23. 23

    无法使用Beautifulsoup提取项目

  24. 24

    无法使用 BeautifulSoup 检索 href

  25. 25

    使用beautifulsoup将硒html表放入pandas数据框

  26. 26

    使用BeautifulSoup Python无法找到HTML元素

  27. 27

    从Webscrape过滤和格式化数据框

  28. 28

    相同的webscrape代码可在一个页面上运行,而在使用rvest的页面上则不能

  29. 29

    使用标签将每个表数据加载到html表

热门标签

归档