将 BS4 结果集转换为相对于标题的 NxN 数组(单独的 BS4 结果集)

丹尼斯·金

TL;DR我需要将 BS4 结果集列表(单列)转换为 NxN 数组,但是如何?以及如何附加也是 BS4 结果集列表的标题?代码如下。谢谢!

所以我试图通过网络抓取体育数据,但是我在将结果集转换为 NxN 数组时遇到了问题。此外,我试图包括以相同方式刮取的标题。到目前为止,这是我的代码:

import requests
from bs4 import BeautifulSoup
from __future__ import print_function
import numpy as np

url=input("Paste player link and specific year ")
r= requests.get(url)
html_content=r.text
soup=BeautifulSoup(html_content,"lxml")

body = soup.body
table=body.table
tbody=table.tbody

headers = table.find_all("th")
statistics = tbody.find_all("td")

def string_stats():
    for stat in statistics:
        print (stat.string)

def string_headers():
    for head in headers:
        print (head.string)

string_stats_list = string_stats()
string_stats_list

这会产生一个只有 td 标签元素作为字符串的垂直列表(或者这就是目标)。

所以,我的问题是:如何将这个单列列表放入 NxN 数组/矩阵?另外,我怎样才能获得附加的标题?

感谢阅读和/或帮助!

德米特里·菲亚尔科夫斯基
import pandas as pd
import requests
from bs4 import BeautifulSoup

url='http://www.footballdb.com/players/mike-evans-evansmi03/gamelogs'
r= requests.get(url)
html_content=r.content
soup=BeautifulSoup(html_content,"lxml")

body = soup.body
table=body.table

headers = table.find_all("th")

headers_list = [i.text for i in headers]

string_stats_list = []
row = []
for i in table.select('tr')[1:]:
    for j in i.select('td'):
        row.append(j.text)
    string_stats_list.append(row)
    row = []

df = pd.DataFrame(data=string_stats_list, columns=headers_list)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用BS4抓取数据给我意外的结果

来自分类Dev

使用bs4的Web抓取输出空结果

来自分类Dev

使用bs4搜索<span>时得到空结果

来自分类Dev

如何使用bs4正确打印Google搜索结果?

来自分类Dev

如何通过bs4传递搜索关键字并获得结果

来自分类Dev

Webscraping bs4,无法弄清楚如何获得结果

来自分类Dev

找不到带有BS4的Google搜索的结果-Python

来自分类Dev

遍历CSV文件但得到重复的结果Python 3 / Selenium / BS4

来自分类Dev

BS4 Web抓取,我的列表理解仅返回单个结果

来自分类Dev

如何使用bs4 / python从Wikipedia网站获取txt文件中单词的搜索结果?

来自分类Dev

当有脚本结果时,如何通过请求进行网络抓取,Bs4?

来自分类Dev

无法将输出写入csv bs4 python

来自分类Dev

通过bs4将html表数据导入python

来自分类Dev

带有标题标签的BS4类

来自分类Dev

使用Python和bs4从图像中刮取“标题”

来自分类Dev

我想用bs4从亚马逊获得产品的标题

来自分类Dev

我如何使用bs4从脚本中提取标题

来自分类Dev

从BS4到lxml解析器的代码转换

来自分类Dev

尝试对表和bs4中的数据进行webscrape操作虽然值存在,但没有任何结果

来自分类Dev

BS4:删除<a>标签

来自分类Dev

Python // BS4 //标签

来自分类Dev

尽管站点具有不同的结果,但从地址中使用urllib和bs4在每个循环中获得相同的结果

来自分类Dev

在同一行 BS4 中获取单独的文本

来自分类Dev

带有BS4的简单Spider神秘地将每一页翻倍

来自分类Dev

KeyError:将新标签附加到bs4中的汤时为-1

来自分类Dev

是否可以将 bs4 汤对象与 lxml 一起使用?

来自分类Dev

使用python bs4根据标题进行屏幕抓取

来自分类Dev

BS4:在标签中获取文本

来自分类Dev

如何从bs4导入BeautifulSoup?

Related 相关文章

  1. 1

    使用BS4抓取数据给我意外的结果

  2. 2

    使用bs4的Web抓取输出空结果

  3. 3

    使用bs4搜索<span>时得到空结果

  4. 4

    如何使用bs4正确打印Google搜索结果?

  5. 5

    如何通过bs4传递搜索关键字并获得结果

  6. 6

    Webscraping bs4,无法弄清楚如何获得结果

  7. 7

    找不到带有BS4的Google搜索的结果-Python

  8. 8

    遍历CSV文件但得到重复的结果Python 3 / Selenium / BS4

  9. 9

    BS4 Web抓取,我的列表理解仅返回单个结果

  10. 10

    如何使用bs4 / python从Wikipedia网站获取txt文件中单词的搜索结果?

  11. 11

    当有脚本结果时,如何通过请求进行网络抓取,Bs4?

  12. 12

    无法将输出写入csv bs4 python

  13. 13

    通过bs4将html表数据导入python

  14. 14

    带有标题标签的BS4类

  15. 15

    使用Python和bs4从图像中刮取“标题”

  16. 16

    我想用bs4从亚马逊获得产品的标题

  17. 17

    我如何使用bs4从脚本中提取标题

  18. 18

    从BS4到lxml解析器的代码转换

  19. 19

    尝试对表和bs4中的数据进行webscrape操作虽然值存在,但没有任何结果

  20. 20

    BS4:删除<a>标签

  21. 21

    Python // BS4 //标签

  22. 22

    尽管站点具有不同的结果,但从地址中使用urllib和bs4在每个循环中获得相同的结果

  23. 23

    在同一行 BS4 中获取单独的文本

  24. 24

    带有BS4的简单Spider神秘地将每一页翻倍

  25. 25

    KeyError:将新标签附加到bs4中的汤时为-1

  26. 26

    是否可以将 bs4 汤对象与 lxml 一起使用?

  27. 27

    使用python bs4根据标题进行屏幕抓取

  28. 28

    BS4:在标签中获取文本

  29. 29

    如何从bs4导入BeautifulSoup?

热门标签

归档