无法以某些自定义方式安排抓取的内容

潜行

我试图刮掉carmodel并且load该网页我编写的脚本可以完美地解析它们。但是,我无法以定制的方式安排它们。

我尝试过:

import requests
from bs4 import BeautifulSoup

r = requests.get("https://www.fjordsen.com/en-eu/vehicles/")
soup = BeautifulSoup(r.text,"lxml")
for items in soup.select(".card-default"):
    item_title = items.select_one("h4.card-title > a").get_text(strip=True)
    item_content = [item.text for item in items.select("td")[2:]]
    print(item_title,item_content)

此时脚本生成的输出:

Audi ['A1', '75kg✓', 'A3', '75kg✓', 'A4', '90kg✓', 'A5', '90kg✓', 'A6', '100kg✓', 'A7', '100kg✓', 'A8', '100kg✓', 'Q2', '75kg✓', 'Q3', '75kg✓', 'Q5', '75kg✓', 'Q7', '75kg✓', 'Q8', '100kg✓']
BMW ['1Serie', '75kg✓', '2SerieActiveTourer', '75kg✓', '2SerieCabrio', '0kg', '2SerieCoupe', '75kg✓', '2SerieGrandCoupe', '75kg✓', '2SerieGrandTourer', '75kg✓', '3Serie', '75kg✓', '3SerieGranTurismo', '75kg✓', '3SerieTouring', '75kg✓', '4SerieCabrio', '0kg', '4SerieCoupe', '75kg✓', '4SerieGranCoupe', '75kg✓', '5Serie', '100kg✓', '5SerieTouring', '100kg✓', '6SerieGranTurismo', '100kg✓', '7Serie', '100kg✓', '8Serie', '75kg✓', '8SerieCabrio', '0kg', '8SerieGranCoupe', '75kg✓', 'i3', 'Checkinstructionmanualforyourcar', 'i8', 'Checkinstructionmanualforyourcar', 'i8Roadster', 'Checkinstructionmanualforyourcar', 'X1', '75kg✓', 'X2', '75kg✓', 'X3', '100kg✓', 'X4', '100kg✓', 'X5', '100kg✓', 'X6', '100kg✓', 'X7', '100kg✓', 'Z4', 'Checkinstructionmanualforyourcar']

我希望得到的输出(显示前几个):

Audi A1 75kg
Audi A3 75kg
Audi A4 90kg
Audi A5 90kg
Audi A6 100kg

如何使脚本产生类似于第二个脚本的输出?

安德烈·凯斯利(Andrej Kesely)

您可以使用内置zip()功能。

例如:

import requests
from bs4 import BeautifulSoup

r = requests.get("https://www.fjordsen.com/en-eu/vehicles/")
soup = BeautifulSoup(r.text,"lxml")
for items in soup.select(".card-default"):
    item_title = items.select_one("h4.card-title > a").get_text(strip=True)
    item_content = [item.text for item in items.select("td")[2:]]
    for t, w in zip(item_content[::2], item_content[1::2]):
        print(item_title, t, w)  # or print(item_title, t, w.split()[0]) without the `✓` sign

印刷品:

Audi A1 75kg  ✓
Audi A3 75kg  ✓
Audi A4 90kg  ✓
Audi A5 90kg  ✓
Audi A6 100kg  ✓
Audi A7 100kg  ✓
Audi A8 100kg  ✓
Audi Q2 75kg  ✓
Audi Q3 75kg  ✓
Audi Q5 75kg  ✓
Audi Q7 75kg  ✓
Audi Q8 100kg  ✓
BMW 1 Serie 75kg  ✓
BMW 2 Serie Active Tourer 75kg  ✓
BMW 2 Serie Cabrio 0kg
BMW 2 Serie Coupe 75kg  ✓
BMW 2 Serie Grand Coupe 75kg  ✓

...and so on.

通过uwtd电视编辑:

item_content[::2] = starts on index 0 and take 2 jumps to next model

item_content[1::2] = starts in index 1 and take 2 jumps to next load

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

无法使用自定义方法解析某些内容

来自分类Dev

在以某些自定义方式使用并发。未来时,无法从函数中打印结果

来自分类Dev

无法填写某些日期输入以执行自定义搜索

来自分类Dev

无法以自定义方式解压缩平面清单

来自分类Dev

无法以自定义方式将数据写入excel文件

来自分类Dev

无法以自定义方式在 csv 文件中写入数据

来自分类Dev

无法以自定义方式生成日期列表

来自分类Dev

无法将我的WiX自定义操作安排到MSI中

来自分类Dev

无法绑定自定义控件内容(WPF)

来自分类Dev

自定义按钮无法正确显示其内容

来自分类Dev

从自定义光标到集合的抓取

来自分类Dev

无法通过移动设备“抓取”自定义Chrome滚动条

来自分类Dev

如何为每个自定义分类法回显某些内容?

来自分类Dev

当用户输入某些内容时如何设置自定义输入状态结构 React js

来自分类Dev

安排从WiX延迟的自定义操作重启

来自分类Dev

使用PloneFormGen自定义脚本适配器以编程方式执行内容规则

来自分类Dev

使用自定义内容以编程方式打开jquery ui工具提示

来自分类Dev

创建键入剪贴板内容的自定义快捷方式

来自分类Dev

抓取文件的某些内容

来自分类Dev

自定义xmlWriter跳过某些元素?

来自分类Dev

无法使用正则表达式抓取某些内容

来自分类Dev

无法从动态内容中抓取某些链接

来自分类Dev

Android 4.4 KitKat中的某些用户无法绘制自定义视图

来自分类Dev

使用自定义WPF控件时无法设置某些属性

来自分类Dev

Android 4.4 KitKat中的某些用户无法绘制自定义视图

来自分类Dev

在某些环境下无法读取Outlook Mail Item自定义属性

来自分类Dev

疯狂的错误,自定义付款方式

来自分类Dev

Lodash创建自定义函数的方式

来自分类Dev

以自定义方式对列表进行排序

Related 相关文章

  1. 1

    无法使用自定义方法解析某些内容

  2. 2

    在以某些自定义方式使用并发。未来时,无法从函数中打印结果

  3. 3

    无法填写某些日期输入以执行自定义搜索

  4. 4

    无法以自定义方式解压缩平面清单

  5. 5

    无法以自定义方式将数据写入excel文件

  6. 6

    无法以自定义方式在 csv 文件中写入数据

  7. 7

    无法以自定义方式生成日期列表

  8. 8

    无法将我的WiX自定义操作安排到MSI中

  9. 9

    无法绑定自定义控件内容(WPF)

  10. 10

    自定义按钮无法正确显示其内容

  11. 11

    从自定义光标到集合的抓取

  12. 12

    无法通过移动设备“抓取”自定义Chrome滚动条

  13. 13

    如何为每个自定义分类法回显某些内容?

  14. 14

    当用户输入某些内容时如何设置自定义输入状态结构 React js

  15. 15

    安排从WiX延迟的自定义操作重启

  16. 16

    使用PloneFormGen自定义脚本适配器以编程方式执行内容规则

  17. 17

    使用自定义内容以编程方式打开jquery ui工具提示

  18. 18

    创建键入剪贴板内容的自定义快捷方式

  19. 19

    抓取文件的某些内容

  20. 20

    自定义xmlWriter跳过某些元素?

  21. 21

    无法使用正则表达式抓取某些内容

  22. 22

    无法从动态内容中抓取某些链接

  23. 23

    Android 4.4 KitKat中的某些用户无法绘制自定义视图

  24. 24

    使用自定义WPF控件时无法设置某些属性

  25. 25

    Android 4.4 KitKat中的某些用户无法绘制自定义视图

  26. 26

    在某些环境下无法读取Outlook Mail Item自定义属性

  27. 27

    疯狂的错误,自定义付款方式

  28. 28

    Lodash创建自定义函数的方式

  29. 29

    以自定义方式对列表进行排序

热门标签

归档