python漂亮的汤桌?

阿克雷杰

请在表格中如何获取这些值。我需要日期,时间,保留和播放值。每次我只得到整个表的整个列表时,我不知道如何在其中捕获给定的值,非常感谢您的帮助。

 <table class="list">
    <tr class="head">
        <th>Date</th>
        <th>Time</th>
        <th>Play</th>
        <th>Tickets</th>
        <th>&nbsp;</th>
    </tr>
    

        
        

            <tr class="t1">
                <th>Th
                    03. 09. 2020</th>
                <td>
                    19:00</td>
                <td>Racek</td>
                <td class="center">4</td>
                <td>
                    
                    
                        
                            <a href="/rezervace/detail?id=2618"
                               title="Reserve tickets for this performance">
                                reserve
                            </a>
                        
                        
                    

                </td>
            </tr>
安德烈·凯斯利(Andrej Kesely)

该脚本将解析表,BeautifulSoup然后在屏幕上打印各个行:

import re
from bs4 import BeautifulSoup

html = '''
<table class="list">
     <tr class="head">
          <th>Date</th>
          <th>Time</th>
          <th>Play</th>
          <th>Tickets</th>
          <th>&nbsp;</th>
     </tr>
     <tr class="t1">
          <th>Th
          03. 09. 2020</th>
          <td>
          19:00</td>
          <td>Racek</td>
          <td class="center">4</td>
          <td>
               <a href="/rezervace/detail?id=2618"
                    title="Reserve tickets for this performance">
                    reserve
               </a>
          </td>
     </tr>
</table>
'''

soup = BeautifulSoup(html, 'html.parser')

all_data = []
for row in soup.select('tr'):
    all_data.append([re.sub(r'\s{2,}', ' ', d.get_text(strip=True)) for d in row.select('td, th')])

# print data to screen:

# print header:
print('{:<25}{:<15}{:<15}{:<15}{:<15}'.format(*all_data[0]))

# print rows:
for date, time, play, tickets, reserve in all_data[1:]:
    print('{:<25}{:<15}{:<15}{:<15}{:<15}'.format(date, time, play, tickets, reserve))

印刷品:

Date                     Time           Play           Tickets                       
Th 03. 09. 2020          19:00          Racek          4              reserve        

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Python漂亮的汤每页显示相同的结果

来自分类Dev

使用漂亮的汤通过python解析

来自分类Dev

带有python漂亮汤的HTML表

来自分类Dev

使用漂亮的汤python解析Google新闻

来自分类Dev

使用python和漂亮的汤在Web上浏览凌乱的网页

来自分类Dev

在python3中导入漂亮的汤

来自分类Dev

使用python3和漂亮的汤解析论坛帖子

来自分类Dev

使用漂亮的汤python从标签内部提取html ID

来自分类Dev

从Python中的链接中提取标题(漂亮的汤)

来自分类Dev

Webscrape CNN,注入,漂亮汤,python,请求,HTML

来自分类Dev

如何使用python和漂亮的汤刮标题和描述?

来自分类Dev

python漂亮的汤在上课标签后立即获得中文

来自分类Dev

Python:漂亮汤:无法从解析中获取完整标题

来自分类Dev

在元素中查找元素的漂亮汤简单python错误?

来自分类Dev

用 python 和漂亮的汤代替 <br /> 逗号

来自分类Dev

Python 3 网页抓取和漂亮的汤标签属性

来自分类Dev

使用漂亮的汤 python 从 semrush 中抓取网站流量

来自分类Dev

python web 抓取漂亮的汤并添加到列表中

来自分类Dev

使用找到漂亮的汤用python获取href

来自分类Dev

漂亮的汤解析XML

来自分类Dev

用漂亮的汤解析JS

来自分类Dev

分割数据的漂亮汤策略

来自分类Dev

用漂亮的汤打印文字

来自分类Dev

使用python re.compile与漂亮的汤匹配字符串

来自分类Dev

如何用python中的漂亮汤替换html页面中的特定文本行

来自分类Dev

使用python和漂亮的汤从HTML获取结构化数据

来自分类Dev

使用python urllib和漂亮的汤从html网站提取信息

来自分类Dev

用漂亮的汤提取数据时Python for Loop的语法错误

来自分类Dev

如何通过python中的漂亮汤在html页面中找到特定单词?

Related 相关文章

热门标签

归档