在python中格式化http get请求输出

佐罗99

我正在尝试使用以下代码从我们的内部网页读取一些数据:

import requests
from requests_toolbelt.utils import dump

resp = requests.get('XXXXXXXXXXXXXXXX')
data = dump.dump_all(resp)
print(data.decode('utf-8'))

我得到的输出是以下格式:

<tr> 
    <td bgcolor="#FFFFFF"><font size=2><a     
href=javascript:openwin(179)>Kevin</a></font></td>
    <td bgcolor="#FFFFFF"><font size=2>45.50/week</font></td>
  </tr>

  <tr> 
    <td bgcolor="#FFFFFF"><font size=2><a  
href=javascript:openwin(33)>Eliza</a></font></td>
    <td bgcolor="#FFFFFF"><font size=2>220=00/week</font></td>
  </tr>

  <tr> 
    <td bgcolor="#FFFFFF"><font size=2><a href=javascript:openwin(97)>sam</a></font></td>
    <td bgcolor="#FFFFFF"><font size=2>181=00</font></td>
  </tr>

但是我对上面的输出感兴趣的数据是名称和值,例如:

Kevin 45.50/week
Eliza 220=00/week
Sam 181=00

是否有任何模块/方式可以将此输出格式化为所需格式并将其放入某个文件(最好是Excel)

尚恩

尝试BeautifulSoup

from bs4 import BeautifulSoup as soup

content = """<tr> 
    <td bgcolor="#FFFFFF"><font size=2><a     
href=javascript:openwin(179)>Kevin</a></font></td>
    <td bgcolor="#FFFFFF"><font size=2>45.50/week</font></td>
  </tr>

  <tr> 
    <td bgcolor="#FFFFFF"><font size=2><a  
href=javascript:openwin(33)>Eliza</a></font></td>
    <td bgcolor="#FFFFFF"><font size=2>220=00/week</font></td>
  </tr>

  <tr> 
    <td bgcolor="#FFFFFF"><font size=2><a href=javascript:openwin(97)>sam</a></font></td>
    <td bgcolor="#FFFFFF"><font size=2>181=00</font></td>
  </tr>"""

html = soup(content, 'lxml')
trs = html.find_all('tr')

for row in trs:
    tds = row.find_all('td')

    for data in tds:
        print data.text.strip(), 

    print '\n'

输出:

Kevin 45.50/week 

Eliza 220=00/week 

sam 181=00 

首先找到所有<tr>与标签find_all('tr'),那么所有的<td>内部变量与find_all('td')的是,最后输出文本的内容tddata.text

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在 Python 中格式化 groupby 输出

来自分类Dev

如何在Python中的单个HTTP POST请求中格式化多个数据?

来自分类Dev

在Python中格式化请求查询时出错

来自分类Dev

在 Python 中格式化请求的头字典

来自分类Dev

如何在python中格式化列表输出

来自分类Dev

在Python中格式化CSV文件的输出

来自分类Dev

如何在python中格式化git show的输出

来自分类Dev

无法在python中格式化链接的输出

来自分类Dev

在Python中格式化JSON GET结果

来自分类Dev

在表中格式化println输出

来自分类Dev

在HTML输出中格式化文件

来自分类Dev

在Bash中格式化文本输出

来自分类Dev

在 fprintf 中格式化输出

来自分类Dev

如何在Webmatrix中格式化GET请求的URL

来自分类Dev

如何在打字稿中格式化来自http get Request的结果

来自分类Dev

在OpenLayers 3中格式化MousePosition控件的输出

来自分类Dev

使用挂钩在输出中格式化表格

来自分类Dev

在PyYAML中格式化自定义类输出

来自分类Dev

如何在Symfony中格式化JSON输出

来自分类Dev

使用printf在Java中格式化输出

来自分类Dev

如何在Maxima中格式化fortran输出

来自分类Dev

在C ++中格式化字符串的输出

来自分类Dev

在树中格式化输出文件的XML无效

来自分类Dev

在Java中格式化Date.toString()输出

来自分类Dev

在Java窗格中格式化输出

来自分类Dev

在Oracle数据库中格式化输出

来自分类Dev

在C#中格式化数组输出

来自分类Dev

在vb.net中格式化从DataGridView输出的文本

来自分类Dev

如何在Itemwriter中格式化输出日期?