从字符串中提取信息

山塔诺

以下代码正在运行,但是我无法提取所需的信息。我可以使用汤还是需要正则表达式?

from bs4 import BeautifulSoup
import urllib2
mynumber='1234567890'
url="http://www.nccptrai.gov.in/nccpregistry/saveSearchSub.misc?phoneno="+mynumber
page=urllib2.urlopen(url)
soup = BeautifulSoup(page.read())   

table = soup.findAll("table")[1]
myl=[item.text.strip() for item in table.find_all('td')] 
import re
re.findall(r'is:\s*[^,]*' , myl[1])

预期的输出是在第一个切片的第一个字符串中提到的4个参数。

['2014-08-07 15:50:00', 'Andhra Pradesh', 'Unitech', '0']

(请注意,日期已更改为YMD)

返回的字符串看起来像这样...

[u'is:\n 31-10-2009 01:11\n\n\nService Area : \n Mumbai\n\n\nService Provider :\n Idea\n\n\n\n\n\nYour Preference is :0']
ec

我将依靠The number is registered in NCPR标头(它在tdclass标记中GridHeader)并通过find_next_siblings()以下行获取下一行

import urllib2
from bs4 import BeautifulSoup

mynumber = '1234567890'
url = "http://www.nccptrai.gov.in/nccpregistry/saveSearchSub.misc?phoneno=" + mynumber

soup = BeautifulSoup(urllib2.urlopen(url))

header = soup.find('td', class_='GridHeader')

result = []
for row in header.parent.find_next_siblings('tr'):
    cells = row.find_all('td')
    try:
        result.append(cells[2].get_text(strip=True))
    except IndexError:
        continue
print result

印刷:

[u'07-08-2014 15:50', u'Andhra Pradesh', u'Unitech', u'0']

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

从字符串中提取信息

来自分类Dev

从字符串中提取信息

来自分类Dev

从字符串中提取信息

来自分类Dev

如何从字符串中提取信息并输出?

来自分类Dev

Java算法从字符串中提取信息

来自分类Dev

从Shell脚本中的字符串中提取信息

来自分类Dev

从 unicode 字符串中的列表中提取信息

来自分类Dev

使用正则表达式从字符串中提取信息

来自分类Dev

正则表达式的替代方法,用于从字符串中提取信息

来自分类Dev

R正则表达式从字符串中提取信息

来自分类Dev

在bash中使用正则表达式从字符串中提取信息

来自分类Dev

正则表达式的替代方法,用于从字符串中提取信息

来自分类Dev

R正则表达式从字符串中提取信息

来自分类Dev

从R中以点为分隔符的字符串中提取信息

来自分类Dev

使用R中的正则表达式从字符串中提取信息

来自分类Dev

从字符串中提取版本信息

来自分类Dev

从字符串中提取定量信息

来自分类Dev

从字符串提取信息到数组

来自分类Dev

如何使用python从字符串中提取信用卡子字符串

来自分类Dev

从日期字符串中提取小时信息

来自分类Dev

从json字符串获取信息?

来自分类Dev

从字符串中读取信息

来自分类Dev

从字典中提取信息

来自分类Dev

从日志中提取信息

来自分类Dev

从文件中提取信息

来自分类Dev

从列中提取信息

来自分类Dev

从文本中提取信息

来自分类Dev

从字符串中提取特定字符

来自分类Dev

从字符串中提取字符