Python,尝试解析html以获取电子邮件地址

猴子涂鸦

我正在使用beautifulsoup来获取电子邮件地址,但是我遇到了问题。我不知道从哪里开始解析,以获取电子邮件地址。

> #input:     url
> #output:    address
> 
> def urlSC(url):
>     soup = BeautifulSoup(urllib2.urlopen(url).read())
>     #word =  soup.prettify() 
>     word = soup.find_all('a')
>     print word
>     return word

输出:

>     [<a href="default.aspx"><img alt="·Î°í" border="0" src="image/logo.gif"/></a>, <a href="http://www.ctodayusa.com"><img
> border="0" src="image/ctodayusa.jpg"><a></a>
>     </img></a>, <a></a>, <a href="mailto:[email protected]" id="hlEmail">[email protected]</a>, <a id="hlHomepage"></a>, <a
> href="javascript:img_up('','','');"><img border="0" class="img"
> src="upload/" vspace="10" width="1"/></a>, <a
> href="javascript:img_up('','','');"><img border="0" class="img"
> src="upload/" vspace="10" width="1"/></a>, <a
> href="javascript:openWin('http://maps.yahoo.com/maps_result?addr=2100
> De armoun Rd.&amp;csz=99515&amp;country=us')" id="hlMap"><img
> border='0"' src="images/globe.gif"> 위치</img></a>, <a
> href="javascript:print()"><img border="0" src="images/printer.gif">
> 프린트</img></a>, <a href="javascript:mail_go('[email protected]',
> '2Y5E9%2bk0h%2b4P%2f0H3jEJTq9VUG%2f0gaj40')" id="hlSendMail"><img
> border="0" src="images/mails.gif"> 메일보내기</img></a>, <a
> href="javascript:history.go(-1)"><img border="0"
> src="images/list.gif">
>     </img></a>, <a href="UpdateAddress.aspx?OrgID=4102" id="hlModify"><img alt="" border="0" src="Images/Modify.gif"/></a>]

我想要此电子邮件:[email protected]

ec

a通过id获取元素,然后mailto:href属性值中提取所有内容

link = soup.find('a', id='hlEmail')
print link['href'][7:]

演示:

>>> from bs4 import BeautifulSoup
>>> import urllib2
>>> url = "http://www.koreanchurchyp.com/ViewDetail.aspx?OrgID=4102"
>>> soup = BeautifulSoup(urllib2.urlopen(url))
>>> link = soup.find('a', id='hlEmail')
>>> print link['href'][7:]
rev_han seven seven seven at yahoo.com  #  obfuscated intentionally

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Python,尝试解析html以获得电子邮件地址

来自分类Dev

VBA函数解析电子邮件正文以获取电子邮件地址,并写入Excel

来自分类Dev

使用Laravel解析电子邮件地址

来自分类Dev

从 PHP 中的完整电子邮件地址解析名称

来自分类Dev

我如何从python电子邮件对象获取实际的电子邮件地址作为字符串

来自分类Dev

如何从python电子邮件对象获取实际的电子邮件地址作为字符串

来自分类Dev

从SAMaccount获取用户的电子邮件地址

来自分类Dev

从LinkedIn API获取电子邮件地址

来自分类Dev

如何从推特获取电子邮件地址

来自分类Dev

获取发件人电子邮件地址

来自分类Dev

如何从vk.api获取电子邮件地址?

来自分类Dev

从评论中获取Facebook用户的电子邮件地址

来自分类Dev

获取Facebook用户的公共电子邮件地址

来自分类Dev

从附件获取发件人电子邮件地址

来自分类Dev

通过C#获取Outlook电子邮件地址

来自分类Dev

获取发件人电子邮件地址

来自分类Dev

获取Microsoft Live帐户的电子邮件地址

来自分类Dev

PHP代码从LDAP获取电子邮件地址

来自分类Dev

从SSMS获取AD电子邮件地址

来自分类Dev

使用ContactsApp获取电子邮件地址

来自分类Dev

从意图过滤器获取电子邮件地址

来自分类Dev

从电子邮件地址获取扩展名

来自分类Dev

从收件人对象获取电子邮件地址

来自分类Dev

获取 Microsoft 用户的电子邮件地址

来自分类Dev

Outlook 帐户 - 如何获取 Exchange 电子邮件地址?

来自分类Dev

尝试打印特定电子邮件地址中收到的电子邮件数量

来自分类Dev

如何使用Python MAPI从Outlook获取“收件人”名称和电子邮件地址

来自分类Dev

使用mailcore(iOS),如何从特定电子邮件地址获取所有电子邮件?

来自分类Dev

使用mailcore(iOS),如何从特定电子邮件地址获取所有电子邮件?

Related 相关文章

  1. 1

    Python,尝试解析html以获得电子邮件地址

  2. 2

    VBA函数解析电子邮件正文以获取电子邮件地址,并写入Excel

  3. 3

    使用Laravel解析电子邮件地址

  4. 4

    从 PHP 中的完整电子邮件地址解析名称

  5. 5

    我如何从python电子邮件对象获取实际的电子邮件地址作为字符串

  6. 6

    如何从python电子邮件对象获取实际的电子邮件地址作为字符串

  7. 7

    从SAMaccount获取用户的电子邮件地址

  8. 8

    从LinkedIn API获取电子邮件地址

  9. 9

    如何从推特获取电子邮件地址

  10. 10

    获取发件人电子邮件地址

  11. 11

    如何从vk.api获取电子邮件地址?

  12. 12

    从评论中获取Facebook用户的电子邮件地址

  13. 13

    获取Facebook用户的公共电子邮件地址

  14. 14

    从附件获取发件人电子邮件地址

  15. 15

    通过C#获取Outlook电子邮件地址

  16. 16

    获取发件人电子邮件地址

  17. 17

    获取Microsoft Live帐户的电子邮件地址

  18. 18

    PHP代码从LDAP获取电子邮件地址

  19. 19

    从SSMS获取AD电子邮件地址

  20. 20

    使用ContactsApp获取电子邮件地址

  21. 21

    从意图过滤器获取电子邮件地址

  22. 22

    从电子邮件地址获取扩展名

  23. 23

    从收件人对象获取电子邮件地址

  24. 24

    获取 Microsoft 用户的电子邮件地址

  25. 25

    Outlook 帐户 - 如何获取 Exchange 电子邮件地址?

  26. 26

    尝试打印特定电子邮件地址中收到的电子邮件数量

  27. 27

    如何使用Python MAPI从Outlook获取“收件人”名称和电子邮件地址

  28. 28

    使用mailcore(iOS),如何从特定电子邮件地址获取所有电子邮件?

  29. 29

    使用mailcore(iOS),如何从特定电子邮件地址获取所有电子邮件?

热门标签

归档