强制转换为Unicode:需要字符串或缓冲区,找到标记

卡萨诺娃

我试图进行网页抓取,并使用以下代码:

import mechanize
from bs4 import BeautifulSoup

url = "http://www.indianexpress.com/news/indian-actions-discriminating-against-us-exp/1131015/"
br =  mechanize.Browser()
htmltext = br.open(url).read()
articletext = ""
soup = BeautifulSoup(htmltext)
for tag in soup.findAll('p'):
    articletext += tag.contents[0]
print articletext

但是我收到以下错误:

Traceback (most recent call last):
  File "C:/Python27/crawler/express.py", line 15, in <module>
    articletext += tag.contents[0]
TypeError: coercing to Unicode: need string or buffer, Tag found

有人可以帮我解决这个错误,我是Python编程的新手。

马丁·彼得斯(Martijn Pieters)

对于<p>找到的至少一个标签,tag.contents[0]Tag对象,而不是文本。对于您找到的特定URL,它是一个<hr>标记:

>>> tag
<p><hr> </hr></p>

为什么不使用tag.text代替tag.contents[0]

for tag in soup.findAll('p'):
    articletext += tag.text

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

TypeError:强制转换为Unicode:需要字符串或缓冲区,找到文件

来自分类Dev

TypeError:强制转换为Unicode:需要字符串或缓冲区,找到列表

来自分类Dev

TypeError:强制转换为Unicode:需要字符串或缓冲区,找到int

来自分类Dev

Python TypeError:强制转换为Unicode:需要字符串或缓冲区,找到元组

来自分类Dev

TypeError:强制转换为Unicode:需要字符串或缓冲区,找到ResultSet

来自分类Dev

TypeError:强制转换为Unicode:需要字符串或缓冲区,找到文件(open()函数)

来自分类Dev

TypeError:强制转换为Unicode:需要字符串或缓冲区,找到了PosixPath

来自分类Dev

强制转换为Unicode:需要字符串或缓冲区,找到列表

来自分类Dev

TypeError:强制转换为Unicode:需要字符串或缓冲区,找到文件(open()函数)

来自分类Dev

TypeError:强制转换为Unicode:需要字符串或缓冲区,找到WSGIRequest

来自分类Dev

Python:TypeError: 强制转换为 Unicode: 需要字符串或缓冲区,找到文件

来自分类Dev

Django模型:TypeError:强制转换为Unicode:需要字符串或缓冲区,已找到用户

来自分类Dev

Boto3 S3:TypeError:强制转换为Unicode:需要字符串或缓冲区,找到文件

来自分类Dev

强制转换为Unicode:需要字符串或缓冲区,找到int-Django Rest Framework

来自分类Dev

熊猫to_csv():TypeError:强制转换为Unicode:需要字符串或缓冲区,找到列表

来自分类Dev

类型错误:强制转换为 Unicode:需要字符串或缓冲区,找到 _sre.SRE_Pattern

来自分类Dev

TypeError:强制转换为Unicode,需要字符串或缓冲区,找不到NoneType

来自分类Dev

Python MQTT:TypeError:强制转换为Unicode:需要字符串或缓冲区,发现布尔

来自分类Dev

引发异常时出现“ TypeError:强制转换为Unicode:需要字符串或缓冲区”

来自分类Dev

Django 错误强制转换为 Unicode:需要字符串或缓冲区

来自分类Dev

错误:强制转换为Unicode:需要字符串或缓冲区,很长一段时间

来自分类Dev

强制转换为 Unicode:需要字符串或缓冲区,NoneType 发现一切似乎都很好,但仍然出现此错误

来自分类Dev

而将字符缓冲区转换为字符串是需要 strdup

来自分类Dev

如何将字符串转换为二进制缓冲区?

来自分类Dev

将字节缓冲区转换为UTF8字符串

来自分类Dev

将固定大小的缓冲区(字节数组)转换为字符串

来自分类Dev

如何将tkFileDialog.asksaveasfilename()转换为缓冲区字符串?

来自分类Dev

JavaScript-将数组缓冲区转换为字符串

来自分类Dev

在perl中将JSON缓冲区转换为字符串

Related 相关文章

  1. 1

    TypeError:强制转换为Unicode:需要字符串或缓冲区,找到文件

  2. 2

    TypeError:强制转换为Unicode:需要字符串或缓冲区,找到列表

  3. 3

    TypeError:强制转换为Unicode:需要字符串或缓冲区,找到int

  4. 4

    Python TypeError:强制转换为Unicode:需要字符串或缓冲区,找到元组

  5. 5

    TypeError:强制转换为Unicode:需要字符串或缓冲区,找到ResultSet

  6. 6

    TypeError:强制转换为Unicode:需要字符串或缓冲区,找到文件(open()函数)

  7. 7

    TypeError:强制转换为Unicode:需要字符串或缓冲区,找到了PosixPath

  8. 8

    强制转换为Unicode:需要字符串或缓冲区,找到列表

  9. 9

    TypeError:强制转换为Unicode:需要字符串或缓冲区,找到文件(open()函数)

  10. 10

    TypeError:强制转换为Unicode:需要字符串或缓冲区,找到WSGIRequest

  11. 11

    Python:TypeError: 强制转换为 Unicode: 需要字符串或缓冲区,找到文件

  12. 12

    Django模型:TypeError:强制转换为Unicode:需要字符串或缓冲区,已找到用户

  13. 13

    Boto3 S3:TypeError:强制转换为Unicode:需要字符串或缓冲区,找到文件

  14. 14

    强制转换为Unicode:需要字符串或缓冲区,找到int-Django Rest Framework

  15. 15

    熊猫to_csv():TypeError:强制转换为Unicode:需要字符串或缓冲区,找到列表

  16. 16

    类型错误:强制转换为 Unicode:需要字符串或缓冲区,找到 _sre.SRE_Pattern

  17. 17

    TypeError:强制转换为Unicode,需要字符串或缓冲区,找不到NoneType

  18. 18

    Python MQTT:TypeError:强制转换为Unicode:需要字符串或缓冲区,发现布尔

  19. 19

    引发异常时出现“ TypeError:强制转换为Unicode:需要字符串或缓冲区”

  20. 20

    Django 错误强制转换为 Unicode:需要字符串或缓冲区

  21. 21

    错误:强制转换为Unicode:需要字符串或缓冲区,很长一段时间

  22. 22

    强制转换为 Unicode:需要字符串或缓冲区,NoneType 发现一切似乎都很好,但仍然出现此错误

  23. 23

    而将字符缓冲区转换为字符串是需要 strdup

  24. 24

    如何将字符串转换为二进制缓冲区?

  25. 25

    将字节缓冲区转换为UTF8字符串

  26. 26

    将固定大小的缓冲区(字节数组)转换为字符串

  27. 27

    如何将tkFileDialog.asksaveasfilename()转换为缓冲区字符串?

  28. 28

    JavaScript-将数组缓冲区转换为字符串

  29. 29

    在perl中将JSON缓冲区转换为字符串

热门标签

归档