强制转换为Unicode：需要字符串或缓冲区，找到标记

casanova 发表于 Dev

卡萨诺娃

我试图进行网页抓取，并使用以下代码：

import mechanize
from bs4 import BeautifulSoup

url = "http://www.indianexpress.com/news/indian-actions-discriminating-against-us-exp/1131015/"
br =  mechanize.Browser()
htmltext = br.open(url).read()
articletext = ""
soup = BeautifulSoup(htmltext)
for tag in soup.findAll('p'):
    articletext += tag.contents[0]
print articletext

但是我收到以下错误：

Traceback (most recent call last):
  File "C:/Python27/crawler/express.py", line 15, in <module>
    articletext += tag.contents[0]
TypeError: coercing to Unicode: need string or buffer, Tag found

有人可以帮我解决这个错误，我是Python编程的新手。

马丁·彼得斯（Martijn Pieters）

对于<p>找到的至少一个标签，tag.contents[0]是Tag对象，而不是文本。对于您找到的特定URL，它是一个<hr>标记：

>>> tag
<p><hr> </hr></p>

为什么不使用tag.text代替tag.contents[0]？

for tag in soup.findAll('p'):
    articletext += tag.text

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-5

我来说两句

0条评论

登录后参与评论

上一篇：numpy：广播布尔数组ndarray

来自分类Dev

TypeError：强制转换为Unicode：需要字符串或缓冲区，找到文件

来自分类Dev

TypeError：强制转换为Unicode：需要字符串或缓冲区，找到列表

来自分类Dev

TypeError：强制转换为Unicode：需要字符串或缓冲区，找到int

来自分类Dev

Python TypeError：强制转换为Unicode：需要字符串或缓冲区，找到元组

来自分类Dev

TypeError：强制转换为Unicode：需要字符串或缓冲区，找到ResultSet

来自分类Dev

TypeError：强制转换为Unicode：需要字符串或缓冲区，找到文件（open（）函数）

来自分类Dev

TypeError：强制转换为Unicode：需要字符串或缓冲区，找到了PosixPath

来自分类Dev

强制转换为Unicode：需要字符串或缓冲区，找到列表

来自分类Dev

TypeError：强制转换为Unicode：需要字符串或缓冲区，找到文件（open（）函数）

来自分类Dev

TypeError：强制转换为Unicode：需要字符串或缓冲区，找到WSGIRequest

来自分类Dev

Python:TypeError: 强制转换为 Unicode: 需要字符串或缓冲区，找到文件

来自分类Dev

Django模型：TypeError：强制转换为Unicode：需要字符串或缓冲区，已找到用户

来自分类Dev

Boto3 S3：TypeError：强制转换为Unicode：需要字符串或缓冲区，找到文件

来自分类Dev

强制转换为Unicode：需要字符串或缓冲区，找到int-Django Rest Framework

来自分类Dev

熊猫to_csv（）：TypeError：强制转换为Unicode：需要字符串或缓冲区，找到列表

来自分类Dev

类型错误：强制转换为 Unicode：需要字符串或缓冲区，找到 _sre.SRE_Pattern

来自分类Dev

TypeError：强制转换为Unicode，需要字符串或缓冲区，找不到NoneType

来自分类Dev

Python MQTT：TypeError：强制转换为Unicode：需要字符串或缓冲区，发现布尔

来自分类Dev

引发异常时出现“ TypeError：强制转换为Unicode：需要字符串或缓冲区”

来自分类Dev

Django 错误强制转换为 Unicode：需要字符串或缓冲区

来自分类Dev

错误：强制转换为Unicode：需要字符串或缓冲区，很长一段时间

来自分类Dev

强制转换为 Unicode：需要字符串或缓冲区，NoneType 发现一切似乎都很好，但仍然出现此错误

来自分类Dev

而将字符缓冲区转换为字符串是需要 strdup

来自分类Dev

如何将字符串转换为二进制缓冲区？

来自分类Dev

将字节缓冲区转换为UTF8字符串

来自分类Dev

将固定大小的缓冲区（字节数组）转换为字符串

来自分类Dev

如何将tkFileDialog.asksaveasfilename（）转换为缓冲区字符串？

来自分类Dev

JavaScript-将数组缓冲区转换为字符串

来自分类Dev

在perl中将JSON缓冲区转换为字符串

Related 相关文章

文章