教程集 > Python编程 > Python入门 > 正文 python3中编码如何获取网页?

python3中编码如何获取网页?

发布时间：2020-12-08 编辑：jiaochengji.com

教程集为您提供python3中编码如何获取网页?等资源，欢迎您收藏本站，我们将为您提供最新的python3中编码如何获取网页?资源

学了python后，之前一些我们常用的方法，也可以换一种思路用python中的知识来解决。相信操作出来后，能收获一大批小粉丝们。就像我们没学习编程之前，看到那种大神都是可望而不可即。今天我们就之前简单获取网页的这种操作用python中的编码来解决，大家可以自行体会一下两者的不同。

1. encoding和apparent_encoding

import scrapy
url="https://www.ygdy8.net/html/gndy/dyzz/index.html"
re=requests.get(url)
#获取响应头Content-Type的charset值，有的网站没有charset字段，就可能使用默认的 ISO-8859-1
print(re.encoding)
#apparent_encoding就是获取网站真实的编码
print(re.apparent_encoding)

2. 处理方案

直接用r.encoding = ‘xxx’

re.encoding='utf-8'

3. requests的text() 跟 content() 有什么区别

re.text返回的是处理过的Unicode型的数据，

而使用re.content返回的是bytes型的原始数据。

4. 爬虫拿到的HTML和浏览器中的源码不相同时

通过下载源码对比

import requests
url = 'https://www.ygdy8.net/html/gndy/dyzz/index.html'
r  = requests.get(url)
r.encoding = r.apparent_encoding
html = r.text
with open('test.html','w',encoding='utf8') as f:
f.write(html)

以上就是python3编码获取网页的一些操作方法，小伙伴们学会没？当然获取网页的方法比较多，这里就不一一介绍，有机会的话小编会在后续的文章中更新一下。学习了python之后，编程应用于生活会越来越多，帮助我们简化生活的繁琐事情。

您可能感兴趣的文章：
2019年python学3还是2
python3中编码如何获取网页?
Python之字符编码汇总
 linux如何安装python3
python3兼容python2吗
 获取当前页面的完整URL的php代码有哪些
 python写爬虫出现乱码怎么回事
 如何解决mac python3 中文乱码
 同一页面放多个百度编辑器 Ueditor 并用PHP获取 Ueditor 的值的实例
 python3爬虫入门：常用网络爬虫模块和技术

上一篇：python django框架用的人多吗? 下一篇：python3中json编码是什么？怎么用？

[关闭]

python3中编码如何获取网页?

最近更新

浏览排行