浅析Python requests 模块
#代码知识 发布时间: 2026-01-12
Python requests 模块

requests 模块是我们使用的 python爬虫 模块 可以完成市场进80%的爬虫需求。
安装
pip install requests
使用
requests模块代码编写的流程:
- - 指定url
- - 发起请求
- - 获取响应对象中的数据
- - 持久化存储
-------------案例-------------------------
import requests
# 指定url
url="https://www.sogou.com/"
# 发起请求
response = requests.get(url)
# 获取响应对象中的数据
page_text = response.text
# 持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
fp.write()
-------------------------------------------
参数
# post 数据 response = requests.post(url=url,data=data,headers=headers) # get 数据 response = requests.get(url=url,data=data,headers=headers) # 返回二进制数据 response.content # 返回字符串数据 response.text # 返回json对象 response.json()
其他了解
1、该模块实现爬取数据前需要查找需要爬取数据的指定URL,可通过浏览器自带抓包功能。
# 浏览器抓取 Ajax 请求 F12 --> Network --> XHR --> Name --> Response
2、上面的headers参数是进行UA伪装为了反反爬
反爬机制:UA检测 --> UA伪装
3、下面是http我们爬包是常用的请求头参数
- accept: 浏览器通过这个头告诉服务器,他所支持的数据类型 - Accept-Charset:浏览器通过这个头告诉服务器,它支持那种字符集 - Accept-Encoding:浏览器通过这个头告诉服务器,支持的压缩格式 - Accept-Language:浏览器通过这个头告诉服务器,他的语言环境 - Host:浏览器同过这个头告诉服务器,想访问哪台主机 - If-ModifiedSince:浏览器通过这个头告诉服务器,缓存数据的时间 - Heferer:浏览器通过这个头告诉服务器,客户及时那个页面来的,防盗链 - Connection:浏览器通过这个头告诉服务器,请求完后是断开链接还是保持链接 - X-Requested-With:XMLHttpRequest 代表通过ajax方式进行访问 - User-Agent:请求载体的身份标识
以上就是浅析Python requests 模块的详细内容,更多关于Python requests 模块的资料请关注其它相关文章!
代码知识SEO上一篇 : IDEA配置jQuery, $符号不再显示黄色波浪线的问题
下一篇 : JAVA解决在@autowired,@Resource注入为null的情况
-
SEO外包最佳选择国内专业的白帽SEO机构,熟知搜索算法,各行业企业站优化策略!
SEO公司
-
可定制SEO优化套餐基于整站优化与品牌搜索展现,定制个性化营销推广方案!
SEO套餐
-
SEO入门教程多年积累SEO实战案例,从新手到专家,从入门到精通,海量的SEO学习资料!
SEO教程
-
SEO项目资源高质量SEO项目资源,稀缺性外链,优质文案代写,老域名提权,云主机相关配置折扣!
SEO资源
-
SEO快速建站快速搭建符合搜索引擎友好的企业网站,协助备案,域名选择,服务器配置等相关服务!
SEO建站
-
快速搜索引擎优化建议没有任何SEO机构,可以承诺搜索引擎排名的具体位置,如果有,那么请您多注意!专业的SEO机构,一般情况下只能确保目标关键词进入到首页或者前几页,如果您有相关问题,欢迎咨询!