Python Requests模块快速入门
requests是python的一个HTTP客户端库,跟urllib,urllib2类似。它比 urllib 更加方便,可以节约我们大量的工作,它比 urllib 更加 Pythoner。
安装 Requests
通过pip安装
$ pip install requests
或者,下载代码后安装:
$ wget https://github.com/requests/requests/tarball/master $ mv master requests.tgz $ tar xzf requests.tgz $ cd requests-requests-3dc84cd $ python setup.py install
发送请求
使用Requests发送网络请求非常简单。
>>> import requests #导入Requests模块 >>> result = requests.get('http://www.pythontab.com') # 生成Response 对象 >>> result.status_code # 返回码 200 >>> result.headers['content-type'] # 返回头部信息 'text/html; charset=utf8' >>> result.encoding # 编码信息 'utf-8' >>> result.content #内容部分
为URL传递参数
你也许经常想为URL的查询字符串(query string)传递某种数据。如果你是手工构建URL,那么数据会以键/值 对的形式置于URL中,跟在一个问号的后面。例如,www.pythontab.com?version=python3 。 Requests允许你使用 params 关键字参数,以一个字典来提供这些参数。举例来说,如果你想传递 version=python3 和 keywords=pythontab 到 www.pythontab.com ,那么你可以使用如下代码:
>>> data = {'version': 'python3', 'keywords': 'pythontab'} >>> result = requests.get("http://www.pythontab.com", params=data) >>> print result.status_code 200
原始响应内容
在罕见的情况下你可能想获取来自服务器的原始套接字响应,那么你可以访问 r.raw 。 如果你确实想这么干,那请你确保在初始请求中设置了 stream=True 。具体的你可以这么做:
>>> result = requests.get('http://www.pythontab.com', stream=True) >>> result.raw <requests.packages.urllib3.response.HTTPResponse object at 0x101194810> >>> result.raw.read(10) '\x1f\x8b\x08\x00\x00\x00\x00\x00\x00\x03'
定制请求头
如果你想为请求添加HTTP头部,只要简单地传递一个 dict 给 headers 参数就可以了。
例如,在前一个示例中我们没有指定content-type:
>>> import requests >>> url = 'http://www.pythontab.com' >>> data = {'version': 'python3', 'keywords': 'pythontab'} >>> headers = {'content-type': 'application/json'} >>> result = requests.post(url, data=json.dumps(data), headers=headers)
错误与异常
遇到网络问题(如:DNS查询失败、拒绝连接等)时,Requests会抛出一个ConnectionError 异常。
遇到罕见的无效HTTP响应时,Requests则会抛出一个 HTTPError 异常。
若请求超时,则抛出一个 Timeout 异常。
若请求超过了设定的最大重定向次数,则会抛出一个 TooManyRedirects 异常。
所有Requests显式抛出的异常都继承自 requests.exceptions.RequestException 。
其他常用方法
result.content #获取二进制响应内容
result.json() #JSON响应内容
result.headers #响应头内容
result.cookies #cookie内容
result.history #请求历史