爬虫学习

r = request.get(url)

r (response)的五个属性
status_code 200表示成功,404表示失败
text 响应内容的字符串形式,即,url对应的网页内容
encoding 内容编码方式
apparent_encoding 备选编码方式

如果header中不存在charset,则认为编码为ISO-8859-1但不能解析中文
content 二进制编码内容