Python第三方pycurl库用户指南

Python的第三方库pycurl用户指南,用法详解笔记
marry

#设定链接的地址
c.setopt(pycurl.URL,myurl)

#设置写的回调,所有输出都定向到b.write中。
c.setopt(pycurl.WRITEFUNCTION,b.write)
c.setopt(pycurl.FOLLOWLOCATION, 1)

# 存放结果用
f = cStringIO.StringIO()

#最大重定向次数,可以预防重定向陷阱
c.setopt(pycurl.MAXREDIRS, 5)

#连接超时设置
c.setopt(pycurl.CONNECTTIMEOUT, 60)
c.setopt(pycurl.TIMEOUT, 300)

#访问,阻塞到访问结束
c.perform()

#打印出 200(HTTP状态码)
print c.getinfo(pycurl.HTTP_CODE)

#输出网页的内容
print html.getvalue()

#输出网页类型
print "Content-type:", c.getinfo(c.CONTENT_TYPE)

#设置http的包头信息。注意,长度的字符传是用于put或者post等方法传参数的
c.setopt(pycurl.HTTPHEADER,['Content-Type: application/json','Content-Length: '+str(len(remove_str))])

#设置封装方法,有put,post,get,delete等多种方法
c.setopt(pycurl.CUSTOMREQUEST,"DELETE")

#设置重定向次数
c.setopt(pycurl.MAXDEDIRS,5)

#设置链接超时,设置下载超时
c.setopt(pycurl.CONNECTTIMEOUT,60)
c.setopt(pycurl.TIMEOUT,600)

#设置代理浏览器
c.setopt(pycurl.USERAGENT,"xxxx")

#开启包头输出
c.setopt(pycurl.HEADER,1)

#将包头输出到header_str.write流中
c.setopt(pycurl.HEADERFUNCTION,header_str.write)

#执行curl命令
c.perform()

#答应返回值
print c.getinfo(c.HTTP_CODE)

#打印重定向URL
Print c.getinfo(c.EFFECTIVE_URL)

# 处理Post数据
login_info = {'email': user_name, 'password' : psw}
c.setopt(c.POSTFIELDS,urllib.urlencode(login_info))

# 处理cookie
c.setopt(c.COOKIEJAR, "_login.txt")

#设定user-agent. 有些服务器会检查这个值.
c.setopt(pycurl.USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)")

# 设置代理
c.setopt(c.PROXY, https://...@..:1234)

这个笔记是从GOGO闯那里扒过来的,大神的博客是https://www.kaopuseo.com/
这个库个人感觉有点啰嗦,但这些都是语法上的东西,也只好死记硬背,另外也方便自己忘的时候用,顺便截个图:
pycurl库 pycurl模块

Leave a Comment