本文用作记录,在使用python过程中遇到的一些奇技淫巧,有些代码是本人所写,有些则是python内置函数,有些则取之互联网。在此记录,只为备份以及遗忘时方便查找。
本文将会持续更新,内容仅限记录一些常用好用却又永远记不住的代码或者模块。
控制台操作
控制台不闪退
os.system('pause')
获取控制台大小
rows, columns = os.popen('stty size', 'r').read().split()
输入输出控制
解决输入提示中文乱码问题
raw_input(unicode('请输入文字','utf-8').encode('gbk'))
格式化输出
print a.prettify()
接受多行输入
text="" while 1: data=raw_input(">>") if data.strip()=="stop": break text+="%s\n" % data print text --------------------------- >>1 >>2 >>3 >>stop 同行输出 Print '%s' % a, Print '%s \r' % a
标准输入输出
sys.stdout.write("input") 标准输入 sys.stdout.flush() 刷新缓冲区
print的功能与sys.stdout.write类似,因为2.x中print默认就是将输出指定到标准输出中(sys.stdout)。
颜色控制
控制台颜色控制(适用于windows)
WConio.textcolor(WConio.YELLOW) print "yellow" WConio.textcolor(WConio.BLUE) print "blue"
输出颜色控制(全平台)
red = '\033[1;31m' green = '\033[1;32m' yellow = '\033[1;33m' white = '\033[1;37m' reset = '\033[0m’ print red+"color is red"+reset print green+"color is green"+reset
进度条控制
方案一
from __future__ import division import sys,time j = '#' for i in range(1,61): j += '#' sys.stdout.write(str(int((i/60)*100))+'% ||'+j+'->'+"\r") sys.stdout.flush() time.sleep(0.1)
方案二
import sys import time for i in range(1,61): sys.stdout.write('#'+'->'+"\b\b") sys.stdout.flush() time.sleep(0.5)
方案三
from progressbar import * import time import os rows, columns = os.popen('stty size', 'r').read().split() #获取控制台size console_width=int(columns) total = 10 progress = ProgressBar() def test(): ''' 进度条函数,记录进度 ''' for i in progress(range(total)): test2() def test2(): ''' 执行函数,输出结果 ''' content="nMask'Blog is https://thief.one" sys.stdout.write("\r"+content+" "*(console_width-len(content))) time.sleep(1) sys.stdout.flush() test()
更多高级用法可以使用progressbar模块。
系统操作
系统信息
获取python安装路径
from distutils.sysconfig import get_python_lib print get_python_lib
获取当前python版本
sys.version_info sys.version
获取当前时间
c=time.ctime()
#自定义格式输出
ISOTIMEFORMAT=’%Y-%m-%d %X’ time.strftime( ISOTIMEFORMAT, time.localtime() )
查看系统环境变量
os.environ["PATH"]
获取系统磁盘
os.popen("wmic VOLUME GET Name")
获取当前路径(包括当前py文件名)
os.path.realpath(__file__)
当前平台使用的行终止符
os.linesep
获取终端大小
rows, columns = os.popen('stty size', 'r').read().split() #python3以后存在可以使用os os.get_termial_size()
退出程序
网络操作
域名解析为ip
ip= socket.getaddrinfo(domain,'http')[0][4][0]
获取服务器版本信息
sUrl = 'https://www.163.com' sock = urllib2.urlopen(sUrl) sock.headers.values()
文件操作
open函数,使用wb、rb代替w、r
with open("test.txt","wr") as w: w.write("test")
这种写法可以兼容python2/3。
输出一个目录下所有文件名称
def search(paths): if os.path.isdir(paths): #如果是目录 files=os.listdir(paths) #列出目录中所有的文件 for i in files: i=os.path.join(paths,i) #构造文件路径 search(i) #递归 elif os.path.isfile(paths): #如果是文件 print paths #输出文件名
文件查找
import glob print glob.glob(r"E:/*.txt") #返回的是一个列表 查找文件只用到三个匹配符:”*”, “?”, “[]“ ”*”匹配0个或多个字符; ”?”匹配单个字符; ”[]“匹配指定范围内的字符,如:[0-9]匹配数字。
查找指定名称的文件夹的路径
def search(paths,file_name,tag,lists): if os.path.isdir(paths): #如果是目录 if file_name==tag: #如果目录名称为tag lists.append(paths) #将该路径添加到列表中 else: #如果目录名称不为tag try: files_list=os.listdir(paths) #列出目录中所有的文件 for file_name in files_list: path_new=os.path.join(paths,file_name) #构造文件路径 search(path_new,file_name,tag,lists) #递归 except: #遇到特殊目录名时会报错 pass elif os.path.isfile(paths): #如果是文件 pass return lists
数据操作
判断数据类型
isinstance("123",(int,long,float,complex)
字符串(string)
去掉小数点后面的数字
a=1.21311 b=Int(math.floor(a))
字符串倒置
>>> a = "codementor" >>> a[::-1]
字符串首字母变大写
info = 'ssfef' print info.capitalize() print info.title()
返回一个字符串居中,并使用空格填充至长度width的新字符串。
"center string".center(width) #width设置为控制台宽度,可控制输出的字符串居中。
列举所有字母
print string.ascii_uppercase 所有大写字母 print string. ascii_lowercase 所有小写字母 print string.ascii_letters 所有字母(包括大小写)
列表(list)
列表去重
ids = [1,4,3,3,4,2,3,4,5,6,1] ids = list(set(ids))
判断列表为空
a=[] if not a:
列表运算
a=[1,2,3] b=[3,4,5] set(a)&set(b) 与 set(a)|set(b) 或 set(a)-set(b) 非
单列表元素相加
a = ["Code", "mentor", "Python", "Developer"] >>> print " ".join(a) Code mentor Python Developer
多列表元素分别相加
list1 = ['a', 'b', 'c', 'd'] list2 = ['p', 'q', 'r', 's'] >>> for x, y in zip(list1,list2): print x, y ap bq cr ds
将嵌套列表转换成单一列表
a = [[1, 2], [3, 4], [5, 6]] >>> import itertools >>> list(itertools.chain.from_iterable(a)) [1, 2, 3, 4, 5, 6]
列表内元素相加
a=[1,2,3](数字) sum(a)
产生a-z的字符串列表
map(chr,range(97,123))
列表复制
a=[1,2,3] b=a
当对b进行操作时,会影响a的内容,因为共用一个内存指针,b=a[:] 这样就是单独复制一份了。
列表推导
if+else配合列表解析
[i if i >5 else -i for i in range(10)]
多层嵌套列表
a=[[1,2],[3,4]] b=[for j in i for i in a] print b [1,2,3,4]
生成一个生成器,调用next方法,可以减少内存开支。
a=(i else i+1 for i in b if i==1)
字典推导
更换key与value位置
dict={"a":1,"b":2} b={value:key for key value in dict.items()}
字典操作(dict)
筛选出值重复的key
list1=self.dict_ip.items() ddict=defaultdict(list) for k,v in list1: ddict[v].append(k) list2=[(i,ddict[i]) for i in ddict if len(ddict[i])>1] dict_ns=dict(list2)
字典排序(py2)
file_dict={"a":1,"b":2,"c":3} file_dict_new=sorted(file_dict.iteritems(), key=operator.itemgetter(1),reverse=True) ##字典排序,reverse=True由高到低,itemgetter(1)表示按值排序,为0表示按key排序。
字典值判断
b={"a":1} a=b.get("a","") #如果不存在a,则返回”” c=a if a else 0 #如果存在a,则返回a,不然返回0
模块操作
导入模块时,设置只允许导入的属性或者方法。
fb.py: ----------------------- __all__=["a","b"] a="123" c="2345" def b(): print “123” ----------------------- from fb import * 可以导入__all__内定义的变量,a跟b()可以导入,c不行。如果不定义__all__则所有的都可以导入。
导入上级目录下的包
sys.path.append("..") from spider.spider_ import spider_
导入外部目录下的模块
需要在目标目录下创建__init__.py文件,内容随便
增加模块属性
有时候源代码中,我们需要写上自己的名字以及版本介绍信息,可以用__name__的方式定义。 a.py: #! -*- coding:utf-8 -*- __author__="nMask"
然后当我们导入a这个模块的时候,可以输出dir(a)看看
>>> import p >>> print dir(p) ['__author__', '__builtins__', '__doc__', '__file__', '__name__', '__package__'] >>> print p.__author__ nmask
动态加载一个目录下的所有模块
目录: ---test ----a.py ----b.py ---c.py c.py导入test下面的所有模块: for path in ["test"]: for i in list(set([os.path.splitext(i)[0] for i in os.listdir("./"+path)])): if i!="__init__" and i!=".DS_Store": ##排除不必要的文件 import_string = "import path+"."+i+" exec import_string #执行字符串中的内容
函数操作
eval/exec
def test(content): print content exec(“test(‘abc')”)
输出:abc
说明:exec函数没有返回值
def test(content): return content print eval(“test(‘abc')”)
输出:abc
说明:eval函数有返回值
装饰器函数
输出当前时间装饰器
def current_time(aclass): def wrapper(): print "[Info]NowTimeis:",time.ctime() return aclass() return wrapper
itertools迭代器
p=product(["a","b","c","d"],repeat=2) ---- [("a","a"),("b","b")......]
reduce函数
函数本次执行的结果传递给下一次。
def test(a,b): return a+b reduce(test,range(10)) 结果:从0+1+2......+9
enumerate函数
输入列表元素以及序列号
n=["a","b","c"] for i,m in enumerate(n): print(i,m)
函数超时时间设置
@于2017.05.27更新
利用signal设置某个函数执行的超时时间
import time import signal def test(i): time.sleep(0.999)#模拟超时的情况 print "%d within time"%(i) return i def fuc_time(time_out): # 此为函数超时控制,替换下面的test函数为可能出现未知错误死锁的函数 def handler(signum, frame): raise AssertionError try: signal.signal(signal.SIGALRM, handler) signal.alarm(time_out)#time_out为超时时间 temp = test(1) #函数设置部分,如果未超时则正常返回数据, return temp except AssertionError: print "%d timeout"%(i)# 超时则报错 if __name__ == '__main__': for i in range(1,10): fuc_time(1)
函数出错重试
利用retrying模块实现函数报错重试功能
import random from retrying import retry @retry def have_a_try(): if random.randint(0, 10) != 5: raise Exception('It's not 5!') print 'It's 5!'
如果我们运行have_a_try函数,那么直到random.randint返回5,它才会执行结束,否则会一直重新执行,关于该模块更多的用法请自行搜索。
程序操作
@于2017.05.27更新
Ctrl+C退出程序
利用signal实现ctrl+c退出程序。
import signal import sys import time def handler(signal_num,frame): print "\nYou Pressed Ctrl-C." sys.exit(signal_num) signal.signal(signal.SIGINT, handler) # 正常情况可以开始你自己的程序了。 # 这里为了演示,我们做一个不会卡死机器的循环。 while 1: time.sleep(10) # 当你按下Ctrl-C的时候,应该会输出一段话,并退出.
程序自重启
利用os.execl方法实现程序自重启
import time import sys import os def restart_program(): python = sys.executable print "info:",os.execl(python, python, * sys.argv) #os.execl方法会代替自身进程,以达到自重启的目的。 if __name__ == "__main__": print 'start...' print u"3秒后,程序将结束...".encode("utf8") time.sleep(3) restart_program()
时间墙
@2017.04.19创建此文
@2017.04.24增加eval/exec函数
@2017.05.27增加程序操作、函数超时、函数出错重试
文章来源:thief.one