python笔记

库文件安装：

python -m pip install –user pyquery

[TOC]

列表

切片

>>> names = ["Alex","Tenglan","Eric","Rain","Tom","Amy"]
>>> names[1:4]  #取下标1至下标4之间的数字，包括1，不包括4
['Tenglan', 'Eric', 'Rain']
>>> names[1:-1] #取下标1至-1的值，不包括-1
['Tenglan', 'Eric', 'Rain', 'Tom']
>>> names[0:3] 
['Alex', 'Tenglan', 'Eric']
>>> names[:3] #如果是从头开始取，0可以忽略，跟上句效果一样
['Alex', 'Tenglan', 'Eric']
>>> names[3:] #如果想取最后一个，必须不能写-1，只能这么写
['Rain', 'Tom', 'Amy'] 
>>> names[3:-1] #这样-1就不会被包含了
['Rain', 'Tom']
>>> names[0::2] #后面的2是代表，每隔一个元素，就取一个
['Alex', 'Eric', 'Tom'] 
>>> names[::2] #和上句效果一样
['Alex', 'Eric', 'Tom']

追加

>>> names
['Alex', 'Tenglan', 'Eric', 'Rain', 'Tom', 'Amy']
>>> names.append("我是新来的")
>>> names
['Alex', 'Tenglan', 'Eric', 'Rain', 'Tom', 'Amy', '我是新来的']

插入

>>> names
['Alex', 'Tenglan', 'Eric', 'Rain', 'Tom', 'Amy', '我是新来的']
>>> names.insert(2,"强行从Eric前面插入")
>>> names
['Alex', 'Tenglan', '强行从Eric前面插入', 'Eric', 'Rain', 'Tom', 'Amy', '我是新来的']

>>> names.insert(5,"从eric后面插入试试新姿势")
>>> names
['Alex', 'Tenglan', '强行从Eric前面插入', 'Eric', 'Rain', '从eric后面插入试试新姿势', 'Tom', 'Amy', '我是新来的']

修改

>>> names
['Alex', 'Tenglan', '强行从Eric前面插入', 'Eric', 'Rain', '从eric后面插入试试新姿势', 'Tom', 'Amy', '我是新来的']
>>> names[2] = "该换人了"
>>> names
['Alex', 'Tenglan', '该换人了', 'Eric', 'Rain', '从eric后面插入试试新姿势', 'Tom', 'Amy', '我是新来的']

删除

>>> del names[2] 
>>> names
['Alex', 'Tenglan', 'Eric', 'Rain', '从eric后面插入试试新姿势', 'Tom', 'Amy', '我是新来的']
>>> del names[4]
>>> names
['Alex', 'Tenglan', 'Eric', 'Rain', 'Tom', 'Amy', '我是新来的']
>>> 
>>> names.remove("Eric") #删除指定元素
>>> names
['Alex', 'Tenglan', 'Rain', 'Tom', 'Amy', '我是新来的']
>>> names.pop() #删除列表最后一个值 
'我是新来的'
>>> names
['Alex', 'Tenglan', 'Rain', 'Tom', 'Amy']
>>> names.clear()
[]

扩展

>>> names
['Alex', 'Tenglan', 'Rain', 'Tom', 'Amy']
>>> b = [1,2,3]
>>> names.extend(b)
>>> names
['Alex', 'Tenglan', 'Rain', 'Tom', 'Amy', 1, 2, 3]

拷贝

>>> names
['Alex', 'Tenglan', 'Rain', 'Tom', 'Amy', 1, 2, 3]

>>> name_copy = names.copy()
>>> name_copy
['Alex', 'Tenglan', 'Rain', 'Tom', 'Amy', 1, 2, 3]

统计

>>> names
['Alex', 'Tenglan', 'Amy', 'Tom', 'Amy', 1, 2, 3]
>>> names.count("Amy")
2

排序&翻转

>>> names
['Alex', 'Tenglan', 'Amy', 'Tom', 'Amy', 1, 2, 3]
>>> names.sort() #排序
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: unorderable types: int() < str()   #3.0里不同数据类型不能放在一起排序了，擦
>>> names[-3] = '1'
>>> names[-2] = '2'
>>> names[-1] = '3'
>>> names
['Alex', 'Amy', 'Amy', 'Tenglan', 'Tom', '1', '2', '3']
>>> names.sort()
>>> names
['1', '2', '3', 'Alex', 'Amy', 'Amy', 'Tenglan', 'Tom']

>>> names.reverse() #反转
>>> names
['Tom', 'Tenglan', 'Amy', 'Amy', 'Alex', '3', '2', '1']

获取下表

>>> names
['Tom', 'Tenglan', 'Amy', 'Amy', 'Alex', '3', '2', '1']
>>> names.index("Amy")
2 #只返回找到的第一个下标

元组

count

功能：统计当前元组中某元素的个数
    tup = (55,77,85,55,96,99,22,55,)
    tup.count(55)
    返回结果：3 
    备注：元素‘55’在元组tup中出现了3次

index

功能：获取元素在元组中的索引值,对于重复的元素,默认获取从左起第一个元素的索引值
    tup = (55,77,85,55,96,99,22,55,)
    tup.index(55)
    返回结果：0
    tup.index(85)
    返回结果：2
    tup.index(55,2,7)
    返回结果：3

字符串操作

capitalize

功能：字符串首字母大写
    name = 'swhthaitun'
    name.capitalize()
    返回结果：'Swht'

casefold

功能： 字符串首字母小写
	name = 'HelloWord'
    reault = name.casefold()
    print(reault)
    返回结果：helloword

center

功能：字符串宽度填充，使用原有字符串+填充字符构成指定长度的新的字符串
    name = 'swhthaitun'
    name.center(15)
    返回结果：'   swhthaitun  ' #默认以空格进行填充
    name.center(16,'*')
    返回结果：'***swhthaitun***'

    功能：字符串居中，以‘*’分割(20为新产生字符串的总的宽度)
    name = 'HelloWord'
    reault = name.center(20,'*')
    print(reault)
    返回结果：*****HelloWord******

count

功能：统计某个字符在字符串中出现的次数，或在字符串指定区间内完成上述操作
    name = 'swhthaitun'
    name.count('h')
    返回结果：2
    name.count('h',0,3)  #从索引值0-3范围的字符中统计'h'出现的次数
    返回结果：1

    功能：统计子序列出现的次数
    name = 'HelloWord'
    reault = name.count('W') #如果换成'w'，返回结果为0，python对大小写敏感
    print(reault)
    返回结果：1

    name = 'HelloWord'
    reault = name.count('l',0,3) #统计单个字符出现的次数,可以指定起始范围,另外在python中起始范围讲究顾头不顾尾的原则，即[0,3)
    print(reault)

encode

功能：对字符串进行编码操作
    name = 'swhthaitun'
    name.encode()
    返回结果：b'swhthaitun'

    功能：转变字符串的编码
    name = '南非波波'
    reault = name.encode('gbk')
    print(reault)
    返回结果：b'\xc4\xcf\xb7\xc7\xb2\xa8\xb2\xa8'

endswith

功能：判断字符串是否以某个字符串结尾的，返回值为bool型
    name = 'swhthaitun'
    name.endswith('s')
    返回结果：False
    name.endswith('n')
    返回结果：True
    name.endswith('tun')
    返回结果：True

    name = 'Iamalatterboy'
    reault = name.endswith('y')
    print(reault)
    返回结果：True

expandtabs

功能：将制表符'\t'转换成指定宽度的tab键分割，默认tabsize=8
    li = 'sw\tht'
    li.expandtabs(4)
    返回结果：'sw  ht'
    li.expandtabs()
    返回结果：'sw      ht'

find

功能：在字符串中查找指定字符串，找不到时返回-1
    name = 'swht'
    name.find('s')
    返回结果：0
    name.find('h')
    返回结果：2

format

功能：格式化输出字符串
    li = 'I\'m {},{}' #两个'{}'是占位符
    li.format('swht','欢迎来中国')
    返回结果："I'm swht,欢迎来中国"
    参考：http://blog.chinaunix.net/uid-23802873-id-4477364.html

index

功能：在字符串中查找指定的字符串,找不到时直接报错
name = 'swhthaitun'
name.index('w')
返回结果：1

join()

~~~py
功能：字符串连接
    name = 'swhthaitun'
    '*'.join(name)
    返回结果：'s*w*h*t*h*a*i*t*u*n'
~~~

isalnum

功能：检查判断字符串是否包含字母数字字符（http://www.yiibai.com/python/string_isalnum.html）
    name = 'swhthaitun'
    name.isalnum()
    返回结果：True

isalpha

功能：检测字符串是否只由字母组成（http://www.runoob.com/python/att-string-isalpha.html）
    name = 'swhthaitun'
    name.isalpha()
    返回结果：True

isdecimal

功能：检查字符串是否只包含十进制字符。这种方法只存在于unicode对象。（参考：http://www.runoob.com/python/att-string-isdecimal.html）
    name = 'swhthaitun'
    name.isdecimal()
    返回结果：False

isdigit

功能：检测字符串是否只由数字组成。(参考:http://www.runoob.com/python/att-string-isdigit.html)
    name = 'swhthaitun'
    name.isdigit()
    返回结果：False

isdentifier

功能：检测字符串是否是字母开头
   name = 'swhthaitun'
   name.isidentifier()
   返回结果：True
   name = '1swhthaitun'
   name.isidentifier()
   返回结果：False

isnumeric

功能：检测字符串是否只由数字组成。这种方法是只针对unicode对象。
    name = 'swhthaitun'
    name.isnumeric()
    返回结果：False
    Li = '5523'
    Li.isnumeric()
    返回结果：True

isprintable

功能：判断字符串中所有字符是否都属于可见字符
    a = "\tPuppy"
    a.isprintable()
    返回结果：False
    name = 'swhthaitun'
    name.isprintable()
    返回结果：True

isspace

功能：检测字符串是否为空格
    name = 'swhthaitun'
    name.isspace()
    返回结果：False
    Li = ' '
    Li.isspace()
    返回结果：True

istitle

功能：判断字符串是否适合当作标题（其实就是每个单词首字母大写）
    a = "a puppy"
    b = "Puppy"
    a.istitle()
    返回结果：False
    b.istitle()
    返回结果：True

isupper

功能：判断字符串中所有字母字符是否都是大写字母
    a = "puppy"
    b = "PUPPY"
    a.isupper()
    返回结果：False
    b.isupper()
    返回结果：True

ljust

功能：返回一个原字符串左对齐,并使用空格填充至指定长度的新字符串。如果指定的长度小于原字符串的长度则返回原字符串。（参考：http://www.runoob.com/python/att-string-ljust.html）
    语法：str.ljust(width[, fillchar])
         width -- 指定字符串长度。
         fillchar -- 填充字符，默认为空格。
    name = 'swhthaitun'
    name.ljust(50,'*')
    返回结果：'swhthaitun****************************************'

lower

功能：将所有的字母转换成小写字母
   name = 'SWHT'
   name.lower()
   返回结果：'swht'

strip

功能：去除字符串两边的空格
    name = '  swht   '
    name.rstrip()
    返回结果：'swht'

maketrans

功能：用于创建字符映射的转换表，对于接受两个参数的最简单的调用方式，第一个参数是字符串，表示需要转换的字符，第二个参数也是字符串表示转换的目标。
    注：两个字符串的长度必须相同，为一一对应的关系。
    语法：str.maketrans(intab, outtab)
    参数：intab -- 字符串中要替代的字符组成的字符串。
          outtab -- 相应的映射字符的字符串。
    intab = "swhtr"
    outtab = "12345"
    name = "hjjksknsnjmk"
    name.maketrans(intab, outtab)
    返回结果：{104: 51, 114: 53, 115: 49, 116: 52, 119: 50}

partition

功能：根据指定的分隔符将字符串进行分割。
        如果字符串包含指定的分隔符，则返回一个3元的元组，第一个为分隔符左边的子串，第二个为分隔符本身，第三个为分隔符右边的子串。
    name = 'swht'
    li = 'hhsslswhtolljm'
    li.partition(name)
    返回结果：('hhssl', 'swht', 'olljm')

replace

功能：把字符串中的 old（旧字符串） 替换成 new(新字符串)，如果指定第三个参数max，则替换不超过 max 次。
    语法：str.replace(old, new[, max])
    参数：old -- 将被替换的子字符串。
         new -- 新字符串，用于替换old子字符串。
         max -- 可选字符串, 替换不超过 max 次
    str = "this is string example....wow!!! this is really string"
    str.replace("is", "was")
    返回结果：'thwas was string example....wow!!! thwas was really string'
    str.replace("is", "was", 3)
    返回结果：'thwas was string example....wow!!! thwas is really string'

split

功能：字符串分割，默认是空格
    name.split()
    返回结果：['swht']
    name.split('s') #以's'字符进行分割
    返回结果：['', 'wht']

字典

clear

功能：清空字典
    dict_li = {'users':'swht','age':'18',}
    dict_li.clear()
    返回结果：dict_li
            {}

copy

功能：浅拷贝
    dict_li = {'users':'swht','age':'18',}
    dict_li.copy()
    返回结果：{'age': '18', 'users': 'swht'}
    dict_li = {'users':'swht','age':'18','address':{'sd':'dz'}}
    dict_li.copy()
    返回结果：{'age': '18', 'users': 'swht', 'address': {'sd': 'dz'}}

fromkeys

功能：用于创建一个新字典，以序列seq中元素做字典的键，value为字典所有键对应的初始值。
    语法：dict.fromkeys(seq[, value]))
    参数：seq -- 字典键值列表。
         value -- 可选参数, 设置键序列（seq）的值。
    li = ['users','age']
    dict_li = dict.fromkeys(li,'swht')
    返回结果：dict_li
            {'age': 'swht', 'users': 'swht'}

get

功能：获取字典的value值
    dict_li = {'users':'swht','age':'18',}
    dict_li.get('users')
    返回结果：'swht'

items

功能：返回可遍历的(键, 值) 元组数组
    dict_li = {'users':'swht','age':'18',}
    dict_li.items()
    返回结果：dict_items([('age', '18'), ('users', 'swht')])

keys

功能：获取字典可遍历的键
    dict_li = {'users':'swht','age':'18',}
    dict_li.keys()
    返回结果：dict_keys(['age', 'users'])

pop

功能：删除字典中指定的键值
    dict_li = {'users':'swht','age':'18',}
    dict_li.pop('age')
    返回结果：'18'

popiteam

功能：随机返回并删除字典中的一对键和值
    dict_li = {'users':'swht','age':'18',}
    dict_li.popitem()
    返回结果：('age', '18')
    dict_li
    {'users': 'swht'}

setdefault

功能：查找键值，如果键不已经存在于字典中，将会添加键并将值设为默认值。
    dict_li = {'users':'swht','age':'18',}
    dict_li.setdefault('ID',5)
    返回结果：5
    dict_li
    返回结果：{'age': '18', 'users': 'swht', 'ID': 5}

update

功能：把指定字典的键值更新到当前字典中
    dict_li = {'users':'swht','age':'18',}
    dict_ai = {'address':'山东'}
    dict_li.update(dict_ai)
    dict_li
    返回结果：{'age': '18', 'users': 'swht', 'address': '山东'}

values

功能：获取字典的所有值
    dict_li = {'age': '18', 'users': 'swht', 'address': '山东'}
    dict_li.values()
    返回结果：dict_values(['18', 'swht', '山东'])

set集合

set创建空集合

name = set()

add

功能：增加集合元素
    name = {'d', 's'}
    name.add('d')
    name
    返回结果：{'d', 's'}
    name.add('sd')
    name
    返回结果：{'sd', 'd', 's'}

clear

功能：清空集合元素
    name = {'d', 's'}
    name.clear()
    name
    返回结果：{}

copy

功能：浅拷贝
    name = {'sd', 'd', 's'}
    li = name.copy()
    返回结果：li
            {'sd', 'd', 's'}

difference

name.difference(li)
    set()
    >>> name.difference()
    {'sd', 'd', 's'}

discard

功能：移除元素
    name = {'sd', 'd', 's'}
    name.discard('s')
    返回结果：name 
            {'sd', 'd'}

intersection

功能：取交集,建立新的set集合
    li = ('s', 'd')
    name = {'sd', 'd', 's'}
    name.intersection(li)
    返回结果：{'d', 's'}

isdisjoint

功能：判断没有交集，返回True,否则,返回False
    li = {'s', 'd'}
    name = {'sd', 'd', 's'}
    name.isdisjoint(li)

issbuset

功能：判断是否是子集
    li = {'s', 'd'}
    name = {'sd', 'd', 's'}
    name.issubset(li)  #判断name是不是li的子集
    返回结果：False
    li.issubset(name)  #判断li是不是name的子集
    返回结果：True

issuperset

功能：判断是否是父集
    li = {'s', 'd'}
    name = {'sd', 'd', 's'}
    name.issuperset(li)  #判断name是不是li的父集
    返回结果：True
    li.issuperset(name)  #判断li是不是name的父集
    返回结果：False

pop

功能：移除集合元素
    name = {'sd', 'd', 's'}
    name.pop()
    返回结果：'sd' #同一个集合，删除集合元素的顺序固定
    se1 = {'a','s','sb'}
    se1.pop()
    返回结果：'sb'

remove

功能：移除指定集合元素
    name = {'sd','d','s'}
    name.remove('s')
    返回结果：name
    {'sd', 'd'}

实例代码

s = set([3,5,9,10])      #创建一个数值集合  
  
t = set("Hello")         #创建一个唯一字符的集合  


a = t | s          # t 和 s的并集  
  
b = t & s          # t 和 s的交集  
  
c = t – s          # 求差集（项在t中，但不在s中）  
  
d = t ^ s          # 对称差集（项在t或s中，但不会同时出现在二者中）
len(s)  
set 的长度  
  
x in s  
测试 x 是否是 s 的成员  
  
x not in s  
测试 x 是否不是 s 的成员  
  
s.issubset(t)  
s <= t  
测试是否 s 中的每一个元素都在 t 中  
  
s.issuperset(t)  
s >= t  
测试是否 t 中的每一个元素都在 s 中  
  
s.union(t)  
s | t  
返回一个新的 set 包含 s 和 t 中的每一个元素  
  
s.intersection(t)  
s & t  
返回一个新的 set 包含 s 和 t 中的公共元素  
  
s.difference(t)  
s - t  
返回一个新的 set 包含 s 中有但是 t 中没有的元素  
  
s.symmetric_difference(t)  
s ^ t  
返回一个新的 set 包含 s 和 t 中不重复的元素  
  
s.copy()  
返回 set “s”的一个浅复制

文件操作

文件读取

文件读取全部

1
2
3

FileRead = open("test.txt",'r')
FileRead.read()  #读取文件所有内容,print(FileRead.read()函数输出文件内容
FileRead.close()

文件循环读取行

1 FileRead = open("test.txt",'r')
2 for lines in FileRead.readlines():
3     print("lines:",lines.strip('\n'))
4 FileRead.close()
5 
6 #输出结果
7 lines: Hello World
8 lines: Welcome To Beijing

获取python在文件的当中的位置

1 FileRead = open("test.txt",'r')
2 print(FileRead.readline().strip('\n')) #读取第一行数据
3 print(FileRead.tell()) #获取python所在文件中的当前位置
4 print(FileRead.readline().strip('\n')) #读取第二行数据
5 FileRead.close()

写入数据到文件

文件写入操作

1
2
3

1 FileRead = open("test.txt",'w') #‘w’--是指文件将被写入数据,已有的数据将会被清空
2 FileRead.write('Hello Everybody!\nWelcome To China!') #被写入文件的数据,使用‘\n’可以实现换行操作
3 FileRead.close() #关闭文件句柄,每次读写文件都应该在最后面将文件关闭

文件追加写入操作

1
2
3

1 FileRead = open("test.txt",'a') #‘a’--是指文件将被写入数据,已有的数据不会被清空,在已有数据后面追加下面要添加的数据
2 FileRead.write('Hello Everybody!\nWelcome To China!') #被写入文件的数据,使用‘\n’可以实现换行操作
3 FileRead.close() #关闭文件句柄,每次读写文件都应该在最后面将文件关闭

从现有文件中获取数据

获取文件的相关信息

使用Python中的模块，可以从现有文件中获取信息。使用“os”模块和“stat”模块可以获取文件的基本信息：

1 #!/usr/local/env python3
 2 '''
 3 Author:@南非波波
 4 Blog:http://www.cnblogs.com/songqingbo/
 5 E-mail:qingbo.song@gmail.com
 6 '''
 7 import os
 8 import stat
 9 import time
10 FileStats = os.stat('test.txt') #获取文件的基本信息
11 FileInfo = {
12     'Size' : FileStats [ stat.ST_SIZE ], #文件大小
13     'LastModified' : time.ctime(FileStats[ stat.ST_MTIME]),
14     'LastAccessed' : time.ctime(FileStats[stat.ST_ATIME]),
15     'CreationTime' : time.ctime(FileStats[stat.ST_CTIME]),
16     'Mode' : FileStats [ stat.ST_MODE ]
17 }
18 print(FileStats) #os.stat_result(st_mode=33206, st_ino=6473924464448069, st_dev=434835, st_nlink=1, st_uid=0, st_gid=0, st_size=70, st_atime=1451980042, st_mtime=1451981189, st_ctime=1451979747)
19 print(FileInfo) #{'Size': 70, 'Mode': 33206, 'LastAccessed': 'Tue Jan  5 15:47:22 2016', 'LastModified': 'Tue Jan  5 16:06:29 2016', 'CreationTime': 'Tue Jan  5 15:42:27 2016'}

使用os.path()判断文件类型

1 import os.path
 2  
 3 FileStats = 'test.txt'
 4 if os.path.isdir(FileStats):  #判断文件是否是目录
 5     print('Directory.')
 6 elif os.path.isfile(FileStats): #判断文件是否是文件
 7     print('File.')
 8 elif os.path.islink(FileStats): #判断文件是否是快捷方式(链接)文件
 9     print('Shortcut.')
10 elif os.path.ismount(FileStats): #判断文件是否是挂载文件
11     print('Mount point.')

获取文件中的行数

def Countnum(filename):
    files = open(filename)
    data = files.read()
    files.flush()
    files.close()
    return data.count('\n')

python对目录的操作

创建目录
1
2
import os
os.mkdir('testDir')

创建多级目录

1 2	import os os.makedirs('testDir/test2/test3/test4') #os.makedirs()

删除多级目录

1 2	import os os.removedirs('testDir/test2/test3/test4')

删除目录
1
2
import os
os.rmdir('testDir')

python对特定类型的文件进行操作

使用fnmatch模块显示’.txt’和’.exe’文件名

1 import fnmatch
2 import os
3 for FileName in os.listdir('/'):
4     if fnmatch.fnmatch(FileName,'*.txt'):
5         print(open(FileName).read())
6     elif fnmatch.fnmatch(FileName,'*.exe'):
7         print(FileName)

“fnmatch”模块支持正则表达式：

import fnmatch
import os
import re
 
FilePattern = fnmatch.translate('*.txt')
for FileName in os.listdir('./'):
    if re.match(FilePattern,FileName):
        print('Text file.')

使用glob模块查找一种类型的文件比较方便

import glob
for FileName in glob.glob('*.txt'):
    print(FileName)
    print('Text file.')

使用数字匹配文件名

1
2
3

import glob
for FileName in glob.glob ( '[0-9].txt' ):
    print(Filename)

数据编组

编组一个包含数字和字符的列表：

#!/usr/local/env python3
'''
Author:@南非波波
Blog:http://www.cnblogs.com/songqingbo/
E-mail:qingbo.song@gmail.com
'''
import pickle
FileHandle = open( 'PickleFile.txt','wb')
TestList = ['This',2,'is',1,'a',0,'test.']
pickle.dump(TestList,FileHandle )
FileHandle.close()

拆分编组：

#!/usr/local/env python3
'''
Author:@南非波波
Blog:http://www.cnblogs.com/songqingbo/
E-mail:qingbo.song@gmail.com
'''
import pickle
FileHandle = open('PickleFile.txt','rb')  #注意要加'b'进行二进制读写操作,否则报错
TestList = pickle.load(FileHandle)
print(TestList)
FileHandle.close()

复杂编组：

import pickle

FileHandle = open('PickleFile.txt','wb')
TestList = [ 123, { 'Calories' : 190 }, 'swht', [ 1, 2, 7 ] ]
pickle.dump(TestList,FileHandle)
FileHandle.close()

拆组：

import pickle

FileHandle = open('PickleFile.txt','rb')
TestList = pickle.load(FileHandle)
print(TestList)
FileHandle.close()

创建虚拟文件

#!/usr/local/env python2
'''
Author:@南非波波
Blog:http://www.cnblogs.com/songqingbo/
E-mail:qingbo.song@gmail.com
'''
import StringIO

FileHandle = StringIO.StringIO("Let freedom ring") #创建的文件存在内存中
print(FileHandle.read()) # "Let freedom ring."
FileHandle.close()

#!/usr/local/env python2
'''
Author:@南非波波
Blog:http://www.cnblogs.com/songqingbo/
E-mail:qingbo.song@gmail.com
'''
import cStringIO

FileHandle = cStringIO.cStringIO("Let freedom ring") #创建的文件存在内存中
print(FileHandle.read()) # "Let freedom ring."
FileHandle.close()

总结：

文件管理，是众多编程语言的程序员在编写应用程序是经常遇到的问题。幸好，和其它语言相比，Python使其出乎意料地容易。Python的标准库中提供了许多相关的模块帮助程序员解决这方面的问题，而它的面向对象的机制也简化了操作。

###　zip()函数

实例代码

1 #!/usr/local/env python3
 2 '''
 3 Author:@南非波波
 4 Blog:http://www.cnblogs.com/songqingbo/
 5 E-mail:qingbo.song@gmail.com
 6 '''
 7 #zip()函数展示
 8 x = [1,2]
 9 y = [5,6]
10 xy = zip(x,y)
11 print(xy) #输出xy的值 <zip object at 0x01347A80> 
12 print(type(xy)) #输出xy的类型 <class 'zip'>
13 print(dict(xy)) #输出xy转换成字典类型后的值 {1: 5, 2: 6}

1  #!/usr/local/env python2
 2 　　>>> x = [1,2]
 3 　　>>> y = [5,6]
 4 　　>>> xy = zip(x,y)
 5 　　>>> type(xy)
 6 　　　　<type 'list'>
 7 　　>>> print xy
 8 　　　　[(1, 5), (2, 6)]
 9 　　>>> print dict(xy)
10 　　　　{1: 5, 2: 6}

函数操作

参数

形参：函数中一个变量，在函数执行前无意义，在函数调用时必须指定实际参数。
实参：实际参数用户传递给所调用的函数的一个变量，其值赋值到函数中的形式参数，然后在函数中    作为变量参与函数执行
默认参数：必须放在最后
    def show(a1,a2,a3 = 5):
        print(a1,a2,a3)
    show("wu","ha")
    #返回结果：wu ha 5
    
指定参数：
    def show(a1,a2):
        print(a1,a2)
    show(a2=52,a1=8)
    #返回结果：8 52

动态参数：
    *arg --序列：自动转换成一个元组
        def show(*arg):
            print(arg,type(arg))
        show(23,45,67)
        #返回结果：(23, 45, 67) <class 'tuple'>
        #or
        l = [23,45,67]
        show(*l)
        #返回结果：(23, 45, 67) <class 'tuple'>

    **arg --字典：自动转换成一个字典
        #默认字典处理
        def show(**arg):
            print(arg,type(arg))
        show(name1='swht',name2='shen')
        #返回结果：{'name1': 'swht', 'name2': 'shen'} <class 'dict'>
        #or
        d = {"name1"="swht","name2"="shen"}
        show(**d)
        #返回结果：{'name1': 'swht', 'name2': 'shen'} <class 'dict'>

    *arg，**kwarges --序列和字典
        def show(*args,**kwargs):
            print(args,type(args),'\n',kwargs,type(kwargs))
        show(23,45,67,82,name1='swht',name2='shen')
        #返回结果：(23, 45, 67, 82) <class 'tuple'> 
                  {'name2': 'shen', 'name1': 'swht'} <class 'dict'>     
        注意：使用*arg，**kwarges组合参数，必须是*arg在前，**kwarges在后，否则系统报错；另外实参在输入的时候也应该是按照上述顺序。

非固定参数

def stu_register(name,age,*args): # *args 会把多传入的参数变成一个元组形式
    print(name,age,args)
 
stu_register("Alex",22)
#输出
#Alex 22 () #后面这个()就是args,只是因为没传值,所以为空
 
stu_register("Jack",32,"CN","Python")
#输出
# Jack 32 ('CN', 'Python')

def stu_register(name,age,*args,**kwargs): # *kwargs 会把多传入的参数变成一个dict形式
    print(name,age,args,kwargs)
 
stu_register("Alex",22)
#输出
#Alex 22 () {}#后面这个{}就是kwargs,只是因为没传值,所以为空
 
stu_register("Jack",32,"CN","Python",sex="Male",province="ShanDong")
#输出
# Jack 32 ('CN', 'Python') {'province': 'ShanDong', 'sex': 'Male'}

局部变量

name = "Alex Li"
 
def change_name(name):
    print("before change:",name)
    name = "金角大王,一个有Tesla的男人"
    print("after change", name)
 
 
change_name(name)
 
print("在外面看看name改了么?",name)

输出

1
2
3

before change: Alex Li
after change 金角大王,一个有Tesla的男人
在外面看看name改了么? Alex Li

lambda表达式

功能：简单函数的表示方式
    func = lambda a:a+1
    函数名  关键字 形参：函数体
    创建形式参数a，函数内容为a+1,并将结果return
测试代码：
    f = lambda x:x + 1
    ret = f(4)
    print(ret)

匿名函数

#这段代码
def calc(n):
    return n**n
print(calc(10))
 
#换成匿名函数
calc = lambda n:n**n
print(calc(10))

1
2
3

res = map(lambda x:x**2,[1,5,7,4,8])
for i in res:
    print(i)

内置函数

abs()

功能：取绝对值
    >>> abs(5)
    5
    >>> abs(-85)
    85

compile()、eval()、exec()

功能：compile语句是从type类型中将str里面的语句创建成代码对象。
        compile语句的目的是提供一次性的字节码编译，就不用在以后的每次调用中重新进行编译了
    语法：compile( str, file, type )
        eveal_code = compile('1+2','','eval')
        >>>eveal_code
        返回结果：<code object <module> at 0x01555D40, file "", line 1>
        >>>eval(eveal_code)
        返回结果：3

        single_code = compile( 'print("apicloud.com")', '', 'single' )
        >>> single_code
        返回结果：<code object <module> at 0x01555B10, file "", line 1>
        >>> exec(single_code)
        返回结果：apicloud.com

super()

功能：用来解决多重继承问题

zip()

功能：zip函数接受任意多个（包括0个和1个）序列作为参数，返回一个tuple列表
  >>> x = [1,2,3,]
  >>> y = [4,5,6,]
  >>> z = [7,8,9,]
  >>> xyz = zip(x,y,z)
  >>> print(xyz)
  <zip object at 0x00FBD968>
  >>> print(list(xyz))
  [(1, 4, 7), (2, 5, 8), (3, 6, 9)]

更多内置函数：博客园
collection
- 博客园

列表生成式

1
2
3

>>> a = [i+1 for i in range(10)]
>>> a
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

闭包

内部函数对外部函数作用域里变量的引用（非全局变量），则称内部函数为闭包
1
2
3
4
5
6
7
8
9
10
11
def outer():
n = 10

def inner():
print("inner:", n)

return inner

val = outer()
print(val)
val()
闭包的意义：返回的函数对象，不仅仅是一个函数对象，在该函数外还包裹了一层作用域，这使得，该函数无论在何处调用，优先使用自己外层包裹的作用域
1
2
3
4
5
6
7
8
9
10
# 闭包方法
def outer(a,b):
def calc(x):
print(a*b+x)

return calc

val = outer(1,2)
print(val)
val(3)

装饰器(又叫语法糖)

装饰器调用原理

#!/usr/local/env python3
'''
Author:@南非波波
Blog:http://www.cnblogs.com/songqingbo/
E-mail:qingbo.song@gmail.com
'''
def login(func):
    print("To passed!")
    return func

def home(name):
    print("Welcome [%s] to home page!" % name)

def tv(name):
    print("Welcome [%s] to TV page!" % name)

def moive(name):
    print("Welcome [%s] to Moive page!" % name)

tv = login(tv)  #将tv函数的内存地址传递到login()函数中，然后将tv的内存地址返回并赋给变量tv
tv("swht") #变量调用相当于函数的调用

装饰器实现

#!/usr/local/env python3
'''
Author:@南非波波
Blog:http://www.cnblogs.com/songqingbo/
E-mail:qingbo.song@gmail.com
'''
def login(func): #程序执行时返回inner函数的内存地址
    def inner(*arg,**kwargs):
        print("To passed!")
        return func(*arg,**kwargs)
    return inner

def home(name):
    print("Welcome [%s] to home page!" % name)

@login
def tv(name):
    print("Welcome [%s] to TV page!" % name)

def moive(name):
    print("Welcome [%s] to Moive page!" % name)
tv("swht")

返回结果：

1
2
3

> To passed!
> Welcome [swht] to TV page!
>

迭代器

迭代器是访问集合元素的一种方式。迭代器只能往前不能往后。迭代器对象从集合的第一个集合开始访问，直到所有的元素被访问完。
优点：不需要事先准备整个迭代过程中的所有元素

#!/usr/local/env python3
'''
Author:@南非波波
Blog:http://www.cnblogs.com/songqingbo/
E-mail:qingbo.song@gmail.com
'''

names = iter(['swht','shen','jack'])
print(names)
print(names.__next__())
print(names.__next__())
print(names.__next__())

返回结果：
<list_iterator object at 0x000000000114C7B8>
swht
shen
jack

生成器

定义：generator，一个函数调用时返回一个迭代器，那这个函数就叫做生成器。

作用：yield实现函数中断，并保存函数中断时的状态。中断后，程序可以继续执行下面的代码，而且可以随时可以回头再执行之前中断的函数。
可以通过yield实现在单线程的情况下实现并发运算的效果

#!/usr/local/env python3
'''
Author:@南非波波
Blog:http://www.cnblogs.com/songqingbo/
E-mail:qingbo.song@gmail.com
'''

def money(num):
    while num > 0:
        print("取款100元!")
        num -= 100
        yield 100
        print("你当前还有%s元" % num)

ATM = money(500)
print(type(ATM))
print(ATM.__next__())
print(ATM.__next__())
print("吃包子....")
print(ATM.__next__())
print(ATM.__next__())

返回结果：

取款100元!
100
你当前还有400元
取款100元!
100
吃包子….
你当前还有300元
取款100元!
100
你当前还有200元
取款100元!
100

异步实现

yield参数可以返回参数和接收参数，使用send方法可以将值传递到生成器中

#!/usr/local/env python3
'''
Author:@南非波波
Blog:http://www.cnblogs.com/songqingbo/
E-mail:qingbo.song@gmail.com
'''

import time
def consumer(name):
    print("%s 开始准备吃包子!" % name)
    while True:
        baozi = yield #yield可以返回一个值，也可以接收一个值
        print("第[%s]波包子来了,被[%s]吃了!" % (baozi,name))

def producer(name):
    c1 = consumer('swht')
    c2 = consumer('shen')
    c1.__next__()
    c2.__next__()
    print("==%s开始准备做包子!==" % name)
    for i in range(10):
        time.sleep(1)
        print("**%s做了两个包子!**" % name)
        c1.send(i) #使用send方法将值传递给yield
        c2.send(i)

producer('alex')

递归

演示递归进出过程：【栈的实现：后进先出】
1

###　常用模块

time模块

　在Python中，通常有这几种方式来表示时间：

时间戳(timestamp)：通常来说，时间戳表示的是从1970年1月1日00:00:00开始按秒计算的偏移量。我们运行“type(time.time())”，返回的是float类型。

格式化的时间字符串(Format String)

结构化的时间(struct_time)：struct_time元组共有9个元素共九个元素:(年，月，日，时，分，秒，一年中第几周，一年中第几天，夏令时)

import time
#--------------------------我们先以当前时间为准,让大家快速认识三种形式的时间
print(time.time()) # 时间戳:1487130156.419527
print(time.strftime("%Y-%m-%d %X")) #格式化的时间字符串:'2017-02-15 11:40:53'

print(time.localtime()) #本地时区的struct_time
print(time.gmtime())    #UTC时区的struct_time

#时间加减
import datetime

# print(datetime.datetime.now()) #返回 2016-08-19 12:47:03.941925
#print(datetime.date.fromtimestamp(time.time()) )  # 时间戳直接转成日期格式 2016-08-19
# print(datetime.datetime.now() )
# print(datetime.datetime.now() + datetime.timedelta(3)) #当前时间+3天
# print(datetime.datetime.now() + datetime.timedelta(-3)) #当前时间-3天
# print(datetime.datetime.now() + datetime.timedelta(hours=3)) #当前时间+3小时
# print(datetime.datetime.now() + datetime.timedelta(minutes=30)) #当前时间+30分


#
# c_time  = datetime.datetime.now()
# print(c_time.replace(minute=3,hour=2)) #时间替换

datetime模块

random

import random
 
print(random.random())#(0,1)----float    大于0且小于1之间的小数
 
print(random.randint(1,3))  #[1,3]    大于等于1且小于等于3之间的整数
 
print(random.randrange(1,3)) #[1,3)    大于等于1且小于3之间的整数
 
print(random.choice([1,'23',[4,5]]))#1或者23或者[4,5]
 
print(random.sample([1,'23',[4,5]],2))#列表元素任意2个组合
 
print(random.uniform(1,3))#大于1小于3的小数，如1.927109612082716 
 
 
item=[1,3,5,7,9]
random.shuffle(item) #打乱item的顺序,相当于"洗牌"
print(item)

os模块

os模块是与操作系统交互的一个接口

在Linux和Mac平台上，该函数会原样返回path，在windows平台上会将路径中所有字符转换为小写，并将所有斜杠转换为饭斜杠。
>>> os.path.normcase('c:/windows\\system32\\')   
'c:\\windows\\system32\\'   
   

规范化路径，如..和/
>>> os.path.normpath('c://windows\\System32\\../Temp/')   
'c:\\windows\\Temp'   

>>> a='/Users/jieli/test1/\\\a1/\\\\aa.py/../..'
>>> print(os.path.normpath(a))
/Users/jieli/test1

os路径处理
#方式一：推荐使用
import os
#具体应用
import os,sys
possible_topdir = os.path.normpath(os.path.join(
    os.path.abspath(__file__),
    os.pardir, #上一级
    os.pardir,
    os.pardir
))
sys.path.insert(0,possible_topdir)


#方式二：不推荐使用
os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

sys模块

> 1 sys.argv           命令行参数List，第一个元素是程序本身路径
> 2 sys.exit(n)        退出程序，正常退出时exit(0)
> 3 sys.version        获取Python解释程序的版本信息
> 4 sys.maxint         最大的Int值
> 5 sys.path           返回模块的搜索路径，初始化时使用PYTHONPATH环境变量的值
> 6 sys.platform       返回操作系统平台名称
>

#=========知识储备==========
#进度条的效果
[#             ]
[##            ]
[###           ]
[####          ]

#指定宽度
print('[%-15s]' %'#')
print('[%-15s]' %'##')
print('[%-15s]' %'###')
print('[%-15s]' %'####')

#打印%
print('%s%%' %(100)) #第二个%号代表取消第一个%的特殊意义

#可传参来控制宽度
print('[%%-%ds]' %50) #[%-50s]
print(('[%%-%ds]' %50) %'#')
print(('[%%-%ds]' %50) %'##')
print(('[%%-%ds]' %50) %'###')


#=========实现打印进度条函数==========
import sys
import time

def progress(percent,width=50):
    if percent >= 1:
        percent=1
    show_str=('[%%-%ds]' %width) %(int(width*percent)*'#')
    print('\r%s %d%%' %(show_str,int(100*percent)),file=sys.stdout,flush=True,end='')


#=========应用==========
data_size=1025
recv_size=0
while recv_size < data_size:
    time.sleep(0.1) #模拟数据的传输延迟
    recv_size+=1024 #每次收1024

    percent=recv_size/data_size #接收的比例
    progress(percent,width=70) #进度条的宽度70

打印进度条

shutil模块

　shutil.copyfileobj(fsrc, fdst[, length])
将文件内容拷贝到另一个文件中
1
2
3
4
> 1 import shutil
> 2  
> 3 shutil.copyfileobj(open('old.xml','r'), open('new.xml', 'w'))
>

　shutil.copyfile(src, dst)
拷贝文件
1
2
> 1 shutil.copyfile('f1.log', 'f2.log') #目标文件无需存在
>

　shutil.copymode(src, dst)
仅拷贝权限。内容、组、用户均不变
1
2
> 1 shutil.copymode('f1.log', 'f2.log') #目标文件必须存在
>

　shutil.copystat(src, dst)
仅拷贝状态的信息，包括：mode bits, atime, mtime, flags
1
2
> 1 shutil.copystat('f1.log', 'f2.log') #目标文件必须存在
>

　shutil.copy2(src, dst)
拷贝文件和状态信息
1
2
3
4
> 1 import shutil
> 2  
> 3 shutil.copy2('f1.log', 'f2.log')
>

shutil.ignore_patterns(*patterns)
shutil.copytree(src, dst, symlinks=False, ignore=None)
递归的去拷贝文件夹
1
2
3
4
> 1 import shutil
> 2  
> 3 shutil.copytree('folder1', 'folder2', ignore=shutil.ignore_patterns('*.pyc', 'tmp*')) #目标目录不能存在，注意对folder2目录父级目录要有可写权限，ignore的意思是排除 
>

shutil.rmtree(path[, ignore_errors[, onerror]])
递归的去删除文件
1
2
3
4
> 1 import shutil
> 2  
> 3 shutil.rmtree('folder1')
>

shutil.move(src, dst)
递归的去移动文件，它类似mv命令，其实就是重命名。
1
2
3
4
> 1 import shutil
> 2  
> 3 shutil.move('folder1', 'folder3')
>

json&pickle模块(序列化)

import json
 
dic={'name':'alvin','age':23,'sex':'male'}
print(type(dic))#<class 'dict'>
 
j=json.dumps(dic)
print(type(j))#<class 'str'>
 
 
f=open('序列化对象','w')
f.write(j)  #-------------------等价于json.dump(dic,f)
f.close()
#-----------------------------反序列化<br>
import json
f=open('序列化对象')
data=json.loads(f.read())#  等价于data=json.load(f)

import json
#dct="{'1':111}"#json 不认单引号
#dct=str({"1":111})#报错,因为生成的数据还是单引号:{'one': 1}

dct='{"1":"111"}'
print(json.loads(dct))

#conclusion:
#        无论数据是怎样创建的，只要满足json格式，就可以json.loads出来,不一定非要dumps的数据才能loads

 注意点

import pickle
 
dic={'name':'alvin','age':23,'sex':'male'}
 
print(type(dic))#<class 'dict'>
 
j=pickle.dumps(dic)
print(type(j))#<class 'bytes'>
 
 
f=open('序列化对象_pickle','wb')#注意是w是写入str,wb是写入bytes,j是'bytes'
f.write(j)  #-------------------等价于pickle.dump(dic,f)
 
f.close()
#-------------------------反序列化
import pickle
f=open('序列化对象_pickle','rb')
 
data=pickle.loads(f.read())#  等价于data=pickle.load(f)
 
 
print(data['age'])

hashlib模块

> # 1、什么叫hash:hash是一种算法（3.x里代替了md5模块和sha模块，主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ，MD5 算法），该算法接受传入的内容，经过运算得到一串hash值
> # 2、hash值的特点是：
> #2.1 只要传入的内容一样，得到的hash值必然一样=====>要用明文传输密码文件完整性校验
> #2.2 不能由hash值返解成内容=======》把密码做成hash值，不应该在网络传输明文密码
> #2.3 只要使用的hash算法不变，无论校验的内容有多大，得到的hash值长度是固定的
>

import hashlib
 
m=hashlib.md5()# m=hashlib.sha256()
 
m.update('hello'.encode('utf8'))
print(m.hexdigest())  #5d41402abc4b2a76b9719d911017c592
 
m.update('alvin'.encode('utf8'))
 
print(m.hexdigest())  #92a7e713c30abbb0319fa07da2a5c4af
 
m2=hashlib.md5()
m2.update('helloalvin'.encode('utf8'))
print(m2.hexdigest()) #92a7e713c30abbb0319fa07da2a5c4af

'''
注意：把一段很长的数据update多次，与一次update这段长数据，得到的结果一样
但是update多次为校验大文件提供了可能。
'''

import hashlib
 
# ######## 256 ########
 
hash = hashlib.sha256('898oaFs09f'.encode('utf8'))
hash.update('alvin'.encode('utf8'))
print (hash.hexdigest())#e79e68f070cdedcfe63eaf1a2e92c83b4cfb1b5c6bc452d214c1b7e77cdfd1c7

import hashlib
passwds=[
    'alex3714',
    'alex1313',
    'alex94139413',
    'alex123456',
    '123456alex',
    'a123lex',
    ]
def make_passwd_dic(passwds):
    dic={}
    for passwd in passwds:
        m=hashlib.md5()
        m.update(passwd.encode('utf-8'))
        dic[passwd]=m.hexdigest()
    return dic

def break_code(cryptograph,passwd_dic):
    for k,v in passwd_dic.items():
        if v == cryptograph:
            print('密码是===>\033[46m%s\033[0m' %k)

cryptograph='aee949757a2e698417463d47acac93df'
break_code(cryptograph,make_passwd_dic(passwds))

模拟撞库破解密码

logging模块

#!/usr/local/env python3
'''
Author:@南非波波
Blog:http://www.cnblogs.com/songqingbo/
E-mail:qingbo.song@gmail.com
'''
import logging

# logging.warning("user [swht] is start the systerm!")
# logging.critical("server is down!")
#创建日志
logger = logging.getLogger('[Test-Log]')
logger.setLevel(logging.DEBUG)

#创建一个控制台的handler并设置日志级别
ch = logging.StreamHandler()
ch.setLevel(logging.DEBUG)

#创建一个文件的handler并设置日志级别
fh = logging.FileHandler("access.log")
fh.setLevel(logging.WARNING)
#创建日期格式

fomatter = logging.Formatter('%(asctime)s %(name)s %(levelname)s %(message)s',datefmt='%Y-%m-%d %H:%M:%S')

#add formatter to ch and fh
ch.setFormatter(fomatter)
fh.setFormatter(fomatter)

logger.addHandler(ch)
logger.addHandler(fh)

# 'application' code
logger.debug('debug message')
logger.info('info message')
logger.warn('warn message')
logger.error('error message')
logger.critical('critical message')

#输出格式：
'''
2016-02-20 16:53:27 [Test-Log] DEBUG debug message
2016-02-20 16:53:27 [Test-Log] INFO info message
2016-02-20 16:53:27 [Test-Log] WARNING warn message
2016-02-20 16:53:27 [Test-Log] ERROR error message
2016-02-20 16:53:27 [Test-Log] CRITICAL critical message
'''

###　面向对象

详见博客： [林海峰](http://www.cnblogs.com/linhaifeng/articles/6182264.html#_label3)

面向对象进阶

详见博客：林海峰

socket编程

#_*_coding:utf-8_*_
__author__ = 'Linhaifeng'
import socket
ip_port=('127.0.0.1',9000)  #电话卡
BUFSIZE=1024                #收发消息的尺寸
s=socket.socket(socket.AF_INET,socket.SOCK_STREAM) #买手机
s.bind(ip_port) #手机插卡
s.listen(5)     #手机待机


conn,addr=s.accept()            #手机接电话
# print(conn)
# print(addr)
print('接到来自%s的电话' %addr[0])

msg=conn.recv(BUFSIZE)             #听消息,听话
print(msg,type(msg))

conn.send(msg.upper())          #发消息,说话

conn.close()                    #挂电话

s.close()                       #手机关机

服务端

#_*_coding:utf-8_*_
__author__ = 'Linhaifeng'
import socket
ip_port=('127.0.0.1',9000)
BUFSIZE=1024
s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)

s.connect_ex(ip_port)           #拨电话

s.send('linhaifeng nb'.encode('utf-8'))         #发消息,说话(只能发送字节类型)

feedback=s.recv(BUFSIZE)                           #收消息,听话
print(feedback.decode('utf-8'))

s.close()                                       #挂电话

客户端

详见博客：林海峰