scvmm 发表于 2018-8-6 09:01:14

Python回顾与整理1:Python基础

  0.说明
  学习Python其实也有好一段时间了,之前也做了不少笔记,但是要真正把Python学得很扎实,没有对Python系统的了解是远远不够的,哪怕是最基础的知识点,所以决定好好地回顾整理。
  当然,就以《Python核心编程》这本书为纲,希望可以把自己对Python的理解连成系统的一条线。
  1.语句和语法

[*]  `#`:注释
[*]  `\`:换行,如果是闭合操作符如`( )`,`[ ]`,`{ }`等,可以不使用`\`
[*]  `:`:分号将代码头和代码体分开
[*]  `缩进`:用以区分不同的代码块
[*]  `;`:同一行写多个语句,但不建议
[*]  `模块`:一个.py脚本文件就是一个模块
  2.变量赋值
  (1)赋值操作符:=

[*]  在Python中,对象是通过引用传递的,赋值时,是将该对象的引用(不是一个值)赋给这个变量。
[*]  另外,Python赋值语句没有返回值,但可以使用赋值链:
>>> a=(a = 3)  
File "<stdin>", line 1
  
    a = (a=3)
  
          ^
  
SyntaxError: invalid syntax
  
>>> y = x = 3
  (2)增量赋值

[*]  只有类似+=这样的增量赋值,没有自增自减的方法
[*]  特性:可变对象(列表,字典等)就修改(无需拷贝引用),不可变对象(数字,元组等)则分配一个新对象
  (3)多重赋值

[*]  一个对象可被多个变量引用,多个对象也可被多个对象引用
>>> x = y = z =1  (4)多元赋值:元组赋值
>>> (x, y, z) = (1, 2, 'a string')

[*]  不加括号也可以,但建议加上
[*]  可用于两值的交换
>>> x = 3; y = 4  
>>> print x, y
  
3 4
  
>>> x, y = y, x
  
>>> print x, y
  
4 3
  3.标识符

[*]  关键字标识符:保留字,不能用于其他用途,否则会引起SyntaxError异常
[*]  内建(built-in)标识符:是__builtins__模块的成员,在程序开始或交互解释器开始时,由Python解释器自动导入,可以将其作为Python全局变量,可以重新赋值,但不建议
>>> dir  
<built-in function dir>
  
>>> dir()
  
['__builtins__', '__doc__', '__name__', '__package__']

[*]  __专用下划线标识符:
  __xxx:类中的私有变量名,不能用`from module import *`导入,变量是私有时,建议使用这种方法
  __xxx__:系统定义名字,如内建标识符
  另外,Pythonn不支持标识符重载,所以任何时刻都只有一个名字绑定。
  4.基本风格指南

[*]  注释:#号
[*]  文档:模块,类声明或函数声明中第一个没有赋值的字符串,可通过obj.__doc__访问
[*]  缩进:以空格代替制表符
[*]  标识符名称:名字简短有意义
[*]  Python风格指南:import this
  (1)模块结构和布局

[*]  起始行(Unix)
#/usr/bin/env python  这样仅输入脚本名字就可以执行脚本,无需直接调用解释器。

[*]  模块文档
''this is a test module''  可通过obj.__doc__访问

[*]  模块导入
[*]  变量定义:尽量使用局部变量代替全局变量
[*]  类定义
[*]  函数定义
[*]  主程序
if __name__ == '__main__':  
    My_function()
  
#如果模块是被导入,__name__的值为模块名字;
  
#如果模块是被直接执行,__name__的值为'__main__';
  关于主程序,注意下面几点:

[*]  1.绝大部分模块创建的目的是被其它模块导入而不是作为脚本执行,总之只有一个模块,也就是包含主程序的模块会被执行;
[*]  2.最高级别的Python语句(没有缩进)在模块被导入时就会被执行;
[*]  3.通常只有主程序模块中有大量的顶级可执行代码,所有其他被导入模块只应该有很少的顶级执行代码,所有的功能代码都应该封装在函数或类当中。
  对于上面三点,只要联系自己在实际项目开发中的例子就可以很好的理解了。
  (2)在主程序中书写测试代码
  如果想测试被导入的模块的某个函数的功能,就可以使用主程序的方法,引入并执行该函数,这就是测试功能的使用,当然在大型程序中,更倾向使用unittest。
  5.内存管理

[*]  变量定义:变量无须事先声明
  在Python中无需显式变量声明语句,变量在第一次赋值时自动声明。
[*]  动态类型:变量无须指定类型
  Python中对象的类型和内存占用都是运行时确定的。
[*]  内存分配:不用关心内存管理
  Python解释器承担了内在管理的复杂任务。
[*]  引用计数:对象回收
  (1)增加引用计数

[*]  当对象被创建并(将其引用)赋值给变量时,该对象的引用计数就被设置为1
[*]  当一个对象(的引用)又被赋值给其他变量时,或作为参数传递给函数,方法或类实例时,或者被赋值为一个窗口对象(列表,字典等)的成员时,该对象新的一个引用会被创建,引用计数加1
>>> x = 3.14    #加1,下面每一步同理  
>>> y = x
  
>>> foobar(x)
  
>>> myList =
  (2)减少引用计数

[*]  一个本地引用离开其作用范围
  如函数执行完毕后局部变量被销毁。
[*]  对象别名被显式销毁
>>> del y

[*]  当变量被赋值给另外一个对象时,原对象的引用计数也会自动减1
>>> foo = 'xyz'  
>>> bar = foo
  
>>> foo = 123

[*]  对象被从一个窗口对象中移除
myList.remove(x)

[*]  窗口对象本身被销毁
del myList  即执行del y会产生下面两个结果:

[*]  1.从现在名称空间中删除y
[*]  2.y变量对应的对象的引用计数减1
  需要注意的是,如果内存中仍然有在使用该对象,这会增加一个额外的引用,则它还不会被回收。


[*]  垃圾收集
  解释器跟踪对象的引用计数,垃圾收集器负责释放内存。其实际,垃圾收集器是一块独立代码,用来查找引用计数为0的对象和那些引用计数虽然大于0但也应该被销毁的对象(如循环引用的对象)。
  垃圾收集器 = 引用计数器 + 循环垃圾计数器,这在存在循环引用的情况中非常有用:

[*]  循环引用:发生在至少两个对象互相引用时,也就是当其它所有对它们的引用都消失时,他们两者所产生的对各自的引用仍然存在,例如两个类中有各自的一个实例
[*]  引用计数器作用:当一个对象的引用计数变为0,解释器会暂停,释放掉这个对象和仅有这个对象可访问(可到达的)其它对象(这样的话,其它对象的引用计数必然是1)
[*]  循环垃圾计数器作用:作为引用计数器的补充,垃圾收集器也会留心被分配的总量很大的(及未通过引用计数销毁的那些)对象,在这种情况下,解释器也会停下来,试图清理所有未引用的循环
  基本可以理解,但具体怎么实现的,就需要看Python的源码分析了。
  6.第一个Python程序
  主要提及一点:使用局部变量替换模块变量。
  例如,你要使用os.linesep,如果你多次使用,那么建议将其定义为一个本模块的全局变量或局部变量,这将会加快查询的速度,因为对于os.linesep,要进行下面两步:

[*]  首先要查找os,确认其是一个模块
[*]  在这个模块中查找linesep变量
  将经常用到的模块属性替换为一个本地引用,可以让程序跑得更快。
页: [1]
查看完整版本: Python回顾与整理1:Python基础