python中的封装层级可以简单的看成:函数->类->模块->包,其中模块相当于一个文件,包是模块的集合,相当于一个文件夹。文件夹下需要__init__.py作为目录,__init__.py也可以为空但必须存在。
一、模块调用和静态导入
在调用上,模块和包应该是同等级别的,即包可以看成是模块,以下以模块代称:
在模块A中定义了一个函数 def a(),如要在其他模块中使用,有两种方式:
# 方式一
improt A
A.a()
# 方式二
from A improt *
a()
# 方式三
from A import a
a()
方式一和方式二三调用函数形式不同,据说方式二三是直接引用了绝对路径所以不需要加模块名。但这样可能会导致不同模块中的相同函数名被覆盖(相同时以导入最后一个模块为准)。
方式二会导入整个A,方式三仅导入a部分代码。如果频繁使用a,建议使用方式三,提高效率。
如果想要控制方式二导入的模块,即不需要全部导入,可以在__init__.py包含import xxx,__all__=[xxx]。想要导入哪些模块,加入到代码中即可。
方式二会保护模块A中的保护变量(以_开头)和私有变量(以__开头),不会对这些变量进行导入。方式三会导入这些变量,其中保护变量名称不变,但私有变量会变成_类名__私有变量名,总之是不建议对私有变量进行强行访问。
import就相当于把代码运行了一遍。
二、模块重命名
使用from xxx import A as B,可使导入的部分重新命名,适合于存在多个相同名字。调用时使用B.xxx即可。
三、路径和动态导入
在模块引用中,无论是import的是相对路径还是绝对路径都涉及路径的问题。
当导入一个模块时,python查找顺序:
- 当前目录
- PYTHONPATH 下的每个目录
- 默认路径(安装过程中选择的)
以上搜索的路径都存储在sys.path中。
一些关于路径的常用函数:
os.path.abspath(__file__)可以获得当前模块的绝对路径。
os.path.dirname可以获取当前模块所在文件夹路径。
sys.path.insert(0,x)可将x插入到sys.path,import会查找sys,path,进而找到x的路径。
改变PYTHONPATH可以使用类似set PYTHONPATH=c:\python27\lib;命令。
os.path.join(DIR,'B.py')可做拼接,最终路径为DIR/B.py
前面所提到的三种导入方式都是静态导入,如果利用获取路径的函数取到了类似Dir = “E:\xxxx\xx\xxxxxx”,想要导入这个绝对地址,是无法使用静态导入的,这时可以使用动态导入。
# 方式一
A = __import__("A")
# 方式二
A = importlib.import_module("A")
- 方式一在导入子模块时会出现问题,例如
__import__("ywzd.Tasks")
<module 'ywzd' from 'E:\\web_agent\\webagent3\\ywzd\\ywzd\\__init__.py'>
导入的依然是整个模块,舍弃了点右侧子模块。
- 方式一就算使用了fromlist,无论怎么设置依然导入的是整个路径,包含点的子模块。
YWZD = __import__("ywzd.Tasks", fromlist=['Actions'])
<module 'ywzd.Tasks' from 'E:\\web_agent\\webagent3\\ywzd\\ywzd\\Tasks\\__init__.py'>
- 使用方式二可以导入想要的子模块
import importlib
YWZD = importlib.import_module('ywzd.Tasks')
<module 'ywzd.Tasks' from 'E:\\web_agent\\webagent3\\ywzd\\ywzd\\Tasks\\__init__.py'>
四、dir()、globals()、locals()和reload()
- dir返回的是list,当前模块的所有模块、函数、变量,就是所有对象。
- globals()和locals()返回dict,是当前能访问到的所有全局变量和局部变量。
- reload()则用于重新加载模块,即重新执行一下import。
五、特别注意
- 协程之间可以共享变量,用galobal即可,将变量放在一个公共模块中即都可以。
- 进程之间不可共享变量,所以在初始化程序时会各自加载一次公用模块,可将子进程需要区分的东西放入公用模块中,由公用模块去读取文件,可实现共享内容。这种方式由于系统自带对文件的读写锁,可以说是很安全,但是不可大量使用,影响性能。