本文中所有代码均运行在Python 2.7上
我们知道,在Python
中的常见包(module)导入有两种方法:import ...和from ... import ...,那么在实际使用过程中,这两种方法又有哪些不同呢?
先说结论:
- 尽量使用import ...
- 有节制的使用from ... import ...
- 尽量避免from ... import *
说到原因,就先来看看import
导入的内部机制。当一个python
文件初始化运行环境的时候,会加载进来一些python
的内建包。这些包在sys.modules
中,使用下面的方法可以获取这些包的相关信息。
>>> import sys
>>> sys.modules.items()
...(我就不告诉你输出结果,想要知道请自己实践)
而所谓的"加载"的过程则分为以下几步:
- 去
sys.modules
中寻找目标模块,如果找到,就把它导入到当前环境的局部命名空间,整个加载过程结束(一般适用于python的内建(built in)模块);而没有找到的话就依次执行以下操作; - 为目标模块创建一个特定的
dict
,并插到sys.modules
中; - 对目标模块进行编译,这也就是我们为什么总能看见好多
.pyc
文件的原因; - 将编译结果放到事先在
sys.modules
中创建的对应dict
中;
那import a和from a import B又有什么区别呢?
区别在于前者是将a加入当前的局部命名空间,而后者则将B直接暴露到局部命名空间当中。
那么,这又会引发什么问题呢?
- 命名冲突
假设有模块a.py:
def echo():
print 'I am echo from module a'
有模块b.py:
def echo():
print 'I am echo from module b'
我们现在要使用这两个模块:
>>> from a import echo
>>> from b import echo
>>> echo()
I am echo from module b
可见,当发生命名冲突的时候,后引入的方法或者属性将覆盖先引入的。
所以,之前说要“有节制”的使用from a import b
,因为它有命名冲突的隐患,只有当明确没有命名冲突,并且以下情况下,才使用from ... import ...
- 只使用导入模块中少数几个方法或属性
- 这些属性使用频繁或者嵌套层级较深,不便于去使用'a.B'的方式去调用
- 循环引用
当处理比较大的项目的时候,很容易出现下面情况:
有文件py1.py
from py2 import helper2
def helper1():
pass
另有文件py2.py
from py1 import helper1
def helper2():
pass
此时,运行py1.py和py2.py中的任意一个都会报ImportError
。因为py1的运行环境初始化需要调用py2的编译后的字节码,py2亦然。这也是比较常见的错误,需要在实际中注意避免。