到目前为止,我们在 Python 解释器中写的所有代码都在我们退出解释器的时候丢失了。但是当人们编写大型程序的时候他们会倾向于将代码分为多个不同的文件以便使用,调试以及拥有更好的可读性。在 Python 中我们使用模块来到达这些目的。模块是包括 Python 定义和声明的文件。文件名就是模块名加上 .py 后缀。
你可以由全局变量 name 得到模块的模块名(一个字符串)。
现在我们来看看模块是怎样工作的。创建一个 bars.py 文件。文件内容如下:
"""
Bars Module
============
这是一个打印不同分割线的示例模块
"""
def starbar(num):
"""打印 * 分割线
:arg num: 线长
"""
print('*' * num)
def hashbar(num):
"""打印 # 分割线
:arg num: 线长
"""
print('#' * num)
def simplebar(num):
"""打印 - 分割线
:arg num: 线长
"""
print('-' * num)
现在我们启动解释器然后导入我们的模块。
>>> import bars
>>>
我们必须使用模块名来访问模块内的函数。
>>> bars.hashbar(10)
##########
>>> bars.simplebar(10)
----------
>>> bars.starbar(10)
**********
导入模块
有不同的方式导入模块。我们已经看到过一种了。你甚至可以从模块中导入指定的函数。这样做:
>>> from bars import simplebar, starbar
>>> simplebar(20)
--------------------
你也可以使用 from module import * 导入模块中的所有定义,然而这并不是推荐的做法。
包
含有 init.py 文件的目录可以用来作为一个包,目录里的所有 .py 文件都是这个包的子模块。
首先创建 mymodule 目录:
$ cd /home/shiyanlou
$ mkdir mymodule
然后将上一节编写的 bars.py 拷贝到 mymodule 目录下,然后可以使用 touch 创建一个 utils.py 文件。
使用 touch 命令创建一个空的 init.py 文件。
$ touch mymodule/__init__.py
如果 init.py 文件内有一个名为 all 的列表,那么只有在列表内列出的名字将会被公开。
因此如果 mymodule 内的 init.py 文件含有以下内容:
from mymodule.bars import simplebar
__all__ = [simplebar, ]
那么导入时将只有 simplebar 可用。
from mymodule import * 只能工作在模块级别的对象上,试图导入函数或类将导致 syntax error。
默认模快
使用modules,同时可以用help查看文档。
os模块
它提供了与操作系统相关的功能
import os
os.getuid()
500
此函数返回当前进程的有效用户id.
import os
os.getpid()
16150
os.getppid()
14847
getpid()函数返回当前进程的id,getppid()返回父进程的id
uname() 函数返回识别操作系统的不同信息,在 Linux 中它返回的详细信息可以从 uname -a 命令得到。uname() 返回的对象是一个元组,(sysname, nodename, release, version, machine)。
>>> os.uname()
('Linux', 'd80', '2.6.34.7-56.fc13.i686.PAE', '#1 SMP Wed Sep 15 03:27:15 UTC 2010', 'i686')
getcwd() 函数返回当前工作目录。chdir(path) 则是更改当前目录到 path。在例子中我们首先看到当前工作目录是 /home/shiyanlou,然后我们更改当前工作目录到 /Code 并再一次查看当前工作目录。
>>> os.getcwd()
'/home/shiyanlou'
>>> os.chdir('Code')
>>> os.getcwd()
'/home/shiyanlou/Code'
所以现在让我们使用 os 模块提供的另一个函数来创建一个自己的函数,它将列出给定目录下的所有文件和目录。
def view_dir(path='.'):
"""
这个函数打印给定目录中的所有文件和目录
:args path: 指定目录,默认为当前目录
"""
names = os.listdir(path)
names.sort()
for name in names:
print(name, end =' ')
print()
使用例子中的 view_dir() 函数。
>>> view_dir('/')
.bashrc .dockerenv .profile bin boot dev etc home lib lib64 media mnt opt proc root run sbin srv sys tmp usr var
Requests模块
Requests 是一个第三方 Python 模块,其官网的介绍如下:
Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用。
警告:非专业使用其他 HTTP 库会导致危险的副作用,包括:安全缺陷症、冗余代码症、重新发明轮子症、啃文档症、抑郁、头疼、甚至死亡。
第三方模块并不是默认的模块,意味着你需要安装它,我们使用 pip3 安装它。
首先要安装 pip3:
$ sudo apt-get update
$ sudo apt-get install python3-pip
然后用 pip3 安装 requests
$ sudo pip3 install requests
上面的命令会在你的系统中安装 Python3 版本的 Requests 模块。
获得一个简单的网页
你可以使用 get() 方法获取任意一个网页。
>>> import requests
>>> req = requests.get('https://github.com')
>>> req.status_code
200
req 的 text 属性存有服务器返回的 HTML 网页,由于 HTML 文本太长就不在这里贴出来了。
使用这个知识,让我们写一个能够从指定的 URL 中下载文件的程序。
代码写入文件 /home/shiyanlou/download.py:
#!/usr/bin/env python3
import os
import os.path
import requests
def download(url):
'''从指定的 URL 中下载文件并存储到当前目录
:arg url: 要下载的文件的 URL
'''
req = requests.get(url)
# 首先我们检查是否存在文件
if req.status_code == 404:
print('No such file found at %s' % url)
return
filename = url.split('/')[-1]
with open(filename, 'wb') as fobj:
fobj.write(req.content)
print("Download over.")
if __name__ == '__main__':
url = input('Enter a URL: ')
download(url)
可以看到目录下已经多了一个 sample.txt 文件。
你可能已经注意到了 if name == 'main': 这条语句,它的作用是,只有在当前模块名为 main 的时候(即作为脚本执行的时候)才会执行此 if 块内的语句。换句话说,当此文件以模块的形式导入到其它文件中时,if 块内的语句并不会执行。
你可以将上面的程序修改的更友好些。举个例子,你可以检查当前目录是否已存在相同的文件名。os.path 模块可以帮助你完成这个。
argparse 命令行参数处理模块
你还记得 ls 命令吗,你可以传递不同的选项作为命令行参数。
这里是用到的模块是 sys,命令行传入的所有参数都可以使用 sys.argv 获取。如果希望对参数进行处理可以使用 argparse 模块,
TAB键
它可以补全代码