目录:
用来处理人类语言的库
用以生成项目文档的库
用来保存和解析配置的库
用于创建命令行程序的库
用来进行下载的库
用来操作图像的库
光学字符识别库(OCR)
用来操作音频的库
用来操作视频和GIF的库
地理编码地址以及用来处理经纬度的库
自然语言处理
用来处理人类语言的库。
- NLTK:一个先进的平台,用以构建处理人类语言数据的 Python 程序。官网
- jieba:中文分词工具。官网
- langid.py:独立的语言识别系统。官网
- Pattern:Python 网络信息挖掘模块。官网
- SnowNLP:一个用来处理中文文本的库。官网
- TextBlob:为进行普通自然语言处理任务提供一致的 API。官网
- TextGrocery:一简单高效的短文本分类工具,基于 LibLinear 和 Jieba。官网
文档
用以生成项目文档的库。
- Sphinx:Python 文档生成器。官网
- awesome-sphinxdoc:官网
- MkDocs:对 Markdown 友好的文档生成器。官网
- pdoc:一个可以替换Epydoc 的库,可以自动生成 Python 库的 API 文档。官网
- Pycco:文学编程(literate-programming)风格的文档生成器。官网
配置
用来保存和解析配置的库。
- config:logging 模块作者写的分级配置模块。官网
- ConfigObj:INI 文件解析器,带验证功能。官网
- ConfigParser:(Python 标准库) INI 文件解析器。官网
- profig:通过多种格式进行配置,具有数值转换功能。官网
- python-decouple:将设置和代码完全隔离。官网
命令行工具
用于创建命令行程序的库。
命令行程序开发
* cement:Python 的命令行程序框架。官网
* click:一个通过组合的方式来创建精美命令行界面的包。官网
* cliff:一个用于创建命令行程序的框架,可以创建具有多层命令的命令行程序。官网
* clint:Python 命令行程序工具。官网
* colorama:跨平台彩色终端文本。官网
* docopt:Python 风格的命令行参数解析器。官网
* Gooey:一条命令,将命令行程序变成一个 GUI 程序。官网
* python-prompt-toolkit:一个用于构建强大的交互式命令行程序的库。官网
* Pythonpy:在命令行中直接执行任何Python指令。官网
生产力工具
* aws-cli:Amazon Web Services 的通用命令行界面。官网
* bashplotlib:在终端中进行基本绘图。官网
* caniusepython3:判断是哪个项目妨碍你你移植到 Python 3。官网
* cookiecutter:从 cookiecutters(项目模板)创建项目的一个命令行工具。官网
* doitlive:一个用来在终端中进行现场演示的工具。官网
* howdoi:通过命令行获取即时的编程问题解答。官网
* httpie:一个命令行HTTP 客户端,cURL 的替代品,易用性更好。官网
* PathPicker:从bash输出中选出文件。官网
* percol:向UNIX shell 传统管道概念中加入交互式选择功能。官网
* SAWS:一个加强版的 AWS 命令行。官网
* thefuck:修正你之前的命令行指令。官网
* mycli:一个 MySQL 命令行客户端,具有自动补全和语法高亮功能。官网
* pgcli:Postgres 命令行工具,具有自动补全和语法高亮功能。官网
下载器
用来进行下载的库.
- s3cmd:一个用来管理Amazon S3 和 CloudFront 的命令行工具。官网
- s4cmd:超级 S3 命令行工具,性能更加强劲。官网
- you-get:一个 YouTube/Youku/Niconico 视频下载器,使用 Python3 编写。官网
- youtube-dl:一个小巧的命令行程序,用来下载 YouTube 视频。官网
图像处理
用来操作图像的库.
- pillow:Pillow 是一个更加易用版的 PIL。官网
- hmap:图像直方图映射。官网
- imgSeek:一个使用视觉相似性搜索一组图片集合的项目。官网
- nude.py:裸体检测。官网
- pyBarcode:不借助 PIL 库在 Python 程序中生成条形码。官网
- pygram:类似 Instagram 的图像滤镜。官网
- python-qrcode:一个纯 Python 实现的二维码生成器。官网
- Quads:基于四叉树的计算机艺术。官网
- scikit-image:一个用于(科学)图像处理的 Python 库。官网
- thumbor:一个小型图像服务,具有剪裁,尺寸重设和翻转功能。官网
- wand:MagickWand的Python 绑定。MagickWand 是 ImageMagick的 C API 。官网
OCR
光学字符识别库。
- pyocr:Tesseract 和 Cuneiform 的一个封装(wrapper)。官网
- pytesseract:Google Tesseract OCR 的另一个封装(wrapper)。官网
- python-tesseract - Google Tesseract OCR 的一个包装类。
音频
用来操作音频的库
- audiolazy:Python 的数字信号处理包。官网
- audioread:交叉库 (GStreamer + Core Audio + MAD + FFmpeg) 音频解码。官网
- beets:一个音乐库管理工具及 MusicBrainz 标签添加工具官网
- dejavu:音频指纹提取和识别官网
- django-elastic-transcoder:Django + Amazon Elastic Transcoder。官网
- eyeD3:一个用来操作音频文件的工具,具体来讲就是包含 ID3 元信息的 MP3 文件。官网
- id3reader:一个用来读取 MP3 元数据的 Python 模块。官网
- m3u8:一个用来解析 m3u8 文件的模块。官网
- mutagen:一个用来处理音频元数据的 Python 模块。官网
- pydub:通过简单、简洁的高层接口来操作音频文件。官网
- pyechonest:Echo Nest API 的 Python 客户端官网
- talkbox:一个用来处理演讲/信号的 Python 库官网
- TimeSide:开源 web 音频处理框架。官网
- tinytag:一个用来读取MP3, OGG, FLAC 以及 Wave 文件音乐元数据的库。官网
- mingus:一个高级音乐理论和曲谱包,支持 MIDI 文件和回放功能。官网
Video
用来操作视频和GIF的库。
地理位置
地理编码地址以及用来处理经纬度的库。