12种Python 机器学习 & 数据挖掘 工具包

姓名:刘成龙  学号:16020199016

转载自:https://www.jiqizhixin.com/articles/2018-10-19-11,有删节。

【嵌牛导读】:12种Python 机器学习 & 数据挖掘 工具包

【嵌牛鼻子】:机器学习 & 数据挖掘

【嵌牛提问】:你Python的工具包够用吗?

【嵌牛正文】:

作为一种解释型语言,Python的设计哲学强调代码的可读性和简洁的语法(尤其是使用空格缩进划分代码块,而非使用大括号或者关键词)。相比于C++或Java,Python让开发者能够用更少的代码表达想法。不管是小型还是大型程序,该语言都试图让程序的结构清晰明了。我们今天为大家介绍12种Python 机器学习& 数据挖掘 工具包。

1、PyBrain

【PyBrain】是一个用于Python的模块化机器学习库。其目标是为机器学习任务和各种预定义环境提供灵活,易用且功能强大的算法,以测试和比较您的算法。

PyBrain包含用于神经网络的算法,用于强化学习(以及两者的组合),用于无监督学习和进化。由于当前大多数问题涉及连续状态和动作空间,因此必须使用函数逼近器(如神经网络)来处理大维数。我们的库是围绕内核中的神经网络构建的,并且所有训练方法都接受神经网络作为待训练的实例。这使得PyBrain成为实际任务的强大工具。

官方主页:http://www.pybrain.org/

2、Theano

【Theano】是一个Python库,允许您有效地定义,优化和评估涉及多维数组的数学表达式。

Theano特色:

与NumPy紧密集成 - 在Theano编译的函数中使用numpy.ndarray。

透明使用GPU - 比CPU更快地执行数据密集型计算。

有效的象征性差异 - Theano将您的衍生品用于具有一个或多个输入的函数。

速度和稳定性优化 - log(1+x)即使x非常小,也能获得正确的答案。

动态C代码生成 - 更快地评估表达式。

广泛的单元测试和自我验证 - 检测和诊断多种类型的错误。

官方主页:http://deeplearning.net/software/theano/

3、Pylearn2

【Pylearn2】是一个基于Theano的机器学习库,它的大部分功能是基于Theano顶层实现的。这意味着用户可以用数学表达式去编写Pylearn2插件(新模型、算法等),Theano不仅会帮助用户优化这些表达式,并且将这些表达式编译到CPU或者GPU中。

官方主页:http://scikit-learn.org/

代码主页:https://github.com/lisa-lab/pylearn2

4、Pyrallel

【Pyrallel 】 Python中的并行数据分析,用于研究机器学习和其他半交互式数据分析任务的分布式计算模式的实验项目。

代码主页:http://github.com/pydata/pyrallel

5、PyMVPA

【PyMVPA】是一个Python包,旨在简化大型数据集的统计学习分析。它提供了一个可扩展的框架,具有高级接口,可用于分类,回归,特征选择,数据导入和导出等各种算法。它旨在与相关软件包很好地集成,例如scikit-learn,shogun,MDP等。虽然它不仅限于神经成像领域,但它非常适合这样的数据集。PyMVPA是免费软件,只需要运行免费软件。

官方主页:http://www.pymvpa.org/

6、Milk

【Milk】是Python中的机器学习工具包,它的重点是有多种分类器的监督分类:SVM(基于libsvm),k-NN,随机森林,决策树。它还执行功能选择。这些分类器可以以多种方式组合以形成不同的分类系统。

官方主页:http://www.luispedro.org/software/milk

代码主页:https://github.com/luispedro/milk

7、 Monte

【Monte】是用于构建基于梯度的学习机器的Python框架,如神经网络,条件随机场,逻辑回归等.Monte包含模块(包含参数,成本函数和梯度函数)和训练器 (可以通过最小化其在训练数据上的成本函数来调整模块的参数。

模块通常由其他模块组成,这些模块又可以包含其他模块等。像这样的可分解系统的梯度可以通过反向传播来计算。

官方主页:http://montepython.sourceforge.net/

8、scikit-learn

【scikit-learn】是一个用于Python编程语言的开源机器学习库。它具有各种分类、回归和聚类算法,包括支持向量机、逻辑回归、朴素贝叶斯、随机森林、梯度增强、k均值和DBSCAN,旨在与Python数值和科学库NumPy和SciPy互操作。

官方主页:http://scikit-learn.org/stable/

代码主页:https://github.com/scikit-learn/scikit-learn

9、pandas

【pandas】是一个开源的,BSD许可的库,为Python编程语言提供高性能,易于使用的数据结构和数据分析工具。

官方主页:http://pandas.pydata.org/

代码主页:https://github.com/pandas-dev/pandas

10、mlpy

【mlpy】是一个基于NumPy / SciPy和GNU Scientific Libraries的机器学习Python模块。mlpy为监督和无监督问题提供了广泛的最先进的机器学习方法,旨在找到模块化、可维护性、可重复性、可用性和效率之间的合理折衷。mlpy是多平台的,它适用于Python 2和3;它是开源的,在GNU通用公共许可证版本3下发布。

官方主页:http://mlpy.sourceforge.net/

11、MDP

【MDP】是一种Python数据处理框架。从用户的角度来看,MDP是监督和无监督学习算法和其他数据处理单元的集合,可以组合成数据处理序列和更复杂的前馈网络架构。从科学开发人员的角度来看,MDP是一个模块化框架,可以轻松扩展。新算法的实现简单直观。然后,新实现的单元将自动与库的其余部分集成。

可用算法的基础正在稳步增长,包括信号处理方法(主成分分析,独立分量分析,慢特征分析),流形学习方法([Hessian]局部线性嵌入),几种分类器,概率方法(因子分析,RBM) ,数据预处理方法等等。

官方主页:http://mdp-toolkit.sourceforge.net/

12、 PyML

【PyML】是一个用Python编写的机器学习的交互式面向对象框架。PyML侧重于SVM和其他内核方法。它在Linux和Mac OS X上受支持。

官方主页:http://pyml.sourceforge.net/

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,588评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,456评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,146评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,387评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,481评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,510评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,522评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,296评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,745评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,039评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,202评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,901评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,538评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,165评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,415评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,081评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,085评论 2 352

推荐阅读更多精彩内容