machine learning note 2

1. import datasets

from sklearn.datasets import load_iris

iris = load_iris()
print iris.feature_names
print iris.target_names
print iris.data[0]
print iris.target[0]

2.tree

import numpy as np
from sklearn.datasets import load_iris
from sklearn import tree

iris = load_iris()
test_idx = [0, 50, 100]

# training data
train_target = np.delete(iris.target, test_idx)
train_data = np.delete(iris.data, test_idx, axis = 0)

# testing data
test_target = iris.target[test_idx]
test_data = iris.data[test_idx]

clf = tree.DecisionTreeClassifier()
clf.fit(train_data, train_target)

print test_target
print clf.predict(test_data)

# viz code
from sklearn.externals.six import StringIO
import pydotplus
dot_data = StringIO()
tree.export_graphviz(clf,out_file=dot_data,
                         feature_names=iris.feature_names,
                         class_names=iris.target_names,
                         filled=True,
                         rounded=True,
                         impurity=False)
graph = pydotplus.graph_from_dot_data(dot_data.getvalue())
graph.write_pdf("iris.pdf")

print test_data[0], test_target[0]
print iris.feature_names, iris.target_names

3.graph

image.png

4.output

[ 5.1  3.5  1.4  0.2] 0
['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)'] ['setosa' 'versicolor' 'virginica']
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1:打开一张图片,选择材料工具进行裁剪:宽为2.5cm、高为3.5cm,分辨率为300。 2:如果背景不是想要的背...
    奥哈阅读 10,696评论 0 15
  • 今天请假在家陪孩子 小十二已经连续不舒服2.3天了 昨晚折腾到凌晨 今天一早也是又哭又闹 后来跟我睡到中午才...
    路露小魔女阅读 166评论 0 0
  • 树欲静而风不止 吾欲惦 而汝不视也 根错难 返
    卑辰尊月阅读 147评论 0 0