登录注册写文章

DT

DT

    path ='iris.data'  # 数据文件路径
    data = pd.read_csv(path, header=None)
    x = data[[0, 1]]
    # y = pd.Categorical(data[4]).codes
    y = LabelEncoder().fit_transform(data[4])
    # 为了可视化，仅使用前两列特征
    x = x.iloc[:, :2]
    # x = x[[0,1]]
    x_train, x_test, y_train, y_test = train_test_split(x, y, train_size=0.7, random_state=1)

    # 决策树参数估计
    # min_samples_split = 10：如果该结点包含的样本数目大于10，则(有可能)对其分支
    # min_samples_leaf = 10：若将某结点分支后，得到的每个子结点样本数目都大于10，则完成分支；否则，不进行分支
    model = DecisionTreeClassifier(criterion='entropy', min_samples_leaf=3)
    model.fit(x_train, y_train)
    y_test_hat = model.predict(x_test)      # 测试数据
    print('accuracy_score:', accuracy_score(y_test, y_test_hat))

最后编辑于：2017.12.10 03:57:18

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

(DT_Spark)『DT大数据梦工厂』Spark亚太研究院王家林老师的Spark技术视频
Spark亚太研究院系列丛书_百度搜索https://www.baidu.com/s?wd=Spark%E4%BA...
葡萄喃喃呓语阅读 7,036评论 0赞 2
你竟是这样的月饼－和DT财经合作的月饼2.0
还记得去年中秋瞎折腾的“看看我属于哪种月饼”吗？今年和DT财经合作，集数据、设计、文案等多位小伙伴的合作，隆重推出...
宏伦工作室阅读 2,372评论 0赞 0

冬日里的鸟
我们都像冬日里的鸟渴求温暖的巢却不能心安理得鸠占鹊巢惶恐不安害怕被寻找焦虑狂躁担心被遗忘
闫寒姑娘阅读 1,404评论 0赞 1
心赏101
20171123 周四心赏第101天亲爱的康夫君，yo姐下课回家的路上我接到朋友电话，路过时看到康夫君停在家门...
静夜思CJ阅读 988评论 0赞 0
新疆富蕴县可可托海崖壁秋
骑手为什么歌唱草原阅读 1,865评论 0赞 0

赞1赞

赞赏

手机看全文