@
@
本文主要是记录一下Sklearn的基本工作流程,以便对Sklearn的使用有个感性的认识。
@
@
一,假设没有Sklearn工具库,在实际使用可以按以下步骤进行:
1,收集数据并进行数据处理,将数据随机分为数据A和数据B两大部分,且数据A的所在份额可以大一些;
2,根据数据A的特征进行数学建模;
3,利用数学模型对数据B进行检验;
4,判断
1)若由数学模型预测的结果能很好的与数据B相近,则数学模型合适可用
2)若结果相差较大,则数学模型不好,此时应当回到第一步重新开始,分析是否因为前期收集的数据不全面、不正确或者过于全面从而导致数学模型普适性较差;再者,分析是否是因为数学建模的问题
5,若数学模型的预测结果较好,则将该数学模型保存下来,当遇到相近问题时便可以直接利用该模型进行结果预测。
稍微小节一下,以上的流程可以归纳为:
数据收集整理数学建模模型校验模型的使用
(如模型检验环节不合格,则返回到第一步重来)
二,在以上几个环节中,挑战最大的或者说最困难的便是数学建模环节,针对简单的问题还好,对于复杂问题则对理工科知识有了很大的要求,但幸运地是,我们有了Sklearn等工具库,有了这些工具库,相当于有了工程师哥哥帮我们建好了一系列比较常见问题的数学模型,此时,我们需要干的便是
数据收集整理并归类根据数据类型选择相应的模型模型的校验模型的使用
(相较于自己建模,此时我们只需要对自己收集来的数据进行分析整理并归类后,然后查看工具库,如果工具库里能解决该类问题,并提供了相应的模型,那我们需要做的就是通过该模型所提供的方法对其进行使用,这相当于帮我们解决了数学建模这个比较大的困难。如果该工具库没有提供解决该类问题的模型,那么我们就只有通过最原始的方法--即自己建模的方法--来解决问题了)