可以通过python可以对对数据进行分析,并且对所研究的数据方向进行一些预测。
python数据分析需要以下模块。
(1)numpy:可以高效的对数据进行处理。而且提供了数组的支持,虽然python中有list列表,但是对于大量数据来说list集合的效率要低于数组。而且许多模块都依赖于Numpy这个模块。例如pandas ,scipy等等。
numpy的安装一般采用下载whl文件的方式进行安装,而且下载的时候要选用numpy+mkl的包,同时要特别注意的是所下载的安装包是自己所需要的。
(2)pandas:主要用与数据探索和数据分析,
安装的方式问pip安装 命令: pip install pandas
(3) matplotlib :可以来作图。也是采用网络安装 ,命令pip install matplotlib
(4)scipy :支持高等数据计算,矩阵计算 安装下载安装whl文件
(5)statsmodel可以用于统计分析,采用pip install statsmodel的方式安装
(6)gensim可以用于文本挖掘。采用pip install gensim的方式进行安装。
以上就是python数据分析所需要的一些基本模块。