用到的工具 原始数据:《白夜行》小说,txt格式(我是用calibre把原来mobi格式的书转成txt的)。后期可以用爬虫爬点网页数据做原始数据。为简单就先用txt练手好了。...
![240](https://cdn2.jianshu.io/assets/default_avatar/14-0651acff782e7a18653d7530d6b27661.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
用到的工具 原始数据:《白夜行》小说,txt格式(我是用calibre把原来mobi格式的书转成txt的)。后期可以用爬虫爬点网页数据做原始数据。为简单就先用txt练手好了。...
实验目的 学习如何读取一个文件 学习如何使用DataFrame 学习jieba中文分词组件及停用词处理原理 了解Jupyter Notebook 概念 中文分词 在自然语言处...
先贴一下hive中get_json_object和json_tuple两个函数的区别: Hive中提供了两种针对json数据格式解析的函数,即get_json_object(...
Image by: Opensource.com 为了鼓励新工具的出现,机器学习和数据分析领域似乎已经成了“开源”的天下。Python 和 R 语言都具有健全的生态系统,其中...
步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身...
该案例来自于金融理论与政策小组作业——《基于分省数据研究宏观变量对房地产价格的影响》,我主要负责对房地产长周期影响因素进行回归分析。由于我们采用的是面板数据,第一次做这样的分...
图像是猫还是狗?情感是正还是负?贷还是不贷?这些问题,该如何使用合适的机器学习模型来解决呢? 问题 暑假后,又有一批研究生要开题了。这几天陆续收到他们发来的研究计划大纲。 其...