240 发简信
IP属地:重庆
  • Google Play Store Ranking Algorithm

    Need to get your app ranking fast? Here’s the Google Play ranking store algorithm facto...

  • 120
    kaggle:泰坦尼克号获救预测_Titanic_EDA##

    问题 数据来源于Kaggle,通过一组列有泰坦尼克号灾难幸存者或幸存者的训练样本集,我们的模型能否基于不包含幸存者信息的给定测试数据集确定这些测试数据集中的乘客是否幸存。 代...

  • powerbi能把16G内存卡死,不如tableau

    用PowerBI处理1069个csv文件,刷新一次耗时20分钟,占用内存5G

    数据文件是1069个csv文件,文件体积280兆。共有42个查询: 大部分是powerbi desktop自动生成的查询(我偷懒)。主要的操作包括筛选、删除排在前面的若干行、...

  • 120
    Boss 直聘数据岗招聘信息分析(二)

    项目背景 上一篇爬取Boss数据直聘数据后,我们可以试着对这些数据进行分析并整理一些结论出来。我们的大致步骤如下: 清洗整理 确定分析目的与思路 进行数据分析 得出数据分析结...

  • 120
    Boss 直聘数据岗招聘信息爬取(一)

    项目背景 由于本人在重庆从事数据分析工作,故这次先爬取Boss直聘的本地区数据分析岗信息,并进行分析 爬取思路 由于Boss直聘搜索职位不需要登陆,所以不涉及模拟登陆、coo...

  • 120
    IP池爬取与建立

    为何要建IP池 由于各个网站反爬的措施不断更新,部分网站采用一段时间内同一个IP高频率访问就封禁IP的方式,所以需要建立一个可供爬虫时切换使用的IP池 如何建一个IP池 1....

  • 所以作者说现在最重要的是选择内容的方式而不是内容。如何做好一个好的过滤器,引导用户到利基产品上才是难点。个人感觉网易云的日推算法就很不错,这方面的电商和娱乐推荐还有较大优化空间。

    我读《长尾理论》——打破商品与潜在消费者的空间壁垒

    这是一本值得每一个热爱互联网的人去阅读的书。 什么是长尾理论? 要回答这个问题首先要看一张图: 在商品销售中,商品可以被分为两大类,一类是热门商品,一类是非热门商品。热门商品...