240 发简信
IP属地:广东
  • SQL备忘

    1. sum() SUM(show_cnt) OVER (ORDER BY show_cnt DESC) AS acc_show_cnt, ...

  • Resize,w 360,h 240
    Pandas备忘

    1. drop columns df.drop(columns=['Founder', 'Locations']) 2. 两列复制到一起 df[...

  • 关于SQL去重的几种方法

    1. distinct select distinct 列名 from 表名 2. row_number select *,row_number...

  • 关于SQL优化的笔记

    常用的优化方式:https://www.changchenghao.cn/n/174426.html 对查询进行优化,应尽量避免全表扫描,首先应...

  • All About Interview - Day 2

    RF、GBDT和XGBoost都属于集成学习(Ensemble Learning),集成学习的目的是通过结合多个基学习器的预测结果来改善单个学习...

  • Resize,w 360,h 240
    All About Interview - Day 1

    新开一个面试专题,争取在面试中不要掉链子~ 今日份知识点串讲: 置信度、置信区间 置信区间是我们所计算出的变量存在的范围,置信水平就是我们对于这...

  • Resize,w 360,h 240
    Python文本挖掘学习笔记- sentiment analysis情感分析

    量化用户的内容、想法、信念和意见被称为情感分析。用户的在线帖子、博客、推特、产品的反馈有助于商业人士了解目标受众,并在产品和服务方面进行创新。情...

  • Resize,w 360,h 240
    Python文本挖掘学习笔记-NLTK-Stopword,Stemming,Lemmatization,pos tag

    接着上一篇nltk的学习笔记,今天我们继续来看看nltk更多的内容~ Stopword 停用词: 停用词在文本中被视为噪音。文本可能包含停用词,...

  • Resize,w 360,h 240
    Python文本挖掘学习笔记-NLTK-分词,计算词频

    文本挖掘也称为文本分析,文本挖掘是探索大量文本数据并查找模式的过程,我们将学习NLTK这个包,他功能强大,提供了一组多种自然语言算法。让我们一起...