240 发简信
IP属地:北京
  • XPath和SAX

    XPath 保留复杂的层级关系 谓语 嵌在[]中用来插着某个特定的节点 路径表达式(类似于文件操作) Python处理xml的方法 DOM把整个xmL读入内存解析为树占用内存...

  • 爬虫的主要内容

    爬虫的主要内容 requests 发送请求 传递url参数 读取相应内容 定制请求头部 Post请求 响应状态码 重定向和历史 超时 获取url 传递参数 处理二进制内容 处...

  • 多线程

    import threadingimport time start是启动线程join是阻塞当前线程即使得在当前线程结束时,不会退出。从结果可以看到,主线程直到Thread-1...

  • R语言与随机森林

    运用R语言实现随机森林 安装所需要的包randomForest.在Rstudio中输入所需安装的包的名称进行安装。 安装完成后运用library("randomForest"...

  • 数据清洗

    数据清洗:删除原始数据集中的无关数据,重复数据,平滑噪声数据,处理缺失值和异常值 缺失值的处理:删除记录 数据插补 不处理 拉格朗日插值法:但插值节点增减时差值多项随之变化...

  • 逻辑斯特回归

    logistic回归的建模步骤 根据挖掘目的的设置特征并筛选特征 y;x1,x2,x3......xp根据分析目的设置指标变量收集数据 列出回归方程 ln(p/1-p...

  • K-means

    kmeans的基本原理 K均值算法的主要原理:首先假设一组向量作为所有簇的簇均值向量,然后根据这一组假设的簇均值向量给出数据集D的一个簇划分,然后根据这个簇的划分计算真正的簇...

  • 分类 与预测算法评价

    混淆矩阵 针对二分类问题,将实例分成正类(postive)或者负类(negative)。但是实际中分类时,会出现四种情况. 若一个实例是正类并且被预测为正类,即为真正类(Tr...

  • 题目练习

    简述题 1 costfunction形式: 2 3.KNN算法大体过程是: 1.计算出样本数据和待分类数据的距离; 选择K个与其距离最小的样本 统计出K个样本中大多数样本所...

  • 预处理

    数据预处理的常用流程 去除唯一属性 处理缺失值 属性编码 数据标准化 特征选择 主成分分析 缺失值处理的三种方法 直接使用含有缺失值的特征 对于某些算法可以直接使用含有缺失值...

  • Selenium

    Selenium 特点:简单使用 关键命令 find_element(s)_by_tag_name find_element(s)_by-css_selector 可以链式查...

  • SWOT分析法

    概述 SWOT分析法,即态势分析法,就是将与研究对象密切相关的各种主要内部优势、劣势和外部的机会和威胁等,通过调查列举出来,并依照矩阵形式排列,然后用系统分析的思想,把各种因...

  • 120
    如果我是老板,我一定不要日更写文的员工

    前几天跟一位简友聊天,他向我吐槽:“我们那个老板,知道我天天更文,找我谈了好几次话,希望我能把更多精力放在工作上。” “我们老板眼界真low,跟不上时代,现在是人人自媒体,趁...

个人介绍
本科物理 程序员 日语学习者 爱读书 爱旅行