240 发简信
IP属地:四川
  • 8. 词的标准化 2023-06-05

    stem 是主干的意思,顾名思义提取词的主干,去掉时态复数等附加信息。这个算法是用if eles逻辑写的。

  • 7. 词过滤

    一般根据目的和场景,将样本里不用的词干掉,减少计算难度和干扰。这种被忽略或者说干掉的词就叫停用词。 在文本分类中也可以把所有文本都含有的词,统计...

  • 6.最大似然估计和后验估计

    最大似然估计和后验估计是统计学中两个重要的概念。 最大似然估计是指在给定一定的数据和概率模型的条件下,通过寻找最大化似然函数的参数来估计未知的参...

  • 5. 防止过拟合

    防止过拟合的方法包括: 增加数据量:通过增加数据量可以有效地防止模型过拟合。通过对训练数据进行一些变换,如旋转、缩放、裁剪等,可以增加训练数据量...

  • 4. 召回率和精确率

    怎么记忆呢?比如玩一个地狱的召唤射击游戏。你的目标是干掉所有敌人解救人质,楼里一共100人,敌人90人。你是个神枪手,敌人就爆头,人质就打绳子。...

  • 3. 最大似然估计(Maximum Likelihood Estimation)

    最大似然估计(Maximum Likelihood Estimation)是一种常用的统计方法,用于通过样本数据来估计一个未知参数的值。简单来说...

  • 2. Linear Regression线性回归是什么

    线性回归是一种常见的机器学习算法,用于在给定一组输入变量和相应的目标变量之后,预测目标变量与输入变量之间的线性关系。 independent v...

  • Resize,w 360,h 240
    1. 动态规划简单理解

    动态规划是一种常见的算法思想,用于解决具有重叠子问题和最优子结构特征的问题。动态规划算法通常涉及到将问题分解成一系列子问题,并且通过求解子问题的...