一、分析问题,明确目标 1.风险订单识别模型 很多互联网公司都是中间商,需要连接用户与供应商,将用户的订单提供给供应商,由供应商履行订单 但是在这个过程中,很容易会因为各种原...

一、分析问题,明确目标 1.风险订单识别模型 很多互联网公司都是中间商,需要连接用户与供应商,将用户的订单提供给供应商,由供应商履行订单 但是在这个过程中,很容易会因为各种原...
Q1:什么是用户画像? 用户画像是互联网大数据体系中非常重要的一部分 通过用户画像,可以对用户进行全面分析 可以利用用户画像“千人千面”地推荐相关产品 可以基于用户画像分析产...
Q1:简述AB测试。 1.AB测试 为了评估模型/项目的效果,在App/PC端同时设计多个版本 在同一时间维度下,分别让组成成分相同(相似)的访客群组随机访问这些版本 收集各...
Q:如何提供数据分析报告的质量? 一、明确整体分析思路 好的数据分析报告都依赖于一个明确的思路,需要在开始设计报告前就整理出一个基本的框架,然后在设计过程中进行适当的添加 切...
Q1:现在需要监控数据并设计相应的报表,应该考虑哪些问题? 看什么:报表设计——提高信息量,提升可读性 怎么看:报表输出——图表、数据看板 给谁看:报表受众——基于需要提供相...
在工作中,针对“xxxApp或xxx功能模块最近的用户量或者其他相关指标下降了,你会如何进行分析”等问题,最直接的解决方法就是建立完整的指标体系。通过指标体系,能够很直观的发...
作为数据分析师,经常被问到的问题是“XXX数据最近上升/下降了,是什么原因造成的?”“新上线的功能给业务带来的是正面影响还是负面影响”“对于xxx,我们需要制定什么样的策略,...
Q1:SQL中有哪些常用的聚合函数? 常用的聚合函数 注:对表中所有记录进行聚合计算时,无需使用group by语句,可以在select后直接写聚合函数,但是不能出现非聚合字...
在很多查询场景中,数据往往来源于多个表,所以需要将多个表连接起来进行查询,即多表查询 Q1:简要介绍join连接,以及如何使用join进行简单的表连接? 1.join joi...
本文通过案例进行讲解 假设数据库有一个名为students_grade的表: 计算所有学生各个学科在2019年的平均分,筛选出平均分超过60分的记录,并且最后以平均分进行降序...
Q1:什么是SQL?为什么要用到SQL? 1.SQL(Structured Query Language,结构化查询语言) SQL是一种数据库查询和程序设计语言,用于存取数据...
本文通过一个真实面试题目来讲解R语言的数据挖掘 一、题目 建立线性回归模型,预测各个酒店未来一段时间每天的订单量 数据: 二、数据处理 首先,将没有任何意义的单纯表示排序的第...
Q1:如何使用R语言进行数据可视化,用其可视化有什么特点? R语言可视化主要依赖ggplot2包以及相应的衍生包 ggplot2的核心理念:将绘图与数据分离,并且按图层作图,...
Q1:如何用R语言进行基本的数据框操作? 1.读取CSV文件并查看 read.csv()读取csv文件 View()查看数据框数据 代码示例: 输出结果: 2.添加列 代码示...
Q1:什么是R语言?它跟现在流行的Python相比有什么特点? 1.R语言简介 R语言在统计领域被广泛使用,是S语言的一个分支,可以认为它是S语言的一种实现,主要用于统计分析...
Q1:简要阐述分词的三种模式及其区别。 1.分词的三种模式 精确模式:试图将句子最精确地切分开,适合文本分析 全模式:把句子中所有可以成词的词都扫描出来,速度非常快,但是不能...
Python中能实现数据可视化的包有很多:matplotlib、pyecharts、seaborns、bokeh等,本文主要介绍前两个包。 Q1:如何使用matplotlib...
Q1:什么是pandas?为什么要用pandas? 在数据分析中,最重要的两个Python库就是NumPy和pandas,其中用得最多的是pandas库。 pandas是基于...
Q1:什么是python?为什么要选择python? python是当今应用最广泛的编程语言之一,以效率高和代码可读性强而著称 python介于R语言和Java语言之间,既可...
Q1:对于预测问题常用的评估方法有哪些? 1.MSE(Mean Squared Error,均方误差) 定义:参数估计值与参数真值之差平方的期望值 MSE可以用于评估数据的变...