网易数据分析师笔试
2017.08.12
P.S.
完整题面记不清了,大致的知识点
目前无答案,日后可能会更新
简介
测试时间:120分钟
测试内容:单选20题,编程2题,简答1题
题目
单选题
(吐槽一下简书markdown语法真的支持不全,因为要插入公式和代码,所以手动编了题号)
1.在机器学习中引入随机样本,例如随机森林,是为了降低:
A. 噪音
B. 预估方差
C. 全部
D. 预估偏差
2.{Xn}满足独立同分布,已知E(Xn)=0,Var[Xn]=1,那么,当n趋向于无穷大的时候,
的值趋向于(末尾有格式正常的公式):
A.1
B.0
C.2
D.正无穷
3.下方程序的功能是为了输出数组的全排列,请补全:
void perm(int[], int k, int m)
{
if ( )
{ copy(list,list+m, ostream_iterator<int>(count,"",""));
count << end1;
return;
}
for(int i=k, i<=m, i++)
{ swap(&list[k], &list[i]);
( );
swap(&list[k], &list[i]);
}
}
A. k=!m, perm(list, k, m)
B. k==m, perm(list, k+1, m)
C. k=!m, perm(list, k+1, m)
D. k==m, perm(list, k, m)
4.select * from t where a=100 and b=200
,哪个索引可以用
A. 索引 idx_a_b(a,b)
B. 索引 idx_b_a(b,a)
C. 都可以
D. 索引idx_b(b)
5.有两堆宝石,A和B两个玩家,每次能从任意一堆宝石中取1/2/3个宝石,取到最后一个宝石的玩家获胜,两堆宝石的数量分别为12和13,问,如果A要获胜:
A.没有任何策略可以保证A取胜
B.让B先取
C.都不对
D.让A先取
6.从{1,2,3,...,20}选4个数,不出现两个相邻数字的取法有几种?
A.330
B.816
C.1220
D.2380
7.有A和B两种商品,客户同时购买A和B的概率是4/7,买了A后再买B的概率为1/2,买了B再买A的概率是1/3,问A —>B的支持度和置信度分别是(这道题选项记不得了)
A.3/7,1/2
B.4/7,1/2
C.3/7,1/3
D.4/7,1/3
8.针对n*n的对阵矩阵A,说法正确的是
A.A 的不同特征值的特征向量正交
B.对阵矩阵的列向量正交
C.A的相同特征值的特征向量正交
D.对阵矩阵为满秩矩阵
9.关于用自行车、汽车和货车运送商品的调查,sig=0.034,(选项不记得了)
A.
B.
C.
D.
10.整数序列排序,经过两次处理之后,序列为10,12,21,9,7,3,4,25,可能的排序算法是:
A.快速排序
B.连续排序
C.堆排序
D.插入排序
11.关于最小二乘法的说法正确的是:
A.最小二乘法是线性有偏估计中方差最大的
B.最小二乘法是线性无偏估计中方差最小的
C.最小二乘法是线性有偏估计中方差最小的
D.最小二乘法是线性无偏估计中方差最大的
12.截取logfile文件的suc行,并且只输出最后一列,正确的是:
A.grep 'suc' logfile | awk '{print $NF}'
B.grep 'suc' logfile | awk '{print $O}'
C.grep -o 'suc' logfile | awk '{print $NF}'
D.grep -o 'suc' logfile | awk '{print $O}'
13.在后台执行sh test.sh,最优雅的做法是
A. nohup sh test.sh &
B. nohup sh test.sh
C. nohup sh test.sh &&
D. sh test.sh &
14.将4个不一样的球放入5个杯子,问杯子中球最多为3个的概率为
A.16/25
B.16/125
C.9/25
D.15/25
15.不属于非监督学习的是:
A. Word2vec
B. Kmeans
C. Knn
D. 关联规则
16.小明在班级中参与二人班干部竞选,他的支持率为百分之五十五,已知置信度为0.95的置信区间为百分之五十刀百分之六十,问小明本次未当选的概率是:
A.5%
B.50%
C.3%
D.40%
17.不是DDL的语句的是:
A. RENAME
B. CREATE
C. GRANT
D. ALTER
18.在员工表EMP中加入一列WANGYI_NO,语句是:
A. ALTER TABLE EMP ADD (WANGYI_NO CHAR(10))
B. ADD TABLE EMP ALTER (WANGYI_NO CHAR(10))
C. ALTER TABLE EMP (ADD WANGYI_NO CHAR(10))
D.ADD TABLE EMP (WANGYI_NO CHAR(10))
19.以下关于python说法正确的是:
A.保存为dict有键值对,且有序
B.tuple支持动态更新,不支持嵌套
C.list元素可以是tuple
D.list支持动态更新,不支持嵌套
20.33个不等的初始归并段,要形成7路平衡归并排序为组织最佳归并树,需增加长度为0的初始归并段的个数为:
A. 4
B. 2
C. 6
D. 5
编程题
- (经过解读了,所以我的解读可能是错的)输入一个数列,内容为A-Z的字母(个数在50个以内),要求对这个数列进行排序,如果不同的相邻字母个数为1,则是一个好数列,要求输出,输入数列能形成的好数列的个数。
例子,输入AABB,可能的排序为AABB, ABAB, BABA, ABBA, BAAB, BBAA,其中只有AABB和BBAA满足要求,所以输出2
- (同样经过解读了)小明每天要吃1个水果,交x元房费,他离开家的时候有f个水果,d元房费,问他最多能过几天。
问答题
有三张表,
第一张表S是学生关系表,包括SNO和SNAME,学号和姓名;
第二张表C是课程关系表,包括CNO, CNAME和CTEACHER,课程编号,课程名称和课程教师;
第三张表SC示选课关系表,包括SNO,CNO和SCORE.
问题:
1.选出没有选“小易”老师的课的所有学生的名字
2.理出有三门(包括三门)score > 90的学生姓名及其平均成绩。