腾讯数据分析面试问题汇总

常见的计算向量相似度的方法

1.欧式距离
计算两个向量之间的距离
2.余弦相似度
3.皮尔逊相关系数
4.修正的余弦相似度(减去均值、防止受到敏感数的影响)
5.汉明距离(对应两个字符串不同位的个数)
6.曼哈顿距离
两个点在标准坐标系上的绝对轴距总和

Linux常用命令

1.top命令查看cpu占用率
2.查看日志命令


image.png

3.kill命令用来杀死特定的pid
kill15并不会立马杀死 kill9会立马杀死

常见的设计模式

参见博客
https://segmentfault.com/a/1190000030850326
主要有:工厂模式、单例模式、装饰器模式、策略模式

数据分析之因果推论

时序先发生的为因 后发生的为果
排除混杂因素 控制变量
参见博客:
https://blog.csdn.net/tMb8Z9Vdm66wH68VX1/article/details/108543716

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容