秋招记录-知乎

知乎连续面了三面,第三面挂了,不过还是学习到了不少的东西。

一面:
1、介绍项目
2、一个数组,所有数组都出现了两次,只有一个数出现了一次,返回这个数
这个题很简单,两个相同的数的异或是0,因此所有数求异或,剩下的数即为我们要求的数。

class Solution {
    public int singleNumber(int[] nums) {
        int res = 0;
        for(int i=0;i<nums.length;i++)
            res ^= nums[I];
        return res;
    }
}

3、一个数组,一个数出现了超过一半次数,返回这个数
这里用到的就是两两消除的思路。

class Solution {
    public int majorityElement(int[] nums) {
        if(nums==null || nums.length==0)
            return -1;
        int res = nums[0];
        int count = 1;
        for(int i=1;i<nums.length;i++){
            if(res == nums[I])
                count++;
            else{
                if(count==0){
                    count ++;
                    res = nums[I];
                }
                else
                    count--;
            }
        }
        return res;
    }
}

4、将除法的结果用字符串返回,如果能够除尽,则返回相除的结果,如果不能除尽,则无限循环部分用[]标记。
这里我采用了队列和Map的做法,使用map记录每个除数出现的位置,如果出现了相同的除数,则表明出现了无限循环部分。如果除数变成了0,则说明除尽了。

import java.util.*;
public class DivideTwoInteger {

    public static void divide(int p1,int p2){
        Queue<Integer> queue = new LinkedList<Integer>();
        int intPart = p1 / p2;
        int reminder = p1 % p2;
        if(reminder == 0){
            System.out.println("" + intPart);
            return;
        }

        Map<Integer,Integer> map = new HashMap<Integer,Integer>();
        map.put(reminder,0);
        int index = 0;
        while(true){
            queue.offer(reminder * 10 / p2);
            reminder = reminder * 10 % p2;
            if(map.containsKey(reminder) || reminder==0)
                break;
            else
                map.put(reminder,++index);
        }
        StringBuilder stb = new StringBuilder();
        stb.append(intPart + "");
        stb.append(".");
        if(reminder == 0){
            while(!queue.isEmpty())
                stb.append(queue.poll() + "");
            System.out.println(stb.toString());
        }
        else{
            int pos = map.get(reminder);
            index = 0;
            while(index < pos)
                stb.append(queue.poll() + "");
            stb.append("[");
            while(!queue.isEmpty())
                stb.append(queue.poll() + "");
            stb.append("]");
            System.out.println(stb.toString());
        }
    }
    public static void main(String[] args){
        divide(1,3);
        divide(100,3);
        divide(6,3);
        divide(10,4);
    }
}

5、介绍下DeepFM

二面:
1、介绍项目
2、word2vec的原理简单介绍下
有关word2vec的原理,大家可以看https://blog.csdn.net/itplus/article/details/37969519
3、DeepFM介绍下
4、FM推导

5、数组排序,假设数组排序后的位次和排序前的位次绝对值差值小于K,有什么比快排好的算法?
堆排序,建堆的过程是KlogK。我开始说用堆排序,先将数组的前K+1个元素建堆,然后每次出去一个进来一个,完成排序。面试官问我,这样做是有序的么。我一开始说不一定,但仔细想想,一定是有序的。我们来分析一下。
因为排序前和排序后,同一个数字的索引之差小于等于K。假设K=3,也就是说,索引为2的数,在排序后,最大位置不超过5。再假设我们当前找到的是排序后索引为2的数,且后面有一个数比这个要小。由于这个数不在堆中,因此这个数的排序前索引一定大于5,这与假设相矛盾。因此用堆排序一定能保证数组有序。

6、树中两个节点的第一个的公共祖先。
这个题Leetcode上有原题:https://leetcode.com/problems/lowest-common-ancestor-of-a-binary-tree/description/
代码贴出来:

/**
 * Definition for a binary tree node.
 * public class TreeNode {
 *     int val;
 *     TreeNode left;
 *     TreeNode right;
 *     TreeNode(int x) { val = x; }
 * }
 */
class Solution {
    public TreeNode lowestCommonAncestor(TreeNode root, TreeNode p, TreeNode q) {
        if(root==null || root == p || root== q)
            return root;
        TreeNode left = lowestCommonAncestor(root.left,p,q);
        TreeNode right = lowestCommonAncestor(root.right,p,q);
        if(left!=null && right!=null) return root;
        return left !=null?left:right!=null?right:null;
    }
}

三面:
1、介绍下项目
2、word2vec里面的层次索引
3、boosting和bagging的区别?
1)样本选择上:
Bagging:训练集是在原始集中有放回选取的,从原始集中选出的各轮训练集之间是独立的.
Boosting:每一轮的训练集不变,只是训练集中每个样例在分类器中的权重发生变化.而权值是根据上一轮的分类结果进行调整.
2)样例权重:
Bagging:使用均匀取样,每个样例的权重相等
Boosting:根据错误率不断调整样例的权值,错误率越大则权重越大.
3)预测函数:
Bagging:所有预测函数的权重相等.
Boosting:每个弱分类器都有相应的权重,对于分类误差小的分类器会有更大的权重.
4)并行计算:
Bagging:各个预测函数可以并行生成
Boosting:各个预测函数只能顺序生成,因为后一个模型参数需要前一轮模型的结果.

4、bagging为什么能减小方差?
参考博客:https://blog.csdn.net/shenxiaoming77/article/details/53894973

可能不懂的地方看下面的公式就知道了:

5、交叉熵损失函数,0-1分类的交叉熵损失函数的。什么是凸函数?0-1分类如果用平方损失为什么用交叉熵而不是平方损失?
这里我们只回答最后一个问题,也就是说逻辑回归为什么不用平方损失?有两点原因:
1)平方损失函数非凸函数。为什么非凸?凸函数二阶导数大于等于0,证明一下即可。
2)但是会在h(wx)接近0和1的地方梯度很小,不容易学习。

6、python里的gc和多线程。
在Python中,为了解决内存泄露问题,采用了对象引用计数,并基于引用计数实现自动垃圾回收。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,185评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,445评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,684评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,564评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,681评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,874评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,025评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,761评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,217评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,545评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,694评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,351评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,988评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,778评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,007评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,427评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,580评论 2 349

推荐阅读更多精彩内容

  • 本系列主要根据吴恩达老师的课程、李航老师的统计学习方法以及自己平时的学习资料整理!在本文章中,有些地方写的十分简略...
    文哥的学习日记阅读 9,351评论 2 110
  • 注:题中所指的『机器学习』不包括『深度学习』。本篇文章以理论推导为主,不涉及代码实现。 前些日子定下了未来三年左右...
    我偏笑_NSNirvana阅读 39,936评论 12 145
  • 1. RF, GBDT 的区别; GBDT,XGboost 的区别 GBDT在训练每棵树时候只能串行,不能并行,在...
    sylvainwang阅读 3,264评论 0 50
  • 搜索要找到重点,不能随便查找,关键词就很重要,找对关键词才能找到搜索点。
    萧楠身阅读 264评论 0 0
  • 山海不可平 “你到底在哪个出站口?” 徐真把手机换到另一个没汗的手里,微微握紧。对面的声音即使隔着手机也能听出溢满...
    荧光点点阅读 555评论 5 6