互联网数据分析师面试题库

python

  1. DataFrame.iterrows()返回的是Series还是dictionary还是list of tuples?
    返回的是一个迭代器generator,可以使用generator.next()方法获取下一行,该方法返回的是一个(index, Series)结构的tupe。
  2. tuple和list的区别?
    tuple和list最大的区别就是tuple不可修改,而list可以修改。在大部分情况下,tuple和list都可以相互替代。但是,当tuple用于字典的键时,就不能用list替代。因为字典的键不可修改。
  3. 正则表达式

统计

SQL

  1. JOIN ON、DISTINCT、GROUP BY、ORDER BY
  2. PRIMARY KEY、int、str、double

逻辑思维

  1. 何为代理变量选择?
    当你想要观察的某个变量的数据不容易量化或得到时,你可以选取另一个变量,这个变量能够代替你想观察的某个变量。举个例子说,如果你想衡量某高校录取学生的学术水平,这是一个无法准确量化的变量。那么你可以考虑寻求一个代理变量,比如,该高校录取学生的高考成绩,等等。
    在LC的贷款数据中,我们也想知道贷款者的信用得分,而数据当中并没有这个变量,那么我们可以使用代表贷款者信用报告中的信用记录的属性来综合计算贷款者的信用得分。
  2. 因果解释
    比如说吧,再做LC贷款数据分析时发现,贷款者贷款的目的大部分都是债务合并。那么问题来了:为什么会这样?咱们一步步来说明:
  • 信用卡的由来:最初是因为商场为了提升客户忠诚度,给客户办了会员卡,提供了一定的透支额度(信用额度),客户在买东西之后不需要付现金,可以使用会员卡透支消费。在每个月末,商户将月账单寄给客户,客户收到账单后就寄送支票给商户。之后,银行就推出一项业务:办理信用卡。(资料来源:https://www.zhihu.com/question/23705747
  • 信用卡的普及度高:据统计,在美国人的日常开支中有80%以上是用信用卡支付的,現金只占很小的比例。基本上吃穿住行全都是用信用卡搞定。这为美国人的生活带来了极大的方便。(资料来源:http://www.people.com.cn/BIG5/paper68/5910/593192.html
  • 信用卡欠账率:欠账率在网上并没有查到具体的数字,不过我们可以从下面几个数字当中得到有效信息:1. 有37%美国人的信用卡债务等于或者是超过了其应急存款的数字,即每3个美国人就有1个随时可能面临财务困境。(来源:http://www.xucai.net/zixun/28623317668.html ) 2. 2014年信用卡净债务达到571亿美元,2016年底将达到1万亿美元,如此高的增长率有点吓人。(来源:http://www.xucai.net/zixun/273574305757.html )3. 波音职工信贷联盟的一项调查称,大约35%的美国家庭会逐月结转信用卡债务。那么其他65%的家庭呢?欠款?(来源:http://www.xucai.net/zixun/273574305757.html
  • 信用卡年利率高:15~20%(来源:http://www.livinggreat.net/asp/article_read/showarticle.asp?rCategoryChain=27&rArticleID=341 )。信用卡如果不正常还款利息非常高,具体参见:http://www.uscreditcards101.com/when-you-should-pay-credit-card-bill/#6
  • 通过以上分析我们可以解释为什么贷款者大部分贷款目的都是用来债务合并:1. 大部分贷款者都有信用卡债务 2. 在LC上贷款可以减轻信用卡债务。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,185评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,445评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,684评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,564评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,681评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,874评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,025评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,761评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,217评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,545评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,694评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,351评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,988评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,778评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,007评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,427评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,580评论 2 349

推荐阅读更多精彩内容