深度学习
【RNNs+LTSMs的自动谱曲实践】《Asking RNNs+LTSMs: What Would Mozart Write?》网页链接
【深度学习】 【Google为Dropout申请的专利】《System and method for addressing overfitting in a neural network 》网页链接
【深度强化学习】继DeepMind2015Nature文章深度强化学习 网页链接 麻省理工Narasimhan将其用于文本博弈 网页链接 附:Narasimhan的ACL15文章:在机器理解中利用篇章信息 网页链接《Language Understanding for Text-based Games Using Deep Reinforcement Learning》《Machine Comprehension with Discourse Relations》
【深度学习】CV 之 image / video description 篇: CVPR 2015 之深度学习篇 Part 3 - 机器翻译与Image Description 文章论述了 image description 的算法是如何受到 machine translation 算法的启发的, 简言之, 如果先用 CNN 把 image/video 编码成 一个向量 (或 一串向量), 那么 MT 的模型就能移植过来进行 image / video 到 sentence 的 ‘翻译’
【思考向量】多伦多大学最新Skip-Thought Vector的句子向量转换工具**Sent2Vec代码下载:网页链接 论文:网页链接
【图模型】【Keras新增图模型支持(可用于构建Neural Turing Machines/MemNN等)】网页链接
【图模型】【"图"观世界——网络建模与分析】《Graphs in the world: Modeling systems as networks - See, extract, and create value with networks》网页链接
机器学习
【算法个性化的未来】《The Future Of Algorithmic Personalization》网页链接
【关于机器学习-EM算法新解】 网页链接
【聚类分析 实战 】网页链接
【针对光照变化的人脸识别算法研究】 网页链接
【数据挖掘】 陈封能Pang-Ning Tan与其博导Vipin Kumar等合著的<Introduction to Data Mining, 2005> 习题答案: 网页链接 课件幻灯片: iB37 注: Tan的2002年博士论文Discovery of Indirect Associations and Its Application
【3D场景理解】【牛津微软等ACM TOG 2015 Paper:SemanticPaint- Interactive 3D Labelling and Learning at your Fingertips】网页链接。提出一种新的交互式在线3D场景理解方案。允许扫描环境的同时,通过交互式接触任何想要的物体来分割场景,从分割中不断学习并标注新的环境。该工作被全球多家媒体报道
【《Machine Learning at the New York Times》幻灯】 网页链接 云: 网页链接[视频]《Machine Learning For Journalism at The New York Times》网页链接 机器学习和可视化在新闻领域(纽约时报)的应用,云:网页链接
【数据科学家必备技能】《Data Scientist Skills: Must Have’s》 网页链接
【A Large-Scale Car Dataset for Fine-Grained Categorization and Verification】
网页链接 有startup或project就是一举多得的事情
代码工具
《R语言:实用数据分析和可视化技术》网页链接 “资深数据专家凝炼数十年教学和实践经验,全面阐释如何使用R的20%功能完成80%的现代数据工作”。转发此微博,就有机会获得赠书哟,共5个名额,7.10截止。(赠书活动感谢 @华章图书 的大力支持)资深数据专家凝炼数十年教学和实践经验,全面阐释如何使用R的20%功能完成80%的现代数据工作
【幻灯:190+页的R语言统计数据分析教程】《Using R for statistical data analysis I》by Stephan Haug, Valentin Wimmer 网页链接 pdf:网页链接 云:网页链接
【免费书:30页的R语言入门资料】《Introduction to R - A First Course in R》by Michael Clark 网页链接
【幻灯:R语言高性能计算】《High Performance Computing with R》by Drew Schmidt 网页链接 云:网页链接
【(Python)基于Caffe的深度学习库Apollo】网页链接 GitHub:网页链接
【 Scikit-learn 】 Why I Love Scikit-learn
【Python 创业公司都在使用的3款Python库】Instavest上发表一篇博文,文章分享了深受创业公司喜爱的3款Python库,该文章在Hacker News上引发了开发者的激烈探讨。笔者将文章简译过来以分享给更多的开发者朋友。网页链接
KNN库 比较【高性能K-NN库KGraph】最近邻库横评结果最新更新,并发布博客: 网页链接 最新的包含kgraph的评测结果 网页链接
【高性能K-NN库KGraph】《KGraph: Efficient Nearest Neighbor Search》网页链接 GitHub:网页链接
自然语言
**【自然语言 思考向量】 ** 多伦多大学最新Skip-Thought Vector的句子向量转换工具Sent2Vec代码下载:网页链接 论文:网页链接
【自然语言 教程】 Percy Liang (Stanford University) 的Tutorial: Natural Language Understanding: Foundations and State-of-the-Art 可以下载了,网页链接 。
**【自然语言 教程】 **斯坦福大学深度学习与自然语言处理第二讲:词向量
推荐系统
【视频:Alex Smola讲推荐系统】《Recommender Systems》by Alex Smola Youtube:网页链接 云:网页链接 网页链接 更多《Introduction to Machine Learning》课程视频请参阅爱可可-爱生活
【CTR】(click-through rate)是效果广告(如搜索广告)中的重要话题,预估用户点击广告的概率. 可用特征有如下几类:用户、广告、广告位、上下文等,其中【广告位】是(最)重要特征;文章[EOS,NBER05]假设CTR仅依赖于广告位O****网页链接 附: O****iB37O****网页链接
大数据平台
【幻灯】【Hadoop Summit 2015 Presto in Netflix】今年的Hadoop Summit上,Netflix公司介绍了presto在Netflix的应用 :网页链接
时间序列
**时间序列 异常检测 ** 监控工具博览会 网页 监控领域有数以百计的工具,bigpanda将诸多工具分为十余类。
算法
【面经】阿里、腾讯、百度产品经理40+道面试题记录:我是怎样同时拿到BAT Offer的?【面经】阿里、腾讯、百度产品经理40+道面试题记录:我是怎样同时拿到BAT Offer的?
【“最短路径数目”参考解析】:边权相等非负,Dijkstra算法退化为BFS广度优先。到某结点最短路径条数,只需计算该结点相邻结点的最短路径值和条数,最小且相等的加起来即可。代码在附图。(a,b)表示最短路径值a、最短路径条数b。本题答案是12。网页链接
【大神高德纳(Donald Ervin Knuth)计算机程序设计的艺术(The Art of Computer Programming)现在提供电子版】网页链接 本文收录了高德纳所有的书籍,其中计算机程序设计的艺术部分提供了eBook版本。转需!
【论文:基于Twitter的创业生态监测】《The power of Twitter: Building an innovation radar using social media》Omar Mohout (2015) 网页链接