很多创新公司都在利用GPU做一些你不知道的神奇事情,比如伦敦的Mirriad,他们开发的计算机视觉技术依靠同时运行的21种算法,能够将电视中的2D影片变成3D数据,然后将场景里出现的广告进行替换,并做到完美结合,就像是拍摄时已经存在一样。快来看下吧: Mirriad - Product Placement
【ICML2015教程集锦(讲义)】《Tutorials - ICML2015》网页链接 云:网页链接
【深度学习——成长的烦恼】《Growing Pains for Deep Learning》By Chris Edwards 网页链接提供的译文《深度学习成长的烦恼》网页链接
【不是BAT怎么迈向超级智能?——深度学习XSystem平台让创新者大有可为】 不是BAT怎么迈向超级智能?——深度学习XSystem平台让创新者大有可为 不具备人工智能工具的中小企业或科研团队,无法挖掘数据价值,面对再大量的数据也只能“望数兴叹”,因此怎么让BAT占据垄断优势地位的深度学习技术为社会广泛共享,成为一个新命题。
【三强联手推出深度学习云平台】6月24日中科曙光技术创新大会上,曙光公司、中科院计算所(ICT)、NVIDIA公司共同签署了深度学习联合实验室成立备忘录,曙光深度学习XSystem系统、“XMachine深度学习一体机”同时发布,可为一些中小型企业提供面向深度学习和人工智能的云服务。
【论文:网格LSTM】《Grid Long Short-Term Memory》N Kalchbrenner, I Danihelka, A Graves (2015) 网页链接
大规模机器学习优化算法特点是样本和特征都很大,在原空间上求解发展历史如下图,最后华山论剑的结果是百度大数据实验室张潼老师的SVRG。对偶空间求解大规模优化问题遇到各种SDCA变种。
昨天听Peter Richtárik ; Mark Schmidt的tutorial: Modern Convex Optimization Methods for Large-scale Empirical Risk Minimization,结论是无论是原空间还是对偶空间,目前笑到最后的都是张潼老师的算法SVRG(原空间);Quartz(对偶空间)。现招有志青年跟张老师继续发扬光大,tangyan02@baidu.com
现招人在张老师指导下, 与我们一起做出更快、更好的大规模分布式机器学习算法, 无论从算法优化角度还是高性能计算角度都可以,前者需要优化基础较好,后者只要求算法和数据结构特别突出(比如参加程序竞赛获奖)。 欢迎投递简历给我们,注明你的职位需求,可入职时间。
张雨辰介绍了通迅更有效的大规模机器学习算法DiSCO,通迅代价不依赖样本大小和条件数。参考了百度大数据实验室张潼老师去年ICML的算法DANE。
《Mobile Phone Name Extraction from Internet Forums: A Semi-supervised Approach》最近尝试用规则来辅助论坛语料中命名实体抽取,首先根据Brown clustering来初步描述实体命名的多样性,然后再利用规则得到大量训练样本,最后进行信息提取。在英文手机论坛上得到了不错的结果。Mobile Phone Name Extraction from Internet Forums: A Semi-supervised Approach 网页链接
《Advances in Structured Prediction》John Langford, Hal Daume III,John Langford和Hal Daume III在ICML2015上关于Learning to Search的教学讲座幻灯片: 网页链接,其项目主页 网页链接 提供了一个教程 网页链接 , 相应的IPython notebook在 网页链接 #Learning to Search# 。大家可通过这个倒腾下。
《AutoExtend: Extending Word Embeddings to Embeddings for Synsets and Lexemes》 其主页网页链接 还提供了Matlab/Java源码网页链接,ACL'2015 Best Paper "AutoExtend: Extending Word Embeddings to Embeddings for Synsets and Lexemes"可以在这儿下载了: 网页链接
【基于Caffe/CNN轻量/可扩展/易用的深度造梦Python包bat-country】《bat-country: an extendible, lightweight Python package for deep dreaming with Caffe and Convolutional Neural Networks》网页链接 GitHub:网页链接 参阅: 爱可可-爱生活
【论文:兼顾词序/字序的大规模神经网络嵌入(词向量表示)方法】《Modeling Order in Neural Word Embeddings at Scale》A Trask, D Gilmore, M Russell (2015) 网页链接
【论文:基于词典+NB/SVM的Twitter情感分类】《Twitter Sentiment Analysis》 O Kolchyna , TTP Souza, C Treleaven (2015) 网页链接
【模型复杂度 vs. 数据复杂度】《The Model Complexity Myth(or, Yes You Can Fit Models With More Parameters Than Data Points)》网页链接
(http://upload-images.jianshu.io/upload_images/623192-aef56aac5865af20.png)
【幻灯:Rasmus Baath在UseR! 2015上用R做贝叶斯数据分析的教程】《Tutorial: Introduction to Bayesian Data Analysis with R》by Rasmus Bååth 网页链接ipn:网页链接 云:网页链接 网页链接
【论文:面向图像(自动)标注的语言模型】《Language Models for Image Captioning: The Quirks and What Works》J Devlin, H Cheng, H Fang... (ACL2015) 网页链接
【论文:矩阵秩的可视化估计】《Visually Identifying Rank》DF Fouhey, D Maturana (2015) 网页链接,David的得意之作,SIGBOVIK Best Paper Award
【深度学习实例(Lasagne):专辑封面(风格)分类】《Learning About Deep Learning Through Album Cover Classification》网页链接 GitHub:网页链接
机器学习日报 2015-07-06 网页链接 1) Learning to Search的教学讲座 2) 用规则来辅助论坛语料中命名实体抽取 3) Google为Dropout申请的专利 4) web日志异常检测实践之长度异常模型 5) 机器学习和统计模型的差异 完整版20条 网页链接
NLP日报 2015-07-06 网页链接 1) 论文: Mobile Phone Name Extraction from Internet Forums: A Semi-supervised Approach 2) John Langford和Hal Daume III在ICML2015上关于Learning to Search的教学讲座幻灯片 完整版9条 网页链接
之前分享过colah's blog上的博文,今天查了一下作者,发现竟然是个10年上大学的小孩儿,在开源社区相当活跃,想起楼主当年在某公司见到高中保送生各种耍Convet,现在Deep Learning界真是英雄出少年,赶上了好时代啊。附一篇老博《Conv Nets: A Modular Perspective》网页链接 不错的CNN入门
【幻灯:Radim Řehůřek关于数据科学顾问职位的经验&提示】《So you want to be a data science consultant (or hire one)?》by Radim Řehůřek 网页链接总的来说,还是找个全职的吧,顺便这哥们是著名软件包gensim的作者
【论文:"尺度不变"学习与卷积网络】《Scale-invariant learning and convolutional networks》S Chintala, MA Ranzato, A Szlam… (2015) 网页链接
《爱可可老师今日视野(15.07.07)》( 分享自 @简书 ) 网页链接
我在 @SegmentFault 发布了文章【 Python Mock的入门】,传送门: 网页链接
【干货】实例详解机器学习如何解决问题】 网页链接(分享自 @新闻资讯)
最近把人脸识别上流行的CNN算法总结了一下,包括FB的DeepFace:网页链接,Google的FaceNet:网页链接,当然,还有国人的DeepID:网页链接。
《The Users Who Say ‘Ni’: Audience Identification in Chinese-language Restaurant Reviews》斯坦福大学的美国学生Rob Voigt和Dan Jurafsky教授手工标注了中文餐厅评论数据集,研究了其中关于“你”的用法,分析了语境中的说话对象。网页链接
大数据 互联网大规模数据挖掘与分布式处理 第2版,京东:网页链接, China-pub: 网页链接
"David F. Fouhey, Mathematicians Hate Him!" //@winsty: 才发现是sigbovik //@dragonwxl123:David的得意之作,SIGBOVIK Best Paper Award【论文:矩阵秩的可视化估计】《Visually Identifying Rank》DF Fouhey, D Maturana (2015) 网页链接, 幻灯《Visually Identifying Rank》 网页链接
John Langford和Hal Daume III在ICML2015上关于Learning to Search的教学讲座幻灯片: 网页链接其项目主页 网页链接 提供了一个教程 网页链接 , 相应的IPython notebook在 网页链接 #Learning to Search# 。大家可通过这个倒腾下。//@爱可可-爱生活: 《Advances in Structured Prediction》John Langford, Hal Daume III
ACL'2015 Best Paper "AutoExtend: Extending Word Embeddings to Embeddings for Synsets and Lexemes"可以在这儿下载了: 网页链接《AutoExtend: Extending Word Embeddings to Embeddings for Synsets and Lexemes》 其主页 网页链接 还提供了Matlab/Java源码 网页链接
【Faculty Summit 2015早知道】明天就是微软研究院一年一度的学术盛会Faculty Summit啦!来自微软和学术界的计算专家们将围绕“人工智能”的主题,寻求更多机遇和突破。这里有关于计算未来的探讨,人工智能的前世今生,还有社交网络的巨大变革…观看直播视频>>网页链接