2015-7-7 收集资料

很多创新公司都在利用GPU做一些你不知道的神奇事情,比如伦敦的Mirriad,他们开发的计算机视觉技术依靠同时运行的21种算法,能够将电视中的2D影片变成3D数据,然后将场景里出现的广告进行替换,并做到完美结合,就像是拍摄时已经存在一样。快来看下吧: Mirriad - Product Placement

【ICML2015教程集锦(讲义)】《Tutorials - ICML2015》网页链接 云:网页链接

【深度学习——成长的烦恼】《Growing Pains for Deep Learning》By Chris Edwards 网页链接提供的译文《深度学习成长的烦恼》网页链接

【不是BAT怎么迈向超级智能?——深度学习XSystem平台让创新者大有可为】 不是BAT怎么迈向超级智能?——深度学习XSystem平台让创新者大有可为 不具备人工智能工具的中小企业或科研团队,无法挖掘数据价值,面对再大量的数据也只能“望数兴叹”,因此怎么让BAT占据垄断优势地位的深度学习技术为社会广泛共享,成为一个新命题。
【三强联手推出深度学习云平台】6月24日中科曙光技术创新大会上,曙光公司、中科院计算所(ICT)、NVIDIA公司共同签署了深度学习联合实验室成立备忘录,曙光深度学习XSystem系统、“XMachine深度学习一体机”同时发布,可为一些中小型企业提供面向深度学习和人工智能的云服务。

【论文:网格LSTM】《Grid Long Short-Term Memory》N Kalchbrenner, I Danihelka, A Graves (2015) 网页链接

大规模机器学习优化算法特点是样本和特征都很大,在原空间上求解发展历史如下图,最后华山论剑的结果是百度大数据实验室张潼老师的SVRG。对偶空间求解大规模优化问题遇到各种SDCA变种。
昨天听Peter Richtárik ; Mark Schmidt的tutorial: Modern Convex Optimization Methods for Large-scale Empirical Risk Minimization,结论是无论是原空间还是对偶空间,目前笑到最后的都是张潼老师的算法SVRG(原空间);Quartz(对偶空间)。现招有志青年跟张老师继续发扬光大,tangyan02@baidu.com
现招人在张老师指导下, 与我们一起做出更快、更好的大规模分布式机器学习算法, 无论从算法优化角度还是高性能计算角度都可以,前者需要优化基础较好,后者只要求算法和数据结构特别突出(比如参加程序竞赛获奖)。 欢迎投递简历给我们,注明你的职位需求,可入职时间。
张雨辰介绍了通迅更有效的大规模机器学习算法DiSCO,通迅代价不依赖样本大小和条件数。参考了百度大数据实验室张潼老师去年ICML的算法DANE。

《Mobile Phone Name Extraction from Internet Forums: A Semi-supervised Approach》最近尝试用规则来辅助论坛语料中命名实体抽取,首先根据Brown clustering来初步描述实体命名的多样性,然后再利用规则得到大量训练样本,最后进行信息提取。在英文手机论坛上得到了不错的结果。Mobile Phone Name Extraction from Internet Forums: A Semi-supervised Approach 网页链接

《Advances in Structured Prediction》John Langford, Hal Daume III,John Langford和Hal Daume III在ICML2015上关于Learning to Search的教学讲座幻灯片: 网页链接,其项目主页 网页链接 提供了一个教程 网页链接 , 相应的IPython notebook在 网页链接 #Learning to Search# 。大家可通过这个倒腾下。

《AutoExtend: Extending Word Embeddings to Embeddings for Synsets and Lexemes》 其主页网页链接 还提供了Matlab/Java源码网页链接,ACL'2015 Best Paper "AutoExtend: Extending Word Embeddings to Embeddings for Synsets and Lexemes"可以在这儿下载了: 网页链接

【基于Caffe/CNN轻量/可扩展/易用的深度造梦Python包bat-country】《bat-country: an extendible, lightweight Python package for deep dreaming with Caffe and Convolutional Neural Networks》网页链接 GitHub:网页链接 参阅: 爱可可-爱生活

【论文:兼顾词序/字序的大规模神经网络嵌入(词向量表示)方法】《Modeling Order in Neural Word Embeddings at Scale》A Trask, D Gilmore, M Russell (2015) 网页链接

【论文:基于词典+NB/SVM的Twitter情感分类】《Twitter Sentiment Analysis》 O Kolchyna , TTP Souza, C Treleaven (2015) 网页链接

【模型复杂度 vs. 数据复杂度】《The Model Complexity Myth(or, Yes You Can Fit Models With More Parameters Than Data Points)》网页链接
(http://upload-images.jianshu.io/upload_images/623192-aef56aac5865af20.png)

【幻灯:Rasmus Baath在UseR! 2015上用R做贝叶斯数据分析的教程】《Tutorial: Introduction to Bayesian Data Analysis with R》by Rasmus Bååth 网页链接ipn:网页链接 云:网页链接 网页链接

【论文:面向图像(自动)标注的语言模型】《Language Models for Image Captioning: The Quirks and What Works》J Devlin, H Cheng, H Fang... (ACL2015) 网页链接

【论文:矩阵秩的可视化估计】《Visually Identifying Rank》DF Fouhey, D Maturana (2015) 网页链接,David的得意之作,SIGBOVIK Best Paper Award

【深度学习实例(Lasagne):专辑封面(风格)分类】《Learning About Deep Learning Through Album Cover Classification》网页链接 GitHub:网页链接

机器学习日报 2015-07-06 网页链接 1) Learning to Search的教学讲座 2) 用规则来辅助论坛语料中命名实体抽取 3) Google为Dropout申请的专利 4) web日志异常检测实践之长度异常模型 5) 机器学习和统计模型的差异 完整版20条 网页链接

NLP日报 2015-07-06 网页链接 1) 论文: Mobile Phone Name Extraction from Internet Forums: A Semi-supervised Approach 2) John Langford和Hal Daume III在ICML2015上关于Learning to Search的教学讲座幻灯片 完整版9条 网页链接

之前分享过colah's blog上的博文,今天查了一下作者,发现竟然是个10年上大学的小孩儿,在开源社区相当活跃,想起楼主当年在某公司见到高中保送生各种耍Convet,现在Deep Learning界真是英雄出少年,赶上了好时代啊。附一篇老博《Conv Nets: A Modular Perspective》网页链接 不错的CNN入门

【幻灯:Radim Řehůřek关于数据科学顾问职位的经验&提示】《So you want to be a data science consultant (or hire one)?》by Radim Řehůřek 网页链接总的来说,还是找个全职的吧,顺便这哥们是著名软件包gensim的作者

【论文:"尺度不变"学习与卷积网络】《Scale-invariant learning and convolutional networks》S Chintala, MA Ranzato, A Szlam… (2015) 网页链接

《爱可可老师今日视野(15.07.07)》( 分享自 @简书网页链接

我在 @SegmentFault 发布了文章【 Python Mock的入门】,传送门: 网页链接

【干货】实例详解机器学习如何解决问题】 网页链接(分享自 @新闻资讯

最近把人脸识别上流行的CNN算法总结了一下,包括FB的DeepFace:网页链接,Google的FaceNet:网页链接,当然,还有国人的DeepID:网页链接

《The Users Who Say ‘Ni’: Audience Identification in Chinese-language Restaurant Reviews》斯坦福大学的美国学生Rob Voigt和Dan Jurafsky教授手工标注了中文餐厅评论数据集,研究了其中关于“你”的用法,分析了语境中的说话对象。网页链接

大数据 互联网大规模数据挖掘与分布式处理 第2版,京东:网页链接, China-pub: 网页链接

"David F. Fouhey, Mathematicians Hate Him!" //@winsty: 才发现是sigbovik //@dragonwxl123:David的得意之作,SIGBOVIK Best Paper Award【论文:矩阵秩的可视化估计】《Visually Identifying Rank》DF Fouhey, D Maturana (2015) 网页链接, 幻灯《Visually Identifying Rank》 网页链接

John Langford和Hal Daume III在ICML2015上关于Learning to Search的教学讲座幻灯片: 网页链接其项目主页 网页链接 提供了一个教程 网页链接 , 相应的IPython notebook在 网页链接 #Learning to Search# 。大家可通过这个倒腾下。//@爱可可-爱生活: 《Advances in Structured Prediction》John Langford, Hal Daume III

ACL'2015 Best Paper "AutoExtend: Extending Word Embeddings to Embeddings for Synsets and Lexemes"可以在这儿下载了: 网页链接《AutoExtend: Extending Word Embeddings to Embeddings for Synsets and Lexemes》 其主页 网页链接 还提供了Matlab/Java源码 网页链接

【Faculty Summit 2015早知道】明天就是微软研究院一年一度的学术盛会Faculty Summit啦!来自微软和学术界的计算专家们将围绕“人工智能”的主题,寻求更多机遇和突破。这里有关于计算未来的探讨,人工智能的前世今生,还有社交网络的巨大变革…观看直播视频>>网页链接

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容

  • 各种机器学习的应用场景分别是什么?例如,k近邻,贝叶斯,决策树,svm,逻辑斯蒂回归和最大熵模型。 如何评价Pyt...
    hzyido阅读 1,404评论 0 7
  • 《爱可可老师今日视野(15.08.07)》( 分享自@简书)O网页链接 《爱可可老师今日视野(15.08.04)》...
    hzyido阅读 1,345评论 0 2
  • 机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 1) 注...
    Albert陈凯阅读 22,198评论 9 476
  • 读了第二遍 哪怕已经知道了大概故事 感触也和第一遍完全不同了 用看似完全不相干的片段人物故事架起整本书 随着阅读的...
    二京阅读 258评论 0 2
  • 哈哈, 你怎么点进去了? 跟你说了, 这篇文章内容是空白的。 不信就算了, 这么烂的文章, 你要看? 算了吧, 看...
    抽风一刻阅读 112评论 0 0