Kappenball,Neil Lawrence昨天在ICML上提到的O网页链接
#对比nCRP, nHDP#Markov Mixed Membership Models 【Empirical results demonstrate that Markov M3 performs well compared with tree structured topic models, and can learn meaningful dependency structure between topics】 【nCRP/nHDP 见OPoetNiu】
Google Files AI PatentsO网页链接
【lateral.io的arXiv检索/相关推荐引擎Lateral × arXiv】O网页链接不错,推荐 介绍文章《Leveraging Machine Learning to Discover Research》O网页链接 对其背后arXiv数据获取技术的介绍《The arXiv as Dataset》O网页链接
异常检测 iForest ICML上遇到国际机器学习学会首任主席Dietterich教授,对我们的iForest算法大赞,说尝试了很多方法,还是这个又快又好。前段时间澳洲某startup公司也说他们发现iForest在信息安全领域的异常检测应用中表现最佳并准备做进产品。isolation Forest,推荐给有异常检测任务的同学O网页链接 @南大周志华 Isolation Forest detects data-anomalies using binary trees. Platform: R (www.r-project.org) Reference: Fei Tony Liu, Kai Ming Ting, and Zhi-Hua Zhou, “Isolation Forest”, IEEE International Conference on Data Mining 2008 (ICDM 08)
【干货:分布式系统资料大全】各类分布式系统的Paper、课程、电子书、文章,覆盖数据、存储、搜索等实践案例。赶快下载不谢!O网页链接
【A survey on the application of recurrent neural networks to statistical language modeling】 罗列了不少trick和idea RNN在sequence Modeling上的paper越来越多 这两年已经灌得不少了 O网页链接
【deeplearning4j的CNN专题页】《Convolutional Networks》O网页链接
【DE5-Net 正式成为Altera认证之OpenCL网络平台】O网页链接Altera网站提供了三种主要的OpenCL参考平台之应用: 网络(Network)、系统单芯片(SoC)及高效能运算(HPC, High-Performance Computing)平台。我们很高兴的宣布,继HPC及SoC平台之认证后,我们的DE5-Net同样成功地获得了网络平台的认证。
【通俗易懂的机器学习入门指导】我们要对数据进行处理,希望从数据中得到我们想要的信息。机器学习其实是对人类智能的模仿,也是实现人类和更高智能的必经之路。O通俗易懂的机器学习入门指导我们要对数据进行处理,希望从数据中得到我们想要的信息。机器学习其实是对人类智能的模仿,也是实现人类和更高智能的必经之路。O通俗易懂的机器学习入门指导
《如何系统地学习数据挖掘?》数据挖掘系统的学习过程是怎么样的,应该看哪些书?(来自: 知乎 )cc@酷勤网-程序员的那点事
【幻灯+IPN:Python下用Blaze/Bokeh构建数据应用】《Building Python Data Applications: with Blaze and Bokeh》by Christine DoigO网页链接ipn:O网页链接
【ICML2015深度学习专题讨论会总结】《Brief Summary of the Panel Discussion at DL Workshop@ICML2015》by KyungHyun ChoO网页链接 pdf:O网页链接
【(Python)五维(x, y, z, 时间, 颜色标注)动画gif制作库Animator5D】O网页链接
《爱可可老师今日视野(15.07.13)》( 分享自@简书)O网页链接
【(R)K-Means聚类】《K-Means Clustering》by Janu VermaO网页链接GitHub:O网页链接
【17亿条规模的Reddit评论数据集】《Reddit Comments Dataset ~ 1.7 billion comments》O网页链接BigQuery:O网页链接
【ICML2015深度学习专题讨论会总结】《Brief Summary of the Panel Discussion at DL Workshop@ICML2015》by KyungHyun ChoO网页链接
【课程资料:系统介绍表示学习的深度学习课程】《IFT6266 – H2015 Representation Learning - A mostly deep learning course》by Aaron Courville, University of MontrealO网页链接Lectures:O网页链接Resources:O网页链接
【coursera-dl采集程序原理分析】《阅读 coursera-dl 源码》by@only4iceO网页链接
【Y Bengio写的深度学习展望文章】《The Promise of Deep Learning》By Yoshua BengioO网页链接
【视频:面向数据科学的统计思维】《Statistical Thinking for Data Science | SciPy 2015 | Chris Fonnesbeck》O网页链接云:O网页链接
《Learning to Mine Chinese Coordinate Terms Using the Web》并列结构指同一个概念的不同实例之间,或者一个概念的直接下位之间;如果两个term是并列的,那互相替换仍是语法正确的,尽管不一定都为真 [Learning to Mine Chinese Coordinate Terms Using the Web,Huang,arXiv15] 用半监督的规则+统计从中文搜索结果为种子term抽取并列结构且聚类O网页链接
Bootstrap是Bradley Efron(O网页链接发明的一种Plug-in估计方法(见wikeO网页链接, 或者WileyO网页链接),核心是用经验分布去估计总体分布。参数用bootstrap方法估计,其准确性也用bootstrap来估计。但是这个估计方法自己无法从理论上justify自己的优良性.Efron自己用这个方法讨论了许多估计问题,其最近的一项研究是用bootstrap方法设计了一种post-model selection的估计(Efron (2014). Estimation and Accuracy After Model Selection, JASA ),本质上有点类似于model averaging估计,他还用bootstrap研究了这个估计的准确性的估计。有时候觉得,统计处于如此的尴尬境地,想证明的证不了,能够证明的又没啥用,于是,各路统计学者就主要靠着卖萌为生。这是另外一个话题了。回复@你是不是也会常常想起那个夏天:比如说用cross-validation来做模型选择,其理论上的好处,除了一个相合性,啥实质性的性质都证明不了。但是,模型选择的目的还是用来做进一步的推断,仅仅有个模型选择的相合性有啥用呢?最需要的结论是cv做模型选择得到的估计与不做模型选择的OLS的优良性比较。