《自己动手写贝叶斯分类器给图书分类》首先,这是一个机器学习初学者兼非数学科班出身的非典型工程师的自学记录。所以本文不会特别理论,也不会太深入地讲解公式,但是会非常有目的性,针对一个特别现实的问题,从头开始分享解决方案,包括某些优化方案。O网页链接(by 电流 )
【重磅新闻】@百度研究院深度学习实验室(IDL)宣布,通过APIStore将其自主研发的百度人脸识别技术免费对外开放!开发者使用百度账号即可直接调用。API调用地址:O网页链接
《字符串匹配的KMP算法》字符串匹配是计算机的基本任务之一。举例来说,有一个字符串”BBC ABCDAB ABCDABCDABDE”,我想知道,里面是否包含另一个字符串”ABCDABD”?许多算法可以完成这个任务,Knuth-Morris-Pratt算法(简称KMP)是最常用的之一。它以三个发明者命名……O网页链接@ruanyf
【IBM顺应潮流,将开源50个项目】O网页链接IT巨头IBM已宣布一个网络门户developerWorks Open,聚合了自己的开源项目,覆盖了分析, 云计算, 物联网, 移动, 社交,Watson及其它领域。目前已开源30个项目,计划到年底至50个,未来会更多项目开源@Linux中国@伯乐头条@极客头条@慕课网 IBM developerWorks Open官方网址:O网页链接,谢右边补充//@极客头条: 【补充】IBM在GitHub也有一个开源项目页面:O网页链接,上面也列出了很多项目哟~ 欢迎大家直接将干货分享到极客头条//@CSDN移动: 已推至极客头条:O网页链接
GitHub推出的跨平台桌面应用创建工具——Electron。之前也有类似的跨平台桌面应用开发解决方案,比如Node-webkit等。详情:O网页链接大家还了解其他的吗?
【一种非常基本的无损音频编解码C语言库】O网页链接《A very basic lossless audio codec using C》支持音频的编码和解码。转需!
Facebook人工智能实验室(FAIR)的Keith Adams在第八届超大数据库会议做了题为“Accelerating Deep Learning at Facebook”的特邀报告。他首先对深度学习进行了一个简单的介绍,然后详细介绍了FAIR为加速深度学习,从硬件、软件和优化等方面所做的一些努力。O网页链接
DEF CON 演示实验室提供了一个为黑客展示其工具的平台,作者会现场演示并讲解其工具,观众可以根据提问并反馈意见。由于工具较多,让SecWiki带大家一一解读。O2015 DEF CON 演示实验室工具抢先看(上)@乌云知识库@深蓝阅读@SecPulse@NaviSec
我发表了《IBM中国研究院-认知医疗部门-招聘信息》O2015年7月24日强烈推荐靠谱团队:“作为IBM中国研究院认知医疗部门的一位研究科学家,你的工作是将大数据分析和认知计算方法用于医疗数据,通过对真实世界中的临床、行为和基因数据的分析建立数据挖掘和机器学习模型并评价模型性能。”
我们利用卷积神经网络建模用户行为,实现个性化广告与购物场景下的点击率预测,CIKM 2015 [A Convolutional Click Prediction Model] 论文下载:O网页链接@好东西传送门 Avazu的数据有一个明显的随时间变化的trend,所以当时都是取最后一两天作为hold-out,随机选取的hold-out结果是比较好但是跟比赛的测试集也就是下一天表现关系并不大。比较期待在实际的训练测试集上跟最好的FM结果的比较。 avazu数据集随机分10%做cv意义确实不大。更正一下,文章中的cv是用的全部数据的随机10%,avazu的问题用训练集的最后一天作为cv是更合理的。如果0.375是在最后一天的cv上得到的,应该是可以秒掉全部队伍的。 赞!0.375在avazu的数据集上是一个非常好的结果,应该可以秒掉当时所有的参赛队伍!
【余凯:未来机器人神重于形,端结合云】O网页链接“人形机器人是重要方向,但不是全部;未来机器人是广义的,是万物智能。BAT可能不会将机器人作为核心战略布局。”
【有效的面试编码练习的7条经验教训】O网页链接高效的面试编码练习有助于我们评估一个候选人是否具有强大的编码能力和工程技能(他们工作中确定无疑所需滴)。编码能力不是唯一需要测试的东西,但它是最重要的。本文是做高效面试编码练习实践中的经验教训。转需!
【科研秘籍:你不可不知四大学术科研工具】国内外一些非常实用的学术科研工具,让你分分钟提高学术科研效率,好工具不要私藏哦,最洋气:Open J-Gate电子期刊;最全面:壹学者——移动学术科研服务平台;最方便:MindJet MindManager;最强大:Endnote。
arXiv [1507.06411] Arbitrariness of peer review: A Bayesian analysis of the NIPS experiment,从贝叶斯分析NIPS,看同行评审的意义O网页链接
《值得关注的 10 个 Python 英文博客》记得我当初开始学习 Python 的时候,我常渴望阅读 Python 的新博文,但相关文章并不多。所以这也是我写本文的一个原因。为向其他朋友传播扩散,本文推荐 10 个值得关注的 Python 英文博客。欢迎在评论区推荐值得关注的 Python 中文博客。O网页链接 其实 The Yhat BlogO网页链接有不少关于Python的文章,侧重于机器学习以及数据科学, TwitterO网页链接
我们综合利微博用户的社交关系和文本内容建模用户的主题兴趣分布,分析用户的主题影响力,可应用在推荐、影响力分析、链路预测等多个场景当中。CIKM15 [Social-Relational Topic Model for Social Networks] 下载地址O网页链接@好东西传送门@爱可可-爱生活
我们建模了不完整观测的多视角数据的结构化表达,应用在不完全观测多视角学习中,尤其是聚类的场景上,CIKM 2015 Long [Incomplete Multi-view Clustering via Subspace Learning]O网页链接@好东西传送门@爱可可-爱生活
我们利用卷积神经网络建模用户行为,实现个性化广告与购物场景下的点击率预测,CIKM 2015 [A Convolutional Click Prediction Model] 论文下载:O网页链接@好东西传送门 0.375的结果是多个参数都在最优值上获得的。调参的过程是固定其他参数只调整一个参数,因此其不是全局最优结果。
【在Apache Spark上跑Logistic Regression算法】在本文中,你将看到Apache Spark可以用于机器学习的任务,如logistic regression。虽然这只是非分布式的单机环境的Scala shell demo,但是Spark的真正强大在于分布式下的内存并行处理能力。O网页链接
【7个常见数据库设计错误】O网页链接以足够的理论做支撑,以实例学习数据库建模。干货,强烈推荐!
Python for Image Understanding: Deep Learning with Convolutional Neural NetsO网页链接
Easy Bayesian Bootstrap in R:O网页链接
Machine Learning Trick of the Day (1): Replica TrickO网页链接
Nvidia提供了一门在线Deep Learning过程,从零开始:O网页链接,不需要GPU,可以直接在云端运行
Introduction to Deep Neural Networks,DL4J上的深度神经网络介绍:O网页链接
【凸优化概览】《Convex Optimization Overview》by Zico Kolter (updated by Honglak Lee)O网页链接
【Extreme Classification实现代码】《Extreme Classification Code Release》O网页链接GitHub:O网页链接
【论文+代码:高效并行自组织映射(SOM)库Somoclu】《Somoclu: An Efficient Parallel Library for Self-Organizing Maps》P Wittek, SC Gao, IS Lim, L Zhao (2015)O网页链接适合做高维稀疏数据可视化 GitHub:O网页链接介绍文章O网页链接
《爱可可老师今日视野(15.07.24)》( 分享自@简书)O网页链接
【Online Multi-Class LPBoost/Online Multi-Class Gradient Boost/Online Random Forest开源代码】O网页链接Github:O网页链接
【IPN:Jake VanderPlas在PyData Seattle 2015上的Scikit-Learn教程】《PyData Seattle 2015 Scikit-Learn Tutorial》O网页链接GitHub:O网页链接
【基于Kaggle泰坦尼克数据集的交互Python教程】"...get started with Kaggle, and make your first submission to Titanic... Learn about logistic regression, random forests, gradient boosting, ensembling, and more."O网页链接R语言参阅:O爱可可-爱生活
【R时序分析与挖掘】《Time Series Analysis and Mining with R》O网页链接
【Ferenc Huszár关于Facebook拉普拉斯金字塔图像生成模型论文的评论】《Comment on Generative Image Models via Laplacian Pyramids》by Ferenc HuszárO网页链接参阅O爱可可-爱生活
【开源:Airbnb情境推荐应用Localebnb】《Localebnb: An Airbnb Contexual Recommendation App》GitHub:O网页链接demo:O网页链接
【论文+代码(matlab):从Elastic Net缩减到SVM(SVEN)——面向多核/GPU的快速计算】《A Reduction of the Elastic Net to Support Vector Machines with an Application to GPU Computing》Q Zhou, W Chen, S Song... (AAAI2015)O网页链接code:O网页链接
【论文:基于Attention-based RNN的连续语音识别】《End-to-end Continuous Speech Recognition using Attention-based Recurrent NN: First Results》J Chorowski, D Bahdanau, K Cho, Y Bengio (NIPS2014)O网页链接
【论文+代码:RNN+ReLU(iRNN)】《A Simple Way to Initialize Recurrent Networks of Rectified Linear Units》Q Le, N Jaitly, G Hinton [Google] (2015)O网页链接code:O网页链接
【视频:Facebook加速深度学习】《XLDB2015: Accelerating Deep Learning at Facebook》by Keith AdamsO网页链接云:O网页链接 提供的译文《Facebook加速深度学习研发》O网页链接