240 发简信
IP属地:广东
  • 120
    Keras深度强化学习--A3C实现

    A3C算法是Google DeepMind提出的一种基于Actor-Critic的深度强化学习算法。A3C是一种轻量级的异步学习框架,这种框架使用了异步梯度下降来最优化神经网...

  • 强化学习中on-policy和off-policy方法

    什么是策略? 一个确定性策略定义了一个从行动空间到状态空间的函数。在实际应用中,一个策略的输出常常是一个概率分布,表示在状态下采取每一个动作的概率。 如何学习? 一共有两类方...

  • 强化学习中的model-free和model-based算法

    Model-based强化学习通过一个代理(agent)来尝试理解环境,并且建立模型来表示这个代理。这个模型希望学习到两个函数: 状态转移函数(transition func...

  • 120
    Adam优化算法简介

    背景介绍 在机器学习中,对每一个数据点,我们通过最小化经验风险来从数据中学习,其中是模型的参数。对整个训练集,目标函数即为对应的梯度为然而,当很大的时候,计算个经验风险函数的...

  • pytorch Code Snippets(pytorch常用代码整理)

    本文代码基于PyTorch 1.0版本,需要用到以下包 1. 基础配置 检查PyTorch版本 更新PyTorch PyTorch将被安装在anaconda3/lib/pyt...

  • 120
    实例详解机器学习如何解决问题

    目录 机器学习的概述 对问题建模 准备训练数据 抽取特征 训练模型 优化模型 总结 前言 随着大数据时代的到来,机器学习成为解决问题的一种重要且关键的工具。不管是工业界还是学...

  • 支持向量机系列(一)——线性可分情形下的SVM

    Linear Support Vector Machines in the Linearly Separable Case Problem Description Assum...

  • 120
    神经网络简介

    BP神经网络结构 我们知道单层感知机(perceptron)的局限性:它无法解决异或(XOR)问题,或者其它线性不可分问题。考虑下图的数据集的分类问题。这是一个线性不可分的问...

  • 120
    可视化大屏经验分享

    最近在实际项目中积累了一些经验,以及看到很多大神们的分享,不断学习和丰富关于大屏设计的特点及数据可视化的表达方式。以下经验来自于多处资源,希望对有这方面需求的同学有所帮助。 ...

  • 120
    用户角色模型 | 拒绝“我认为”的设计

    接着我上周《用户体验旅程图 | 概念&实操&模板》的分享,现在让我们继续深入了解“用户角色模型”,看看它是如何为“目标导向设计”做贡献?如何为用户体验旅程图做指引的? 一、什...

  • 动态规划简介

    动态规划(Dynamic Programming, DP)算法采用递归的方式,将较复杂的原问题分解为较为简单的子问题,以求解原问题。 适用情况 一般情况下,我们能将问题抽象出...

  • LightGBM简介

    LightGBM LightGBM(Light Gradient Boosting Machine)是一款基于决策树算法的分布式梯度提升框架。为了满足工业界缩短模型计算时间的...

  • XGBoost简介

    XGBoost Extreme Gradient Boosting(XGBoost)是由华盛顿大学(University of Washington)的陈天奇作为 Distr...

  • 120
    Logistic Regression与Logistic Loss简介

    Logistic Regression 在线性回归中,我们寻找的连续型随机变量和的函数关系式为:,其中为待估参数(包含截距项,即,),为随机误差。那么,如果是离散型随机变量,...