240 发简信
IP属地:广东
  • centos7 jupyter notebook 远程配置

    Anaconda 安装 Anaconda:https://www.anaconda.com/[https://www.anaconda.com/] 下载地址: https:/...

  • neo4j 4.1.3

    一、环境准备 需要java11 二、下载neo4j 解压并配置conf/neo4j.conf ``` # Bolt connector dbms.connector.bolt...

  • linux 安装 pyfasttext 报错

    一、主要是 pyfasttext 包 无法自动安装所需的包,只能自己看报错,安装好相应的包 可能的包有: numpy cython 二、gcc编译器的问题 需要安装高版本的g...

  • Sequence to Sequence Learning with Neural Networks

    Sequence to Sequence Learning with Neural Networks:使用神经网络来做序列到序列的学习 Abstract 本文提出了一种通用的...

  • Fasttext

    Bag of Tricks for Efficient Text Classification 对于高效率文本分类的一些技巧 一、论文概览: Abstract 本文提出了一种...

  • charTextCNN详解

    Character-level Convolutional Networks for Text Classification:使用字符级别的卷积神经网络来做文本分类任务 好的...

  • TextCNN详解

    Convolutional Neural Networks for Sentence Classification(基于卷积神经网络的句子分类) 三大顶会 ACL EMNLP...

  • C2W 论文详解

    Finding Function in Form: Compositional Character Models for Open Vocabulary Word Repre...

  • GloVe详解

    一、论文总览: 摘要 Abstract:提出了一种新的词向量学习方法GloVe, GloVe能够同时利用全局的统计信息和局部的上下文信息从而学习到非常好的词向量。 Intro...

  • 120
    word2vec详解(未完待续)

    一、重要的两篇论文 (1)Efficient Estimation of Word Representations in Vector Space(向量空间中词表示的有效估计...

  • 120
    import torchvision报错ImportError: cannot import name 'PILLOW_VERSION' from 'PIL'

    因为我安装的是cuda10.0,所以只能安装torch1.2版本。出现上述错误。 原因:PILLOW_VERSION 已经在新版中remove 解决方法:降低pillow版本...

  • pyspark Illegal pattern component: XXX

    在使用python版本的bigdl时,运行demo:报如下错误: Py4JJavaError: An error occurred while calling o255.js...

  • 120
    1050ti cuda10安装

    官方安装教程 CUDA:https://docs.nvidia.com/cuda/cuda-installation-guide-microsoft-windows/inde...

  • 什么是窗口函数

    窗口函数分为聚合函数和分析函数: 分析函数用于计算基于组的某种聚合值,它和聚合函数的不同之处是:对于每个组返回多行,而聚合函数对于每个组只返回一行。 聚合函数: COUNT、...

  • 120
    Spark数据倾斜问题处理

    一、判断是否是数据倾斜 看读取时间:数据来源,如Kafka,数据库读取 运行本身:数据问题 二、数据处理: 1)数据预处理 一是hive或sparkSQL预处理,过滤无用的k...

  • 120
    Spark sql 连接hive时,读取不到hive元数据问题

    问题: 再来看看,$SPARK_HOME 原因分析: 出现上述的情况原因就是spark没有检测到hive存在,所以自己创建了默认元数据。 解决方案: hive: 修改hive...

  • 一个大佬的点评,在评论里面记录下来:
    1、为什么用大数据--信息爆炸时代,数据量过于庞大,传统方式处理成本太高,衍生出大数据处理成本较低的方式
    2、大数据做什么的--降低成本,达到最优化
    3、推荐系统是在大数据的基础上衍生的一个分支,目的是为了更好提高用户体验,或者产品的销售等等,利用大数据达到一定的目的

    对大数据的一些想法

    我看到有些人,到现在其实对大数据到底是什么?要做什么?怎么做?(其实这是哲学的经典的三个问题,遇到问题,都从这些问题出发,对自己还是有好处的)其实都还不是特别清晰。所以我想说...