枫隐_5f5f - 简书

发简信

10
关注
5
粉丝
28
文章
5782

字数
5

收获喜欢

IP属地：广东

枫隐_5f5f

通配符查询删除redis

660 0 0
枫隐_5f5f

MLeap demo参考
pyspark环境下如何使用mleap对模型进行序列化任务提交脚本 spark-submit --packages ml.combust.mleap:mleap-spark...

774 0 0

枫隐_5f5f

Flask 服务
1 主程序app.py 2 运行flask 3 post 请求

126 0 0
枫隐_5f5f

Tensorflowonspark 示例MNIST 提交到spark集群上运行的脚本
在官方示例中给出的模型存储路径是hdfs路径，但是在个人运行本示例时，脚本运行阻塞，最终超时报错解决办法有两种一将模型的存储路径设置为本地路径此外还可以配置一些其他参数 ...

462 0 0
枫隐_5f5f

Tensorflowonspark 读取SparkRDD为输入并进行批次训练
要点：基于tensroflowonspark实现基础的回归分析数据的输入来自spark RDDbatch训练代码主程序代码main.py 自定义Tensorflow任务...

685 0 0
枫隐_5f5f

Spark 在脚本中设置日志输出等级
在任务脚本中定义日志输出的等级，只输出WARN级别以上的日志

495 0 0
枫隐_5f5f

mapPartitions 使用
Spark中的map函数是将每个rdd都进行自定义函数处理mapPartitions则是将多个rdd进行分区，对每个分区内部的rdd进行自定义函数的处理 mapPartiti...

4433 0 0

枫隐_5f5f

spark 读取mongodb中的数据然后存储到hdfs上

1257 0 0
枫隐_5f5f

对同一个id只保留最新时间创建的记录
多条创建记录的表格中查找最近一条的记录简单来说就是对id先进行groupby 然后找到最大/最小的时间然后选择对应的记录

296 0 0
枫隐_5f5f

spark DaraFrame转换成pandas DataFrame
方法一单机版方法二分布式

520 0 0
枫隐_5f5f

Tensorflow 训练好的模型保存和载入
方法一这种存储方式在加载模型时需要再次定义网络结构模型训练和存储加载模型方法二这种存储方式在加载模型时不用定义网络结构模型训练和存储模型加载 1.Tenso...

3091 0 1
枫隐_5f5f

Tensorflowonspark基本示例
用于快速将一个Tensorflow应用扩展到spark集群上进行分布式训练一主程序代码为其中parser.add_argument()可以按照需求自行添加，但--rdm...

981 1 0

枫隐_5f5f

spark SQL 中 rdd与dataframe相互转换
将RDD转换成dataframe的方法：spark.createDataFrame(rdds,colname_list) 将dataFrame转换成RDD的方法df.rdd

2290 0 0
枫隐_5f5f

特征工程
核心思路先撒网再挑选根据业务和经验选择与问题可能相关的所有变量然后再精细筛选 1.在撒网阶段若变量满足以下任意条件则先剔除：（1）缺失值较高可以...

674 0 0
枫隐_5f5f

word2vec 从抽提特征到模型训练
Kaggle数据集合进行情感偏好性分析主要涉及将自然语言转换成词向量作为特征用于模型参数训练

483 0 1
枫隐_5f5f

Gensim调用Word2Vec
使用python自然语言处理包Gensim 调用Word2Vec进行词向量转换

316 0 0
枫隐_5f5f

Spark读写MongoDB数据并统计

799 0 0

枫隐_5f5f

Spark 读取本地数据并存储到MongoDB、Elasticsearch中

718 0 0
枫隐_5f5f

spark streaming 初步
一基本概念 streaming的重要特点是使用了spark DataFrame spark streaming 是数据流式系统，采用RDD批量模式加速处理数据，以小批...

308 0 0
枫隐_5f5f

Spark ML
MLLIB 包是基于RDD操作ML包是基于DataFrame操作的 ML包主要分成三个部分：转换器评估器管道一转换器将一个新列附加到dataframe上来转换数据...

2217 0 0

暂无个人介绍