Go 的数据科学相关资源

GopherDS-Resources首页、文档和下载 - 基于 Go 的数据科学相关资源 - 开源中国社区
https://www.oschina.net/p/resources

这是一个维护良好的和开发中的工具,包,库等的策展列表,内容与使用Go语言做数据科学相关。
GopherDS,这个项目主要是与基于Go的数据科学的工具和学习相关。resources里面存放了收集的基于Go做数据科学项目的相关资源。
运算(Arithmetic):
math - Stdlib 数学函数。

math/cmplx - cmplx 安装包为负数提供基本常数和运算功能。

github.com/gonum/floats - 一套处理 float64 切片的辅佐程序。

github.com/gonum/optimize - Go 语言的优化包。

分类(Classification):
github.com/jbrukh/bayesian - Naive Bayes 分类。

github.com/datastream/libsvm - 基于 LIBSVM 3.14 派生出来的 libsvm golang。

集群(Clustering):
github.com/salkj/kmeans - Go 的现用 Kmeans 算法包。

计算机系统验证(CSV):
encoding/csv - Stdlib CS 功能。

github.com/go-hep/csvutil - 一组用便捷方式处理 CSV 数据文件的 s 和 funcs。

github.com/go-hep/csvutil/tree/master/csvdriver - databases/sql 的 CSV 文库。

分布式数据分析/传递方式(Distributed Data Analysis/Pipelining):
github.com/pachyderm/pachyderm - 集装箱式数据分析 http://pachyderm.io

github.com/chrislusf/glow - Glow 是 Go 的易于使用的分布式计算系统,与 Hadoop Map Reduce, Spark, Flink, Storm 等相似。

github.com/chrislusf/gleam - 另一个基于 Go 的分布式执行系统。

github.com/flowbase/flowbase - 基于 Flow 的 Go(Golang)编程微框架。http://flowbase.org

github.com/scipipe/scipipe - Go (Golang) 的工作流系统,受 Flow-based Programming 启示。http://scipipe.org

通用数据整理(General data munging):
github.com/kniren/gota - 数据帧。

github.com/gopherds/gophernotes - Jupyter 笔记本的 Go 内核。

通用目的性机器学习(General purpose machine learning):
github.com/sjwhitworth/golearn - GoLearn 是 Go 的“电池包含”的机械学习文库。

github.com/cdipaolo/goml - goml
是完全用 Golang 写的机器学习文库,它可以让开发人员将机器学习安装到他们的应用中。

github.com/xlvector/hector - Golang 的机器学习文库。目前,它可以用来解决二元分类问题。

图表(Graphs):
github.com/gyuho/goraph - 图表包能实现图形数据结构和算法。

github.com/gonum/graph - 这是 Go 语言的广义图形包。

github.com/cayleygraph/cayley - Cayley 是一个开源图表,受 Freebase 和 Google's Knowledge Graph 后的图形数据库启发。

JavaScript对象符号(JSON):
encoding/json - Stdlib json 功能。

github.com/tidwall/gjson - 一个 Go 开发包,提供了非常快速和简单的方式来获得一个JSON文档的值。

github.com/pquerna/ffjson - ffjson 为 Go 结构产生 MarshalJSON 和 UnmarshalJSON 功能。

矩阵/线性代数(Matrices/Linear Algebra):
github.com/gonum/lapack - 安装包收集器,为 Go 语言提供 LAPACK 功能。

github.com/gonum/blas - 安装包收集器,为 Go 语言提供 BLAS 功能。

github.com/gonum/matrix - Go 语言的矩阵包。

神经网络(Neural Networks):
github.com/tleyden/neurgo - Go 的神经网络。

github.com/fxsjy/gonn - GoNN 是 Go 的执行器,包括 BPNN, RBF, PCN。

github.com/NOX73/go-neural - golang 的神经网络执行。

自然语言处理(NLP):
github.com/advancedlogic/go-freeling - Freeling 3.1 的局部端口。(http://nlp.lsi.upc.edu/freeling/)

github.com/endeveit/enca - libenca 的最小 cgo 绑定。

github.com/Lazin/go-ngram - Go 的N-gram index。

github.com/reiver/go-porterstemmer - Porter Stemming Algorithm 的 Go 清理指令。

github.com/blevesearch/segment - Unicode Text Segmentation 的Go 文库,Unicode Standard Annex #29 中有描述。

https://github.com/kljensen/snowball - Go 执行的 Snowball 词干 NLP。

github.com/sajari/word2vec - word2vec 是 Go 包,提供查询 word2vec 模式的功能。

Non-SQL 数据库交互(Non-SQL Database Interactions):
gopkg.in/mgo.v2 - mgo 是 Go 语言的 MongoDB 驱动器。

github.com/gocql/gocql - Go 编程语言最快最强大的 Cassandra 代理。

github.com/go-redis/redis - Golang 的 Redis 代理。

github.com/garyburd/redigo - Redis 的 Go 代理。

github.com/tsuna/gohbase - Pure Go HBase 代理。

绘图/仪表板(Plotting/dashboarding):
github.com/gonum/plot - 建立和绘制图的API。

github.com/gigablah/dashing-go - 实时仪表板的一个端口。

概率/统计/实验(Probability/statistics/experiments):
github.com/gonum/stat - Go 的 数据包。

github.com/montanaflynn/stats - 具常用功能的数据包,Golang 标准库缺失。

github.com/URXtech/planout-golang - Go 中的 Planout 译码。

github.com/peleteiro/bandit-server - Bandit-server 是一个 Multi-Armed Bandit api 服务器,它不需要配置也没有持久化存储。

回归(Regression):
github.com/sajari/regression - 多元线性回归。

github.com/glycerine/zettalm - 在 zettabytes 数据中建立线性回归模型的 Go 编码。

SQL-like 数据交互(SQL-like Database Interactions):
databases/sql - sql 包围绕 SQL(或 SQL-like)数据提供通用接口。

github.com/Boostport/avatica - Go database/sql
package 的 Apache Phoenix/Avatica 驱动。

github.com/lib/pq - Go 的 database/sql
安装包的纯 Go postgres 驱动。

github.com/go-pg/pg - Fast PostgreSQL 代理 and ORM。

github.com/jackc/pgx - 纯Go PostgreSQL 驱动,它提供性能提升和更多的功能,同时保持数据库database/sql
兼容。

github.com/go-sql-driver/mysql - Go's database/sql
安装包的 MySQL-Driver 。

github.com/mattn/go-sqlite3 - sqlite3 驱动,符合内置 database/sql
接口。

github.com/lukasmartinelli/pgclimb - 从 PostgreSQL 的数据导出成不同的数据格式 (JSON, JSON Lines, CSV, XLSX, XML) 或使用 Golang 模板。

github.com/lukasmartinelli/pgfutter - 将 CSV 和 JSON 导入 PostgreSQL 的简单方法。

github.com/omniscale/imposm3 - 将 OpenStreetMap 数据导入 PostgreSQL/PostGIS 数据库。

网页抓取(Web Scraping):
github.com/yhat/scrape - Go 网页抓取的简单高效接口。

github.com/cathalgarvey/sqrape - 带有 CSS and Go 反射的简单 Query Scraping 。

建议(Proposed):
Go 自身的多为切片 (Proposal)。

一个强大的(和并发)安装包,处理数据缩小/压缩适宜 (gonum/optimize 会提供很好的基础)。

一个强大的(和并发)安装包,描述带有累赘参数的统计模型(Bayesian and frequentist) 等。

A/B 测试的 Go 安装包。

有数据记录查询的数据库。灵感可以从 Rich Hickey 的 Datomic 数据库抽取,但以开源形式。

一个分布式计算的数据记录查询系统。类似于 Cascalog 的Hadoop 系统, 但取而代之以 Go 工具整合。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,997评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,603评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,359评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,309评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,346评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,258评论 1 300
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,122评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,970评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,403评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,596评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,769评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,464评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,075评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,705评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,848评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,831评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,678评论 2 354

推荐阅读更多精彩内容