Python实战:决战虚拟货币市场

姓名 连嘉玮 学号 16040120089

转自:http://www.jianshu.com/p/a1727437ed3f?utm_campaign=hugo&utm_medium=reader_share&utm_content=note&utm_source=qq

有删节

【嵌牛导读】:比特币市场总是让人难以捉摸。我们如何预测接下来会发生什么?那就让我们用数据来做一些事情吧。

【嵌牛鼻子】:比特币数据

【嵌牛提问】:比特币价值突然出现高峰和低谷的原因是什么?

【嵌牛正文】:

摘要:比特币市场总是让人难以捉摸。比特币价值突然出现高峰和低谷的原因是什么?我们如何预测接下来会发生什么?那就让我们用数据来做一些事情吧。

这篇文章的目标是提供一个介绍:使用Python进行加密货币(例如比特币)分析。我们将通过一个简单的Python脚本来检索、分析以及可视化不同加密货币上的数据。在这个过程中,我们将揭示波动剧烈的市场行为以及它们是如何演变的成一个有趣的趋势。在本教程中,我们关心的只是获取原始数据,揭示隐藏在数字中的秘密。

第1步–环境的创建

步骤1.1 -安装Anaconda

从头开始安装这个项目所需要的依赖关系的最简单方法是使用Anaconda,它是一个预先打包的Python数据科学生态系统和依赖项管理器。要设置Anaconda,我建议遵循正式的安装

如果你是高级玩家,并且你不想使用Anaconda,请跳到第2步。

步骤1.2 -安装Anaconda项目环境

安装了Anaconda,我们需要创建一个新的环境来保持我们的依赖关系。运行conda create --name cryptocurrency-analysis python=3为我们的项目创建一个新的Anaconda环境。

接下来,运行source activate cryptocurrency-analysis(在Linux / macOS上)或activate cryptocurrency-analysis(在Windows上)来激活这个环境。

最后,运行conda install numpy pandas nb_conda jupyter plotly quandl在环境中安装所需的依赖项。

PS:使用环境的好处是如果你计划在你的计算机上开发多个Python项目,Anaconda将为每个项目的依赖项创建一个特殊的环境目录,以保持其独立性。

步骤1.3 -启动可以互动Jupyter Notebook

一旦环境和依赖关系全部建立起来,运行jupyter notebook启动iPython内核,然后打开浏览器http://localhost:8888/。创建一个新的Python notebook,确保使用Python [conda env:cryptocurrency-analysis]内核。

步骤1.4 –在Notebooke顶部导入的依赖项

我们要做的第一件事就是导入所需的依赖关系。

我们还将导入Plotly并启用离线模式。

第2步-检索比特币价格数据

接着,我们准备开始检索数据进行分析。首先,我们需要使用Quandl的免费比特币API获取比特币价格数据。

步骤2.1 -定义Quandl助手功能

我们将定义一个函数来下载和缓存来自Quandl的数据集。

我们正在使用pickle序列化并将下载的数据保存为文件,该函数将以Pandas数据框的形式返回数据。

步骤2.2 – 介绍Kraken交易所的交易数据

首先,我们来介绍Kraken比特币交易所的历史比特币汇率。

我们可以使用head()方法检查数据帧的前5行:

接下来,我们将生成一个简单的图表,作为数据看起来正确的快速可视化验证。

在这里,我们使用Plotly来生成我们的可视化。Plotly是一个不错的选择,因为它使用D3.js生成完全交互的图表,它也容易被嵌入到网页中。

步骤2.3 -从更多BTC交易所提取定价数据

你可能已经注意到了这个数据集有几个明显的下降峰值,特别是在2014年底和2016年初。比特币交易所的性质在于定价是由供求决定的,因此没有一个交易所包含比特币的真正“价格”。为了解决这个问题,我们将从另外三个比特币交易所获取数据,以计算总的比特币价格指数。

首先,我们将从每个交易所下载数据到一个数据框字典:

步骤2.4 -将所有定价数据合并成为单一的数据框

接下来,我们将定义一个简单的函数,将每个数据帧的公共列合并到一个新的组合数据框中。

现在我们将把所有的数据框合并在“加权价格”列中。

最后,我们可以使用tail()方法预览最后五行的结果,以确保它看起来不错。

步骤2.5 -可视化定价数据集

下一步是可视化这些数据集。我们将定义一个辅助函数来提供一个单行命令来从数据框中生成图形。

为了简洁起见,我不过多介绍这些函数的工作原理。如果你想了解更多信息,请查阅Pandas和Plotly的文档。

现在我们可以轻松地为比特币定价数据生成图表。

步骤2.6 -清理和汇总定价数据

虽然这四个数据集走势大致相同,但是我们想要摆脱的是各种各样的违规行为,让我们从数据框中删除所有的零值。

当我们重新绘制数据框时,我们会看到一个更清晰的图表,没有降低峰值。

现在我们可以计算一个新的列,其中包含所有交易所的平均每日比特币价格。

步骤3 -检索Altcoin价格数据

现在我们有了比特币价格的固定时间序列数据集,让我们为非比特币加密货币(通常称为altcoin)提供一些数据。

步骤3.1 -定义Poloniex API帮助函数

为了检索加密货币上的数据,我们将使用Poloniex API。我们将定义两个帮助函数来从这个API下载和缓存JSON数据。

首先,我们将定义get_json_data,它将从提供的URL下载和缓存JSON数据:

接下来,我们将定义一个将生成Poloniex API HTTP请求的函数,并随后调用我们的新get_json_data函数来保存结果数据。

步骤3.2 - 从Poloniex下载交易数据

我们将下载九个顶级加密货币:

Ethereum,Litecoin,Ripple,Ethereum classic,Stellar,Dash,Siacoin,Monero和NEM的交易数据:

我们可以预览Ethereum的价格表的最后几行,以确保可以使用。

步骤3.3 -将价格转换为美元

由于大多数加密货币不支持美元或人民币直接交易,我们需要用比特币作为中介。现在我们可以将这个BTC-altcoin汇率数据与我们的比特币价格指数结合起来,直接计算出每个的BTC-altcoin对应的历史美元的价值。

# Calculate USD Price as a new column in each altcoin dataframeforaltcoininaltcoin_data.keys(): altcoin_data[altcoin]['price_usd']=altcoin_data[altcoin]['weightedAverage']* btc_usd_datasets['avg_btc_price_usd']

接下来,我们可以重新使用我们之前的merge_dfs_on_column函数来为每个加密货币创建美元价格的组合数据框。

最后,我们将比特币价格作为最后一列添加到组合数据框中。

现在我们应该有一个包含我们正在用的十个加密货币的每日美元价格的数据框。

# Chart all of the altocoin prices

df_scatter(combined_df, 'Cryptocurrency Prices (USD)', seperate_y_axis=False, y_axis_label='Coin Value (USD)', scale='log')

步骤3.4 -执行相关性分析

你可能会注意到,加密货币尽管它们的价值和波动性非常不同,但看起来有些相关,因为统计数据的支持。

我们可以使用Pandascorr()方法来测试我们的相关性假设,Pandas中的方法是针对数据框中的每一列相对于每一列计算相关系数。

直接在时间序列(如原始价格数据)上计算相关性可以给出偏差的相关值。我们将通过应用pct_change()方法来解决此问题,该方法将数据框中的每个单元格从绝对价格值转换为日收益率。

首先,我们计算一下2016年的相关性。

这些相关系数接近于1或-1的系数意味着该系列分别强相关或反相关,接近于零的系数意味着这些值不相关。

为了可视化这些结果,我们将创建一个辅助可视化函数:

暗红色的数值代表强相关性(1)(注意,每种货币与其本身强相关),深蓝色的数值代表强逆相关性(-1)。浅蓝色/橙色/灰色/棕褐色代表不同程度的弱/不存在的相关性。

这张图表告诉我们什么?2016年不同加密电子货币的价格波动之间几乎没有显著的联系。

现在,为了验证我们最近几个月加密货币已经变得更加相关的假设,我们只用2017年的数据重复相同的测试。

这些是更重要的相关系数。强大到足以作为投资的唯一基础?当然不是。

但值得注意的是,几乎所有的加密货币已经变得更加相互关联。

End:深入了解XRP和STR

上图中一个值得注意的特征是XRP(Ripple的标记)是最不相关的加密货币。这里值得注意的例外是STR(Stellar的标志),与XRP的相关性最强(0.62)。

可以想象的是,由于使用每种货币的区块链服务的相似性,一些大资金玩家和对冲基金可能使用类似的交易策略来投资Stellar和Ripple。这可以解释为什么XRP与STR相比与其他加密货币有更强的相关性。

最后的一些想法和建议:

1.将更多加密货币的数据添加到分析中。

2.调整相关分析的时间框架和宽度,以获得更精确的趋势视图。

3.搜索交易量和/或区块链挖掘数据集的趋势。如果你想要预测未来的价格波动,则买入/卖出交易量比率可能比原始价格数据更相关。

4.训练机器学习模型以预测明天的价格。如果你有能力,你甚至可以尝试用循环神经网络(RNN)来做这件事。

5.使用你的分析,在交易网站(如Poloniex或Coinbase)上使用各自的交易API 创建一个自动化的“交易机器人” 。

6.分享你的发现!比特币和一般加密货币的最好的部分是它们的分散性使它们比任何其他资产更自由和民主。


本文由阿里云云栖社区组织翻译。

文章原标题《Analyzing Cryptocurrency Markets Using Python》,作者:Patrick Triest

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,470评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,393评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,577评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,176评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,189评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,155评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,041评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,903评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,319评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,539评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,703评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,417评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,013评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,664评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,818评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,711评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,601评论 2 353

推荐阅读更多精彩内容