TensorFlow安装笔记与基本操作

阅读原文请点

毫无疑问TensorFlow从诞生之初便是各种贵族血统,光环加身。相比于目前比较流行的一些deep learning 框架,比如Theano,

Caffe2,或者是百度的PaddlePaddle,虽然TensorFlow起步比较晚,但竟后来居上获得了大多数人的青睐,不管是学术研究还是产业界。究其原因,当然每个人都能说上几点。但写TensorFlow for Machine Intelligence的哥么总结的很到位,简单的说就是TensorFlow旨在解决目前深度学习框架在学术研究的易用性和产业界的实用性不能兼得的困境。

"Unfortunately, most of these libraries have a large trade off between flexibility and production-worthiness. Flexible libraries are invaluable for researching novel model architectures, but are often either too slow or incapable of being used in production. On the other hand, fast, efficient, libraries which can be hosted on distributed hardware are available, but they often specialize in specific types of neural networks and aren’t suited to researching new and better models. This leaves decision makers with a dilemma: should we attempt to do research with inflexible libraries so that we don’t have to reimplement code, or should we use one library for research and a completely dif erent library for production? If we choose the former, we may be unable to test out dif erent types of neural network models; if we choose the latter, we have to maintain code that may have completely di erent APIs. Do we even have the resources for this?

TensorFlow aims to solve this dilemma."

好了,闲话不多扯。本篇主要介绍TensorFlow在MacOS上的的安装过程,以及配合Jupyter Notebook做些简单的入门操作。

安装配置

TensorFlow

官网提供了4种安装方法,没有优劣之分,只是针对不同用户不同场景进行选择。

  1. virtualenv.

    和已有Python开发环境隔离的虚拟环境,不依赖当前工作环境的各种package版本,安装TensorFlow的所有依赖到独立的目录,需要时只要activate下就行

  2. "native" pip.

    使用已有的Python环境,相关packages(比如numpy等),只安装必要的依赖,比方法1需要下载的packages一般要少。但如果原环境比较老旧或是跟TensorFlow依赖有不兼容等,安装过程较为折腾。

  3. Docker.

    相对来说镜像比较大,可能有大几百M,但如果系统已经安装Docker或Docker重度用户,可以试试.

  4. installing from source.

    最折腾,但有收获……

山人比较懒,直接采用第一种virtualenv安装。

安装virtualenv

sudo easy_install pip
sudo pip install --upgrade virtualenv

创建 virtualenv和相关的setup tools.

# for python 2.7
virtualenv --system-site-packages ~/tensorflow
# for python 3.n
virtualenv --system-site-packages -p python3 ~/tensorflow

根据不同的shell,激活virtualenv

# for bash, sh, ksh, or zsh
source ~/tensorflow/bin/activate

# csh or tcsh
source ~/tensorflow/bin/activate.csh

# for fish
source ~/tensorflow/bin/activate.fish

检查pip version, 如果小于8.1,执行下面一行

easy_install -U pip

用pip安装TensorFlow及其依赖的环境.

# for Python 2.7
pip install --upgrade
# for Python 3.n
pip3 install --upgrade tensorflow

OK, that's All.

# deactivate TensorFlow
deactivate
# remove TensorFlow and its dependencies
rm ~/tensorflow

检查是否安装成功

$ python
Python 2.7.10 (default, Feb  7 2017, 00:08:15)
[GCC 4.2.1 Compatible Apple LLVM 8.0.0 (clang-800.0.34)] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>>import tensorflow as tf

Jupyter Notebook

直接通过pip来安装Jupyter:

# for python3
python3 -m pip install --upgrade pip
python3 -m pip install jupyter

# for python2.7
python -m pip install --upgrade pip
python -m pip install jupyter

检查是否安装成功

直接runjupyter notebook,打开浏览器进入网址http://localhost:8888/tree

数据类型与基本操作

In general, TensorFlow提供了一整套的tool suites, 对机器学习领域一些基础的操作、领域模型、对象和建模学习过程进行了统一的抽象和封装。并且以图模型的方式来组合各个操作和数据流。山人的体会是,TensorFlow更像是一门语言,从基本的数据类型,如常量,变量;基本操作,如数学运算,向量,矩阵运算;当然还有其最为擅长的数值运算,求导数、梯度之类的。

且如果从编程语言的角度来看TensorFlow,它更像是一种函数式语言而非命令式的。因为每次我们用TensorFlow进行计算建模时,基本的过程总是类似的:首先声明基本的数据类型和operator节点(Tensor),定义一个graph;然后当真正需要计算时,开一个Session,把这个graph放到Session里执行,这过程中在喂给图模型实际的数据,最后计算出结果。

常量类型

tensor便是TensorFlow最基本的数据类型概念,其表示某种geometric对象,用来描述基本的标量(scalar), 向量(vectors),或是更高维度的(matrix等)之间的线性关系。因此我们一般语言中提及的数值常量,向量或是二维矩阵,或是更高纬的vectors,都是一种特殊的tensor。在TensorFlow中

# scalar(0d tensor)
tf.constant(2, name="scalar")
# vector(1d tensor)
tf.constant([2, 4], name="vector")
# matrix(2*2 tensor)
tf.constant([[0, 1], [2, 4]], name="matrix")

如早期Machine Learning课程上用的Scientific Programming Language Octave,TensorFlow 也支持创建很多具有特定值和形状的Tensor,

# tf.zeros(shape, dtype=tf.float32, name=None)
# 创建一个所有元素全部是0的2*4举证
tf.zeros([2, 4], tf.int32) ==> [[0, 0, 0, 0], [0, 0, 0, 0]]

# tf.zeros_like(input_tensor, dtype=None, name=None, optimizer=True)
# 创建一个跟input_tensor一样形状的Tensor,只是所有的元素都是0.
tf.zeros_like(input_tensor)

# 同理还有tf.ones, tf.ones_like

tf.ones([2, 4], tf.int32) ==> [[1, 1, 1, 1], [1, 1, 1, 1]]
tf.ones_like(input_tensor)

# 当然如果你问我们创建其他任意值得Tensor么?答案当时是肯定的。
# tf.fill(dims, value, name=None);
tf.fill([2, 4], 8) ==> [[8, 8, 8, 8], [8, 8, 8, 8]]

创建线性序列(Sequence)

# tf.linspace(start, stop, num, name=None);
# 创建一个有num个元素的序列,起始和结束点分别是start和stop,值得注意的是这里的start和stop的dtype类型不能为tf.int32, 而是tf.float32或tf.float64.
tf.linspace(0.0, 10.0, 5) => [  0\.    2.5   5\.    7.5  10\. ]

# tf.range(start, limit=None, delta=1, dtype=None, name='range')
# 创建一个从start点开始,以步长delta增长的序列。最后一个点可以小于stop,但不包括stop。且相比于tf.linspace,start和stop可以是tf.int32也可是tf.float32等。
tf.range(0, 10, 5) => [ 0, 5];

有一点值得注意的时,虽然TensorFlow兼容几乎numpy所有的数据类型,TensorFlow的序列是不可迭代的。

for _ in np.linspace(0, 10, 4): # OK
for _ in tf.linspace(0, 10, 4): # TypeError: 'Tensor' object is not iterable.

随机抽样分布

创建随机正态分布和truncated_normal正态分布。

truncated正态分布顾名思义就是针对一般按照均值和标准差进行抽样的正态分布样本进行一些删选,移除那些距离均值距离大于2倍标准差的点

<label for="sn-1" class="margin-toggle sidenote-number" style="box-sizing: border-box; margin: 0px 0px 5px; padding: 0px; border: 0px; font-style: inherit; font-variant: inherit; font-weight: 700; font-stretch: inherit; font-size: inherit; line-height: inherit; font-family: inherit; vertical-align: baseline; display: inline; max-width: 100%; counter-increment: sidenote-counter 1;"></label>

从机器学习的角度,这样做的目的是为了防止神经元由于激活函数(如sigmoid,tanh)的过饱和而停止学习。

sigmoid-saturation-random

%matplotlib inline  

# random和truncated_normal正态分布。
n = 500000
A = tf.truncated_normal((n,))
B = tf.random_normal((n,))
with tf.Session() as sess:
    a, b = sess.run([A, B])

plt.subplot(3,2,1);
plt.hist(a, 100, (-4.2, 4.2));
plt.subplot(3,2,2);
plt.hist(b, 100, (-4.2, 4.2));

# random uniform distribution
rand_t = tf.random_uniform([5], 0, 10, dtype=tf.int32, seed=0)
with tf.Session() as sess:
    t = sess.run(rand_t);

plt.subplot(3, 2, 3);
plt.plot(t);

创建均匀分布和随机shuffle

针对Tensor 序列进行随机shuffle,使得尽可能降低模型对数据集不相关特征(如对称性、特定顺序)的假设,提高模型质量和预测准确性。

# 随机正态分布
rand_t = tf.random_uniform([5], 0, 10, dtype=tf.int32, seed=0)
with tf.Session() as sess:
    t = sess.run(rand_t);

plt.subplot(3, 2, 3);
plt.plot(t);

# random shuffle plot
f_sequence = tf.range(1, 10);
f_shuffle = tf.random_shuffle(f_sequence)
with tf.Session() as sess:
    f_s = sess.run(f_shuffle);

plt.subplot(3, 2, 4);
plt.plot(f_s);

Tensor(Matrix)随机Corp与多项式分布

随机Corp在图像识别类算法(RNN)预处理阶段尤为重要。

# random crop
# output will be ==> [[8 9], [1 2]]
c_crop_before = tf.constant(([[3, 4, 5], [7, 8, 9], [0, 1, 2]]), name="before-crop");
c_crop_after = tf.random_crop(c_crop_before, [2, 2], name="after-crop");
with tf.Session() as sess:
    c_crop_plot = sess.run(c_crop_after)
    print c_crop_plot

# multinomial
multi_samples = tf.log([[10., 10., 10.]]);
multi_before = tf.multinomial(multi_samples, 5)
with tf.Session() as sess:
    print sess.run(multi_samples)
    print sess.run(multi_before)

通过matplotlib直观感受下这几种随机抽样分布图,如下所示

random-sample-distribution

顺时针方向分别是

  1. 随机抽样。
  2. truncated随机抽样。
  3. 在0-10之间5个样本点的均匀分布。
  4. 1-10的顺序序列的随机shuffle。

篇幅所限,在下篇继续TensorFlow的Variables, TensorBoard, 控制依赖方法等。

So long, and thanks for all the fish.

参考

[1]

Official Tensorflow Installation On Mac.
[2]

Tensorflow for Deep Learning Research. [3]

stackoverflow

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,923评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,154评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,775评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,960评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,976评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,972评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,893评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,709评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,159评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,400评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,552评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,265评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,876评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,528评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,701评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,552评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,451评论 2 352

推荐阅读更多精彩内容