开篇
接触TensorFlow也差不多一年多,因为论文的实验需要,中间间间断断的学习,东西或多或少会有所遗忘,所以着手开始写这一系列博客,希望能够坚持,磨炼技术,也为9月份的秋招打好扎实的基础。
那么这一系列博客能够让你学到什么呢,首先是tensorflow的基本操作,之后我们会用tensorflow实现一系列机器学习和深度学习的算法,深度学习优先,因为它毕竟是深度学习框架。本系列代码以代码为主,理论为辅,顺带博主的一些废话和一些实战中的小tips。下面就让我们开始第一个TensorFlow程序吧!
Hello TensorFlow!
每个语言都有一个自己的helloworld,虽然我们的TensorFlow不是什么特定的语言,但是它有着自己的helloworld。
import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
print(sess.run(hello))
Computational Graph
TensorFlow核心便是计算图,熟悉深度学习算法的同学应该能够体会,神经网络其实就是一个前向后向的计算图,每一个神经元接受数据,然后通过激活函数计算再沿着模型的连接传播出去。或许我们这么讲,小白并不能接受和理解,下面就让我们来看看代码吧。
import tensorflow as tf
a = tf.constant(3.0, tf.float32)
b = tf.constant(4.0, tf.float32)
c = a+b
sess = tf.Session()
print(sess.run(c))
#运行结果就是c的计算结果7
下面我们简单的谈谈session函数,每一个TensorFlow程序都需要session函数去启动,如上代码,2、3行是我们准备好的训练数据,4行是我们的模型,可以理解为函数,一般神经网络里面就是模型函数和损失函数,之后我们会讲到,而我们的session就像一个启动的开关,它启动了我们的函数,所以我们的函数填进了数据,运行起来,最后计算出来了结果。看样子是不是有点脱裤子放屁,不着急,后面我们讲到基本的神经元模型,你就知道这样其实是很有必要的。
下面的图片详细地描述了TensorFlow运作机制
Placeholder
很多时候我们不需要直接把我们数据一开始就放进我们的模型,事实上大部分情况下,我们在启动我们的模型的时候才将我们的数据喂(feed_dict)给我们的模型,这时候我们在设置模型的时候就要一个占位的东西放在我们的模型里,等着喂数据啦,下面让我们来看看代码,我想开发者希望我们在定义模型的时候专注于模型的设计,同时也便于模型的移植(这一句仅仅代表个人观点,有误请指正)。
import tensorflow as tf
sess = tf.Session()
a = tf.placeholder(tf.float32)
b = tf.placeholder(tf.float32)
c = a + b
print(sess.run(c, feed_dict={a:3.0, b:4.0}))
Tensor
或许大家对Tensor这个单词比较陌生,Tensor的中文翻译是张量,代表着高纬度的向量,一维的是向量,二维的是矩阵,三维以及三维以上的就是我们的张量,当然向量和矩阵都是我们的张量,只是纬度比较低呀。我这样说你可能有点懵,下面我们看点实际的。
rank代表的纬度,shape中的每一个数字代表的是每一个纬度的长度。
下篇预告:线性回归和逻辑回归
投稿的时候被告知篇幅有点短,那么我就在这里续上线性回归。
线性回归
什么是线性回归呢,其实就是线性拟合函数,就是我们以前求解的那种带有未知数的方程式(模型函数),而这个未知数就是我们要求解的模型参数。这边不过多的讲解它的原理,稍微提一下的是一般线性回归是存在正解的,我们可以直接通过公式求出,但是我们这边的就是使用梯度下降的算法去求解我们的未知参数。下面是线性回归的模型图和数学表达形式,废话不多说,我们还是以代码为主。
下面是我们没有使用placeholder的代码
import tensorflow as tf
x_train = [1, 2, 3]
y_train = [2, 4, 6]
sess = tf.Session()
w = tf.Variable(tf.random_normal([1]), name='weight')
b = tf.Variable(tf.random_normal([1]), name='basic')
#模型函数
y = w*x_train + b
#损失函数
cost = tf.reduce_mean(tf.square(y - y_train))
#梯度下降算法
opt = tf.train.GradientDescentOptimizer(learning_rate=0.01)
train = opt.minimize(cost)
#初始化变量
sess.run(tf.global_variables_initializer())
for step in range(200001):
sess.run(train)
if step % 20 == 0:
print(step, sess.run(cost), sess.run(w), sess.run(b))
简单的讲一下我们的代码,这边已经基本看出TensorFlow完整模型代码的雏形啦。深度学习的几个要素,当然你也可以把它看成机器学习的几个要素,但不是适合全部的机器学习算法的。首先是定义我们的模型函数,接着定义损失函数,最后使用优化算法(这里使用的是梯度下降)计算使损失函数最小的模型参数。注意,TensorFlow的变量在程序运行的时候是需要初始化的,而这些变量其实就是我们模型的参数。优化算法TensorFlow已经提供了,只需要直接调用就好了,learning_rate是我们的学习率,就是我们算法迭代的步长。
下面是使用placeholder的代码
import tensorflow as tf
x_trian = tf.placeholder(tf.float32)
y_trian = tf.placeholder(tf.float32)
w = tf.Variable(tf.random_normal([1]))
b = tf.Variable(tf.random_normal([1]))
y = x_trian*w + b
cost = tf.reduce_mean(tf.square(y - y_trian))
opt = tf.train.GradientDescentOptimizer(learning_rate=0.01)
train = opt.minimize(cost)
sess = tf.Session()
sess.run(tf.global_variables_initializer())
for step in range(2001):
cost_val, w_val, b_val, _ = sess.run([cost, w, b, train], feed_dict={x_trian:[1,2,3], y_trian:[2,4,6]})
if step % 20 == 0:
print(step, cost_val, w_val, b_val)
我们在编写TensorFlow代码的时候应该要习惯使用PlaceHolder,避免直接使用数据。