失眠网 > 卷积神经网络（CNN）实现mnist手写数字识别

卷积神经网络（CNN）实现mnist手写数字识别

时间：2019-04-01 11:52:38

活动地址：CSDN21天学习挑战赛

首先来了解一下

什么是TensorFlow ？

TensorFlow 是一个采用数据流图(dataflowgraphs)，用于数值计算的开源软件库。

其命名来源于本身的原理，Tensor(张量)意味着N维数组，Flow(流)意味着基于数据流图的计算。Tensorflow运行过程就是张量从图的一端流动到另一端的计算过程。张量从图中流过的直观图像是其取名为“TensorFlow”的原因。

张量Tensor：在数学上，张量是N维向量，这意味着张量可以用来表示N维数据集。

计算图(流,flow)：流是指一个计算图或简单的一个图，图不能形成环路，图中的每个节点代表一个操作，如加法、减法等。每个操作都会导致新的张量形成。

只要能够将计算表示成为一个数据流图，那么就可以使用TensorFlow。如这个图不就是个神经网络嘛，所以使用TensorFlow框架。

什么是Keras？

Keras是基于TensorFlow或者Theano框架下的深度学习库，是由纯python编写而成的高层神经网络API，也仅支持python开发。它是为了支持快速实践而对tensorflow或者Theano的再次封装，让我们可以不用关注过多的底层细节，能够把想法快速转换为结果。目前Keras已经被TensorFlow收录，添加到TensorFlow 中，成为其默认的框架，成为TensorFlow官方的高级API。

tf.keras和keras的联系

基于同一套API，但是因为tf.keras中比keras多出了一点特殊的功能，所以可以轻松的将keras程序迁移到tf.keras中，但是tf.keras中的代码并不是全能移动到keras中运行。

规范是相同的，模型导出的格式也是相同的。

keras.layers模块

TensorFlow的layers模块提供用于深度学习的更高层次封装的API，利用它可以轻松地构建模型。tf.layers模块提供的方法有：

参数介绍：TensorFlow之神经网络layers模块详解_Never-Giveup的博客-CSDN博客_神经网络layer

Keras.moleds.Sequential模型

Sequential 模型结构：层（layers）的线性堆栈。简单来说，它是一个简单的线性结构，没有多余分支，是多个网络层的堆叠。

其中，Dense是一个全连接层，它的激活函数默认为是linear线性函数激活函数可以通过单独的激活层实现，也可以通过构建层时传递activation实现

一、读取数据

Keras提供了数据集加载函数

import tensorflow as tffrom tensorflow.keras import datasets, layers, modelsimport matplotlib.pyplot as pltimport numpy as np(train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data()

查看数据维度

train_images.shapetest_images.shapetrain_labels.shapetest_labels.shape'''((60000, 28, 28), (10000, 28, 28), (60000,), (10000,))'''

可以看到训练集有60000个28*28的图片，60000个标签，测试集有10000个28*28的图片，10000个标签。

plt.imshow(train_images[0])

查看一下图片是一张图片

train_images[0]

查看一下其取值

查看其最大取值为多少

print(np.max(train_images))print(np.min(train_images))#255#0

那么其取值范围是[0 , 255]之间。

二、数据预处理

1、在数据预处理时，首先采用reshape函数将每个图像矩阵扁平化成一个向量：

#调整数据到我们需要的格式train_images = train_images.reshape((60000, 28, 28, 1))test_images = test_images.reshape((10000, 28, 28, 1))train_images.shape,test_images.shape,train_labels.shape,test_labels.shape"""输出：((60000, 28, 28, 1), (10000, 28, 28, 1), (60000,), (10000,))"""

2、数据归一化，将输入值[0,255]归一化为[0,1]的取值范围：

# 将像素的值标准化至0到1的区间内。train_images, test_images = train_images / 255.0, test_images / 255.0

3、数据可视化

plt.figure(figsize=(20,10))for i in range(20):plt.subplot(5,10,i+1)plt.xticks([])plt.yticks([])plt.grid(False)plt.imshow(train_images[i], cmap=plt.cm.binary)plt.xlabel(train_labels[i])plt.show()

三、构建CNN神经网络模型

model = models.Sequential([layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),#卷积层1，卷积核3*3layers.MaxPooling2D((2, 2)), #池化层1，2*2采样layers.Conv2D(64, (3, 3), activation='relu'), #卷积层2，卷积核3*3layers.MaxPooling2D((2, 2)), #池化层2，2*2采样layers.Flatten(),#Flatten层，连接卷积层与全连接层layers.Dense(64, activation='relu'), #全连接层，特征进一步提取layers.Dense(10) #输出层，输出预期结果])# 打印网络结构model.summary()