200字范文 > 深度学习神经网络案例（手写数字识别）

深度学习神经网络案例（手写数字识别）

时间：2022-04-16 06:53:37

相关推荐

深度学习神经网络案例（手写数字识别）

文章目录

1. 数据加载2. 数据处理3. 模型构建4. 模型编译5. 模型训练6. 模型测试7. 模型保存总结

使用手写数字的MNIST数据集如上图所示，该数据集包含60,000个用于训练的样本和10,000个用于测试的样本，图像是固定大小(28x28像素)，其值为0到255。

整个案例的实现流程是：

数据加载数据处理模型构建模型训练模型测试模型保存

首先要导入所需的工具包：

# 导入相应的工具包import numpy as npimport matplotlib.pyplot as pltplt.rcParams['figure.figsize'] = (7,7) # Make the figures a bit biggerimport tensorflow as tf# 数据集from tensorflow.keras.datasets import mnist# 构建序列模型from tensorflow.keras.models import Sequential# 导入需要的层from tensorflow.keras.layers import Dense, Dropout, Activation,BatchNormalization# 导入辅助工具包from tensorflow.keras import utils# 正则化from tensorflow.keras import regularizers

1. 数据加载

首先加载手写数字图像

# 类别总数nb_classes = 10# 加载数据集(X_train, y_train), (X_test, y_test) = mnist.load_data()# 打印输出数据集的维度print("训练样本初始维度", X_train.shape)print("训练样本目标值初始维度", y_train.shape)

结果为：

训练样本初始维度 (60000, 28, 28)训练样本目标值初始维度 (60000,)

数据展示：

# 数据展示：将数据集的前九个数据集进行展示for i in range(9):plt.subplot(3,3,i+1)# 以灰度图显示，不进行插值plt.imshow(X_train[i], cmap='gray', interpolation='none')# 设置图片的标题：对应的类别plt.title("数字{}".format(y_train[i]))

效果如下所示：

2. 数据处理

神经网络中的每个训练样本是一个向量，因此需要对输入进行重塑，使每个28x28的图像成为一个的784维向量。另外，将输入数据进行归一化处理，从0-255调整到0-1。

# 调整数据维度：每一个数字转换成一个向量X_train = X_train.reshape(60000, 784)X_test = X_test.reshape(10000, 784)# 格式转换X_train = X_train.astype('float32')X_test = X_test.astype('float32')# 归一化X_train /= 255X_test /= 255# 维度调整后的结果print("训练集：", X_train.shape)print("测试集：", X_test.shape）

输出为：

训练集： (60000, 784)测试集： (10000, 784)

另外对于目标值我们也需要进行处理，将其转换为热编码的形式：

实现方法如下所示：

# 将目标值转换为热编码的形式Y_train = utils.to_categorical(y_train, nb_classes)Y_test = utils.to_categorical(y_test, nb_classes)

3. 模型构建

在这里我们构建只有3层全连接的网络来进行处理：

构建方法如下所示：

# 利用序列模型来构建模型model = Sequential()# 全连接层，共512个神经元，输入维度大小为784model.add(Dense(512, input_shape=(784,)))# 激活函数使用relumodel.add(Activation('relu')) # 使用正则化方法drouout model.add(Dropout(0.2)) # 全连接层，共512个神经元,并加入L2正则化model.add(Dense(512,kernel_regularizer=regularizers.l2(0.001)))# BN层model.add(BatchNormalization())# 激活函数model.add(Activation('relu'))model.add(Dropout(0.2))# 全连接层，输出层共10个神经元model.add(Dense(10))# softmax将神经网络输出的score转换为概率值model.add(Activation('softmax'))

我们通过model.summay来看下结果：

Model: "sequential_6"_________________________________________________________________Layer (type) Output Shape Param # =================================================================dense_13 (Dense) (None, 512)401920 _________________________________________________________________activation_8 (Activation) (None, 512)0 _________________________________________________________________dropout_7 (Dropout)(None, 512)0 _________________________________________________________________dense_14 (Dense) (None, 512)262656 _________________________________________________________________batch_normalization (BatchNo (None, 512)2048_________________________________________________________________activation_9 (Activation) (None, 512)0 _________________________________________________________________dropout_8 (Dropout)(None, 512)0 _________________________________________________________________dense_15 (Dense) (None, 10)5130_________________________________________________________________activation_10 (Activation) (None, 10)0 =================================================================Total params: 671,754Trainable params: 670,730Non-trainable params: 1,024_________________________________________________________________

4. 模型编译

设置模型训练使用的损失函数交叉熵损失和优化方法adam，损失函数用来衡量预测值与真实值之间的差异，优化器用来使用损失函数达到最优：

# 模型编译，指明损失函数和优化器，评估指标pile(loss='categorical_crossentropy', optimizer='adam',metrics=['accuracy'])

5. 模型训练

# batch_size是每次送入模型中样本个数，epochs是所有样本的迭代次数，并指明验证数据集history = model.fit(X_train, Y_train,batch_size=128, epochs=4,verbose=1,validation_data=(X_test, Y_test))

训练过程如下所示：

Epoch 1/4469/469 [==============================] - 2s 4ms/step - loss: 0.5273 - accuracy: 0.9291 - val_loss: 0.2686 - val_accuracy: 0.9664Epoch 2/4469/469 [==============================] - 2s 4ms/step - loss: 0.2213 - accuracy: 0.9662 - val_loss: 0.1672 - val_accuracy: 0.9720Epoch 3/4469/469 [==============================] - 2s 4ms/step - loss: 0.1528 - accuracy: 0.9734 - val_loss: 0.1462 - val_accuracy: 0.9735Epoch 4/4469/469 [==============================] - 2s 4ms/step - loss: 0.1313 - accuracy: 0.9768 - val_loss: 0.1292 - val_accuracy: 0.9777

将损失绘制成曲线：

# 绘制损失函数的变化曲线plt.figure()# 训练集损失函数变换plt.plot(history.history["loss"], label="train_loss")# 验证集损失函数变化plt.plot(history.history["val_loss"], label="val_loss")plt.legend()plt.grid()

将训练的准确率绘制为曲线：

# 绘制准确率的变化曲线plt.figure()# 训练集准确率plt.plot(history.history["accuracy"], label="train_acc")# 验证集准确率plt.plot(history.history["val_accuracy"], label="val_acc")plt.legend()plt.grid()

另外可通过tensorboard监控训练过程，这时我们指定回调函数：

# 添加tensoboard观察tensorboard = tf.keras.callbacks.TensorBoard(log_dir='./graph', histogram_freq=1,write_graph=True,write_images=True)

在进行训练：

# 训练history = model.fit(X_train, Y_train,batch_size=128, epochs=4,verbose=1,callbacks=[tensorboard],validation_data=(X_test, Y_test))

打开终端：

# 指定存在文件的目录，打开下面命令tensorboard --logdir="./"

在浏览器中打开指定网址，可查看损失函数和准确率的变化，图结构等。