tensorflow-mnist手写数字识别

xiaoxiao2021-04-04 32

mnist数据集

数据集简介

mnist手写数字数据集分为训练集和测试集，其中训练集有60000张图片，测试集有10000张图片。每张图片都是灰度图像，像素取值范围从0~255，图片大小为28×28，并且每张图片都对应0~9中的一个数字。更多关于mnist手写数字数据集的介绍，点这图片例子如下：

图像质量问题

数据集中绝大部分图像都可以很轻松地辨别出是哪个数字，但仍存在一小部分图像很难分辨出数字。图片例子如下：

显示图片

'''tensorflow version: 1.0.0''' from tensorflow.examples.tutorials.mnist import input_data # 以下是导入的input_data.py的代码 from __future__ import absolute_import from __future__ import division from __future__ import print_function import gzip import os import tempfile import numpy from six.moves import urllib from six.moves import xrange import tensorflow as tf from tensorflow.contrib.learn.python.learn.datasets.mnist import read_data_sets # read_data_sets是一个函数，专门用来读取mnist数据集。 # 其中这个函数将训练集分为两部分，55000张图片作为训练集，5000张图片作为验证集。 '''tensorflow version: 1.0.0''' # 将以下代码保存为py文件，修改数据集路径后可直接运行 from tensorflow.examples.tutorials.mnist import input_data import matplotlib.pyplot as plt # data_dir是数据集的路径，注意四个文件应当在同一个文件夹中 data_sets = input_data.read_data_sets('data_dir') # 分别输出训练集，验证集，测试集的图片数量 print('number of images in training set: %d' % data_sets.train.num_examples) print('number of images in validation set: %d' % data_sets.validation.num_examples) print('number of images in testing set: %d' % data_sets.test.num_examples) # 显示图片 image, label = data_sets.train.next_batch(2) print('label: %d' % label[1]) plt.imshow(image[1].reshape(28, 28), cmap='gray') plt.axis('off') plt.show() # 这里解释下为什么显示image[1]而不显示image[0] # image[0]图片显示像数字3，但标签label却是7

tensorflow-mnist

官方tensorflow-mnist代码，点这官方tensorflow-mnist教程，点这（需翻墙）

'''tensorflow version: 1.0.0''' # 将这份文件保存为mnist_fcn.py import math import tensorflow as tf # 图片大小是28 * 28 IMAGE_PIXELS = 28 * 28 # 类别10个，分别对应数字0~9 NUM_CLASSES = 10 # 这个函数是创建一个隐层 # 参数分别表示隐层的名字，流入数据，隐层单元个数及激活函数 # 如果不使用激活函数则为输出层 def layer(name, data_in, shape, activate): with tf.name_scope(name): weights = tf.Variable( tf.truncated_normal(shape, stddev=1 / math.sqrt(float(shape[0]))), name='weights' ) biases = tf.Variable( tf.zeros([shape[1]]), name='biases' ) if activate is None: # 注意网络的输出没有进行softmax data_out = tf.matmul(data_in, weights) + biases else: data_out = activate(tf.matmul(data_in, weights) + biases) return data_out # 定义网络结构 # 参数分别表示输入图像，各隐层单元个数 # 这个网络只有3个隐层，hidden_units = [x, y, z]，分别表示各隐层神经元个数 # 返回预测的值 # 计算损失的函数tf.nn.sparse_softmax_cross_entropy_with_logits # 需要输入原始预测的值，所以这里不用进行softmax # 以下简单说下什么是softmax # 通俗来说对每个样本预测的10个值，每个值都表示属于0~9的一个概率 # 但原始输出的10个值有正有负，大小也不在0~1之间，不能表示概率 # 所以需要进行softmax，对预测值归一化，使其满足概率的定义 # !!!!!!!!!!注意这里不需要归一化!!!!!!!!!! def model(images, hidden_units): data_out_h1 = layer( name='hidden1', data_in=images, shape=[IMAGE_PIXELS, hidden_units[0]], activate=tf.nn.relu ) data_out_h2 = layer( name='hidden2', data_in=data_out_h1, shape=[hidden_units[0], hidden_units[1]], activate=tf.nn.relu ) data_out_h3 = layer( name='hidden3', data_in=data_out_h2, shape=[hidden_units[1], hidden_units[2]], activate=tf.nn.relu ) logits = layer( name='softmax', data_in=data_out_h3, shape=[hidden_units[2], NUM_CLASSES], activate=None ) return logits # 定义损失函数 # 参数分别是模型预测值，真实的值 # 返回一个batch_size的平均损失 def loss(logits, labels): cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits( labels=labels, logits=logits, name='cross_entropy' ) return tf.reduce_mean(cross_entropy, name='loss') # 定义优化器 # 参数分别是损失值，学习率 # 这里采用梯度下降算法 # 返回训练网络的操作 def optimizer(loss, learning_rate): opt = tf.train.GradientDescentOptimizer(learning_rate) train_op = opt.minimize(loss) return train_op # 定义评价函数 # 参数分别是模型预测值，真实的值 # 返回预测正确的个数 # 比如说100张图片，预测正确80张，则返回80 def evaluation(logits, labels): correct = tf.nn.in_top_k(logits, labels, 1) return tf.reduce_sum(tf.cast(correct, tf.int32)) '''tensorflow version: 1.0.0''' # 将这份文件保存为train_and_eval.py # 可直接运行，训练网络 # 记得修改数据集的路径 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data import mnist_fcn # 这个函数的作用是得到每次训练所需要的数据 def fill_feed_dict(data_set, batch_size, images_pl, labels_pl): images, labels = data_set.next_batch(batch_size) feed_dict = { images_pl: images, labels_pl: labels } return feed_dict # 这个函数是每训练一定步数，就会在给定的数据集上测试性能 # 比如在run_training函数中，每训练1000步 # 会给出在训练集(training_set)，验证集(validation set)和测试集(testing set) # 样本总数，正确分类的样本数和精度 def do_eval(sess, data_set, batch_size, images_pl, labels_pl, eval_correct): true_counts = 0 steps = data_set.num_examples // batch_size num_examples = steps * batch_size for step in range(steps): feed_dict = fill_feed_dict( data_set, batch_size, images_pl, labels_pl ) true_counts += sess.run(eval_correct, feed_dict=feed_dict) precision = float(true_counts) / num_examples print('Num examples: %d, num correct: %d, precision @ 1 : %.4f' % (num_examples, true_counts, precision)) def run_training(data_dir, batch_size, hidden_units, learning_rate, max_steps): # 读入数据，这时候data_sets包含3个数据集 # 训练集，验证集和测试集 data_sets = input_data.read_data_sets(data_dir) # 在默认的图中创建整个模型 with tf.Graph().as_default(): # 定义placeholder，用来向网络中传入数据 images_pl = tf.placeholder( tf.float32, shape=(batch_size, mnist_fcn.IMAGE_PIXELS) ) labels_pl = tf.placeholder( tf.int64, shape=(batch_size) ) # 图片输入网络，得到预测值 logits = mnist_fcn.model(images_pl, hidden_units) # 得到损失 loss = mnist_fcn.loss(logits, labels_pl) # 训练网络 train_op = mnist_fcn.optimizer(loss, learning_rate) # 得到一个batch_size中正确分类的图片张数 eval_correct = mnist_fcn.evaluation(logits, labels_pl) # 全局变量初始化，必备操作 init = tf.global_variables_initializer() # 默认图传入Session中 sess = tf.Session() # 初始化模型参数 sess.run(init) for step in range(max_steps): # 得到训练数据 feed_dict = fill_feed_dict( data_sets.train, batch_size, images_pl, labels_pl ) # 训练网络，得到损失函数值 _, loss_value = sess.run([train_op, loss], feed_dict=feed_dict) # 每100步输出损失值 if step % 100 == 0: print('step: %d loss = %.3f' % (step, loss_value)) # 每1000步在3个数据集上进行评估操作 # 判断模型是否朝好的方向训练 if (step + 1) % 1000 == 0 or (step + 1) == max_steps: print('Eval on training set') do_eval(sess, data_sets.train, batch_size, images_pl, labels_pl, eval_correct) print('Eval on validation set') do_eval(sess, data_sets.validation, batch_size, images_pl, labels_pl, eval_correct) print('Eval on test set') do_eval(sess, data_sets.test, batch_size, images_pl, labels_pl, eval_correct) if __name__ == '__main__': # 参数设定 run_training(data_dir='........', batch_size=100, hidden_units=[200, 400, 100], learning_rate=0.01, max_steps=50000)

数据集及代码下载

点这里！！！！！！

转载请注明原文地址: https://ju.6miu.com/read-666244.html

技术

最新回复(0)