「Python」用TensorFlow完成手写数字识别模型训练，呼之欲出

Python是一门强大的编程语言，TensorFlow是一款流行的机器学习框架，两者结合能够实现许多有趣的应用。本文将会介绍如何使用Python和TensorFlow构建一个手写数字识别模型，包括模型训练和应用。

1. 数据集介绍

我们将使用MNIST数据集来训练手写数字识别模型。MNIST数据集是一个经典的机器学习数据集，包括60,000张训练图片和10,000张测试图片。每张图片都是28x28像素大小的灰度图像，标注了对应的数字。

在Python中，我们可以使用TensorFlow的内置函数来加载MNIST数据集。代码如下：

```
from tensorflow.keras.datasets import mnist

(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
```

其中，train_images和train_labels是训练数据集，test_images和test_labels是测试数据集。

2. 模型构建

我们将使用卷积神经网络（Convolutional Neural Networks，CNN）来训练手写数字识别模型。CNN是一种常用于图像识别的神经网络模型，能够从图像中提取特征。下面是一个简单的CNN模型示例：

```
from tensorflow.keras import layers, models

model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10))
```

这个模型包括了三个卷积层、两个池化层和两个全连接层。卷积层和池化层用于提取图像的特征，全连接层用于分类。

3. 模型训练

我们将使用TensorFlow来训练CNN模型。首先，需要将数据集进行预处理。由于MNIST数据集中的图片是灰度图像，所以我们需要将其转换成3D张量，即（sample, height, width, channels）的格式。代码如下：

```
train_images = train_images.reshape((60000, 28, 28, 1))
train_images = train_images.astype('float32') / 255

test_images = test_images.reshape((10000, 28, 28, 1))
test_images = test_images.astype('float32') / 255
```

接下来，我们可以使用TensorFlow的compile和fit函数来编译和训练CNN模型。代码如下：

```
model.compile(optimizer='rmsprop',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

history = model.fit(train_images, train_labels, epochs=5, 
                    validation_data=(test_images, test_labels))
```

在训练过程中，我们将会得到每个epoch的训练和验证准确率。经过5个epoch的训练后，我们得到了一个训练好的手写数字识别模型。

4. 模型应用

现在，我们可以使用训练好的模型来识别手写数字了。我们可以用OpenCV来捕获一张手写数字的图片，并使用训练好的模型来进行识别。代码如下：

```
import cv2

def predict(image_path):
    img = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
    img = cv2.resize(img, (28, 28))
    img = img.astype('float32') / 255
    img = np.expand_dims(img, axis=0)
    img = np.expand_dims(img, axis=-1)

    predictions = model.predict(img)
    digit = np.argmax(predictions[0])

    return digit
```

这个函数会读取一张灰度图像，并将其转换成大小为28x28的图像，然后使用训练好的模型来进行数字识别。

5. 结论

使用Python和TensorFlow来构建手写数字识别模型非常容易。我们只需要加载数据集、构建模型、训练模型和使用模型就可以了。这个手写数字识别模型的应用十分广泛，可以应用于多种场景，例如自动化表单识别、手写数字验证码识别等。
首页

课程中心

免费公开课

技术干货

就业动态

马哥动态

「Python」用TensorFlow完成手写数字识别模型训练，呼之欲出