从Keras开始掌握深度学习-6 如何使用训练好的模型

前言

在使用Keras编程的时候,我们往往会将更多的精力放在如何解决实际的问题上面。由于Keras高层封装的好处,大部分低级的错误都被避免了,对学习来说减少了大量调试找错的时间。
那么在前面几篇文章里面,我们讲了如何使用Keras实现一个卷积网络的模型,并且通过TensorBoard来可视化模型训练过程,从而进行对模型的优化工作。那么现在则是时候将我们训练好的模型投入使用了。

保存模型

在Keras中,训练好的模型可以通过model.save来将这个模型保存下来。
在程序的最后加入如下代码来将模型保存下来:

model.save('64x3-CNN.model')

再次运行程序,在程序文件所在的文件夹下可以发现出现了一个新的名为64x3-CNN.model的文件。这个文件也就是我们训练的模型的文件,该文件内保存着模型的结构和所有参数的具体数据。如果模型越复杂,那么文件的大小也会越大。

使用保存下来的模型进行分类

我们编写的模型是用来对猫和狗进行分类的CNN模型,且保存在了64x3-CNN.model文件内。
为了使用这个模型来实现分类,则需要再新建一个Python文件(或者是Jupyter Notebook)。为了实现分类功能,模型的新的输入的图片应该是在数据集内没有存在过的。
这里选择了网络上搜集到的猫和狗的照片,选用的分辨率比较低。


cat.jpg

dog.jpg

使用已有的模型预测的思路如下:首先是加载现有的待预测的图片,为了能让我们的卷积网络将已有的图片作为输入,需要将图片大小转换为前面定义的大小。然后通过keras.models.load_model将训练好且保存下来的模型加载,最后通过model.predict来进行预测。
因此,根据上面思路所编写的代码如下:

import cv2
import tensorflow as tf

categories = ['Dog', 'Cat']


def prepare(path):
    img_size = 50
    img_array = cv2.imread(path, cv2.IMREAD_GRAYSCALE)
    new_array = cv2.resize(img_array, (img_size, img_size))
    return new_array.reshape(-1, img_size, img_size, 1)


model = tf.keras.models.load_model('64x3-CNN.model')

prediction = model.predict([prepare('dog.jpg')])

print(prediction)

通过运行之后,得到的输出为:

[[0.]]

也就是说,预测的结果是0,狗。同理,加载了猫的图片后,预测的结果是1,也就是猫。
将输出转换为字符串形式的分类。

prediction = model.predict([prepare('cat.jpg')])
print(categories[int(prediction[0][0])])

运行结果:

Cat

后记

至此,使用Keras编写CNN网络的教程已经结束了。
按照上一讲中模型训练的结果,准确率大概为80%,大家可以试着实现其他的卷积网络,来提高准确性。并且在更大的,类别更多的数据集上实现分类。

推荐阅读更多精彩内容