Keras 没有对整个数据集进行训练
- 2025-01-14 08:50:00
- admin 原创
- 143
问题描述:
因此,我一直在遵循 Google 的官方 tensorflow 指南,并尝试使用 Keras 构建一个简单的神经网络。但是在训练模型时,它不会使用整个数据集(包含 60000 个条目),而是仅使用 1875 个条目进行训练。有什么可能的解决方法吗?
import tensorflow as tf
from tensorflow import keras
import numpy as np
fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
train_images = train_images / 255.0
test_images = test_images / 255.0
class_names = ['T-shirt', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle Boot']
model = keras.Sequential([
keras.layers.Flatten(input_shape=(28, 28)),
keras.layers.Dense(128, activation='relu'),
keras.layers.Dense(10)
])
model.compile(optimizer='adam',
loss= tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
metrics=['accuracy'])
model.fit(train_images, train_labels, epochs=10)
输出:
Epoch 1/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3183 - accuracy: 0.8866
Epoch 2/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3169 - accuracy: 0.8873
Epoch 3/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3144 - accuracy: 0.8885
Epoch 4/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3130 - accuracy: 0.8885
Epoch 5/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3110 - accuracy: 0.8883
Epoch 6/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3090 - accuracy: 0.8888
Epoch 7/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3073 - accuracy: 0.8895
Epoch 8/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3057 - accuracy: 0.8900
Epoch 9/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3040 - accuracy: 0.8905
Epoch 10/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.3025 - accuracy: 0.8915
<tensorflow.python.keras.callbacks.History at 0x7fbe0e5aebe0>
这是我一直在研究这个问题的原始 google colab 笔记本: https: //colab.research.google.com/drive/1NdtzXHEpiNnelcMaJeEm6zmp34JMcN38
解决方案 1:
1875
拟合模型时显示的数字不是训练样本的数量,而是批次的数量。
model.fit
包括一个可选参数batch_size
,根据文档:
如果未指定,
batch_size
则默认为 32。
因此,这里发生的情况是 - 您使用默认的批次大小 32(因为您没有指定任何不同的东西),因此您的数据的总批次数是
60000/32 = 1875
解决方案 2:
它没有对 1875 个样本进行训练。
Epoch 1/10
1875/1875 [===
1875 这里是步数,不是样本数。在fit
方法中,有一个参数,batch_size
。它的默认值是32
。所以1875*32=60000
。实现是正确的。
如果你用 来训练它batch_size=16
,你会看到步数将是3750
而不是1875
,因为60000/16=3750
。
解决方案 3:
如果您希望整个 60000 个数据样本可见,只需使用 batch_size = 1。
相关推荐
热门文章
项目管理软件有哪些?
热门标签
曾咪二维码
扫码咨询,免费领取项目管理大礼包!
云禅道AD