Tensorflow学习：使用Tensorflow搭建深层网络分类器

最新推荐文章于 2025-06-05 18:12:39 发布

原创最新推荐文章于 2025-06-05 18:12:39 发布 · 1.2k 阅读

5 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#Tensorflow #深度学习 #DNN分类

tensorflow 专栏收录该内容

3 篇文章

订阅专栏

本文介绍如何使用TensorFlow的tf.contrib.learn模块对Iris数据集进行分类。通过搭建一个三层深度神经网络分类器，实现了对Iris数据的有效分类，并评估了模型在测试集上的准确性。此外，还演示了如何利用训练好的模型对新样本进行分类预测。

前言

根据官方文档整理而来的，主要是对Iris数据集进行分类。使用tf.contrib.learn.tf.contrib.learn快速搭建一个深层网络分类器，

步骤

导入csv数据
搭建网络分类器
训练网络
计算测试集正确率
对新样本进行分类

数据

Iris数据集包含150行数据，有三种不同的Iris品种分类。每一行数据给出了四个特征信息和一个分类信息。
现在已经将数据分为训练集和测试集
- A training set of 120 samples (iris_training.csv)
- A test set of 30 samples (iris_test.csv)

网络搭建

1. 首先，导入tensorflow 和 numpy

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import tensorflow as tf
import numpy as np

2. 导入数据

# 定义数据地址
IRIS_TRAINING = "iris_training.csv"
IRIS_TEST = "iris_test.csv"
# 导入数据
training_set = tf.contrib.learn.datasets.base.load_csv_with_header(
    filename=IRIS_TRAINING,
    target_dtype=np.int,
    features_dtype=np.float32)
test_set = tf.contrib.learn.datasets.base.load_csv_with_header(
    filename=IRIS_TEST,
    target_dtype=np.int,
    features_dtype=np.float32)

load_csv_with_header() 有三个参数
- filename, 数据地址
- target_dtype, 目标值的numpy datatype（iris的目标值是0，1，2，所以是np.int）
- features_dtype, 特征值的numpy datatype .

3. 搭建网络结构

# 每行数据4个特征，都是real-value的
feature_columns = [tf.contrib.layers.real_valued_column("", dimension=4)]

# 3层DNN，3分类问题
classifier = tf.contrib.learn.DNNClassifier(feature_columns=feature_columns,
                                            hidden_units=[10, 20, 10],
                                            n_classes=3,
                                            model_dir="/tmp/iris_model")

参数解释
- feature_columns 特征值
- hidden_units=[10, 20, 10]. 3个隐藏层,包含的隐藏神经元依次是10, 20, 10
- n_classes 类别个数
- model_dir 模型保存地址

4. 训练数据

classifier.fit(x=training_set.data, y=training_set.target, steps=2000)

steps 为训练次数

5. 计算准确率

accuracy_score = classifier.evaluate(x=test_set.data, y=test_set.target)["accuracy"]
print('Accuracy: {0:f}'.format(accuracy_score))

运行结果是

Accuracy: 0.966667

6. 对新样本进行预测

# Classify two new flower samples.
new_samples = np.array(
    [[6.4, 3.2, 4.5, 1.5], [5.8, 3.1, 5.0, 1.7]], dtype=float)
y = list(classifier.predict(new_samples, as_iterable=True))
print('Predictions: {}'.format(str(y)))

运行结果为：

Prediction: [1 2]

完整代码

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import tensorflow as tf
import numpy as np

IRIS_TRAINING = "iris_training.csv"
IRIS_TEST = "iris_test.csv"

training_set = tf.contrib.learn.datasets.base.load_csv_with_header(
    filename=IRIS_TRAINING,
    target_dtype=np.int,
    features_dtype=np.float32)
test_set = tf.contrib.learn.datasets.base.load_csv_with_header(
    filename=IRIS_TEST,
    target_dtype=np.int,
    features_dtype=np.float32)

feature_columns = [tf.contrib.layers.real_valued_column("", dimension=4)]

classifier = tf.contrib.learn.DNNClassifier(feature_columns=feature_columns,
                                            hidden_units=[10, 20, 10],
                                            n_classes=3,
                                            model_dir="/tmp/iris_model")

classifier.fit(x=training_set.data,
               y=training_set.target,
               steps=2000)

accuracy_score = classifier.evaluate(x=test_set.data,
                                     y=test_set.target)["accuracy"]
print('Accuracy: {0:f}'.format(accuracy_score))

new_samples = np.array(
    [[6.4, 3.2, 4.5, 1.5], [5.8, 3.1, 5.0, 1.7]], dtype=float)
y = list(classifier.predict(new_samples, as_iterable=True))
print('Predictions: {}'.format(str(y)))