1 什么是机器学习
机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。

2 机器学习工作流程

- 1.获取数据
- 2.数据基本处理
- 3.特征工程
- 4.机器学习(模型训练)
- 5.模型评估
结果达到要求,上线服务
没有达到要求,重新上面步骤
2.1 获取到的数据集介绍

数据简介
在数据集中一般:
- 一行数据我们称为一个样本
- 一列数据我们成为一个特征
- 有些数据有目标值(标签值),有些数据没有目标值(如上表中,电影类型就是这个数据集的目标值)
数据类型构成:
- 数据类型一:特征值+目标值(目标值是连续的和离散的)
- 数据类型二:只有特征值,没有目标值
数据分割:
机器学习一般的数据集会划分为两个部分:
- 训练数据:用于训练,构建模型
- 测试数据:在模型检验时使用,用于评估模型是否有效
划分比例:
- 训练集:70% 80% 75%
- 测试集:30% 20% 25%
2.2 数据基本处理
即对数据进行缺失值、去除异常值等处理
2.3 特征工程
2.3.1什么是特征工程
特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法

本文介绍了机器学习的基础知识,包括获取数据、数据处理、特征工程、模型训练和评估。特征工程是关键步骤,影响模型效果。机器学习算法分为监督学习、无监督学习、半监督学习和强化学习。模型评估涉及准确率、RMSE等指标,防止过拟合和欠拟合。Azure机器学习平台提供实验环境,助力模型构建。
2689

被折叠的 条评论
为什么被折叠?



