
文章目录
一、openGauss 与 DB4AI
一直以来,数据库给人的感觉就像是一个盒子,用来装着各种数据,只有借助“外力”才能够存取数据,对数据来进行操作。DB4AI,当我听到这个概念的时候有些震惊,因为它将数据库与 AI 这两个看似不沾边的东西结合了起来,组合成了一个更为强大的技术。
一方面,AI 可以让数据库更加智能(AI4DB),例如传统的经验数据库优化技术无法满足大规模数据库实例、多样化应用以及多样化用户的高性能需求,但是基于学习的技术可以解决可以解决这个问题;另一方面,数据库技术可以优化人工智能模型(DB4AI),比如 AI 的部署问题,需要开发人员进行复杂的代码编写以及训练才能完成模型的训练,如果将 AI 的相关能力(比如数据挖掘、数据清洗、数据标记等等)集成到数据库上,就能降低人工智能使用的复杂度。

目前具有这一功能的数据库似乎还很少,而国内似乎只有华为所开源的数据库 openGauss 具备这一功能。通过在数据库内集成 AI 算法,使得 openGauss 具备原生 AI 计算引擎、模型管理、AI 算子、AI 原生执行计划的能力。当前版本的 DB4AI 支持基于SGD 算子的逻辑回归(目前支持二分类任务)、线性回归和支持向量机算法(分类任务),以及基于K-Means算子的Kmeans聚类算法。
二、DB4AI 能力简单上手
1、openGauss 的部署与安装
openGauss 的安装方式有很多种,我这里就选择最简单快捷的方法,使用 Docker 来进行安装,来简化安装过程:
① 镜像搜索
使用 docker search 命令搜索 openGauss 镜像,可以看到第一个,也就是 NAME 为 enmotech/opengauss 的镜像 STARS 最多,这里我就选择这个,这个好像也是官方推荐的 Docker 镜像。
# 镜像搜索
docker search opengauss

② 镜像拉取
接下来使用 docker pull 对刚刚我们选择的镜像进行拉取,我这里拉取 3.0.0 版本的 openGauss(目前似乎没有 3.1.0 版本的 openGauss Docker 镜像)
# 镜像拉取
docker pull enmotech/opengauss:3.0.0

输入 docker images 可以看到我们的镜像
# 镜像查看
docker images

如果你使用 Docker Desktop,也可以在其中看到

③ 运行镜像
之后使用 docker run 命令就可以来创建并运行一个容器
# 运行镜像
docker run --name opengauss -p 26000:26000 --privileged=true -d -e GS_PASSWORD=Enmo@123 enmotech/opengauss:latest

使用 Docker Desktop 的同学也可以直接点击右边的 RUN 来运行镜像。

④ 进入容器
使用 docker ps 命令查看容器 ID
# 查看镜像 ID
docker ps

使用 docker exec 命令进入容器
# 进入容器
docker exec -it 6b4745abb1a2 /bin/bash
也可以在 Docker Desktop 中来运行。

之后进入 omm 用户,并输入 gsql 命令进入 openGauss 数据库
root@6b4745abb1a2:/# su - omm
omm@6b4745abb1a2:~$ gsql

2、简单案例入门 openGauss DB4AI 开发
Ⅰ、DB4AI 语法及关键字
使用 openGauss 的 DB4AI 能力进行 AI 开发主要所经历的大致流程以及使用的语句在下面的图中展现的活灵活现,下面就大致讲解一下 DB4AI 语法及关键字。

① 模型创建基本语法与关键字
| 名称 | 描述 | |
|---|---|---|
| 语句 | CREATE MODEL | 创建模型并进行训练,同时保存模型。 |
| USING | 用来指定算法的名称 | |
| WITH | 用于指定训练模型时的 |

本文介绍了openGauss数据库的DB4AI特性,结合AI能力实现数据库智能化。通过Docker部署openGauss,然后演示了使用DB4AI进行房价预测的案例,包括数据准备、模型创建和预测。DB4AI支持逻辑回归、线性回归、支持向量机和KMeans算法。
509

被折叠的 条评论
为什么被折叠?



