
GreatSQL 社区开源的数据库校验及修复工具 gt-checksum 迎来 v4.0.0 大版本重磅更新!本次升级直击生产环境数据校验的核心痛点,新增断点续传、反向回滚 SQL、自定义数据类型映射等关键能力,同时在权限预检、安全策略、性能优化等维度全面增强,让数据校验与修复真正适配生产级场景。
一、为什么升级?生产环境的「校验痛点」
在数据库迁移验收、跨版本升级、主从一致性检查、Oracle → MySQL 异构迁移等场景中,我们总能遇到这些棘手问题:
- 校验任务跑了几小时突然中断,只能从头再来,耗时又耗资源;
- 在线修复数据后发现不符合预期,却没有现成的回滚手段;
- 异构迁移时数据类型不匹配,需要手动逐列对齐映射规则;
- 工具误将「无权限访问的表」判为「表不存在」,生成错误修复 SQL;
- DSN 连接串明文存储密码,日志 / 配置文件存在泄露风险。
gt-checksum v4.0.0 正是围绕这些真实痛点,完成了一次「从工具级到生产级」的系统性升级 —— 核心就是让数据校验与修复流程:可续跑、可回滚、可诊断、可审计。
二、核心新能力:直击痛点,全面升级
🌀 断点续传:大任务中断不再「从头再来」
大规模校验任务中断后,无需重复扫描全表、重复执行修复 SQL,新增 resume 参数(支持 OFF/ON/ASK 三种模式),让续跑更安全、更高效:
- gt-checksum:进度文件记录已完成的 chunk 和行数统计结果,续传时仅跳过已安全生成修复 SQL 的数据块,断点超 1 小时会提示用户确认;
- repairDB:中断时停止调度新文件,等待已执行的 SQL 文件完成,避免续传时重放「半执行文件」;
- 核心价值:行数统计结果缓存复用,显著降低续传启动开销,大表校验效率提升显著。
🔙 反向回滚 SQL:修复可审计、可回退
告别「修复后无法回滚」的风险,新增完整的回滚 SQL 生成能力,让修复操作有「后悔药」:
- 核心参数:genRollSQL(控制是否生成回滚语句)、maxRollRowNum(避免大表回滚文件过大)、rollFileDir(回滚文件存储目录);
- 回滚逻辑:INSERT 对应 DELETE、DELETE 对应 INSERT,支持有 / 无主键表;
- 安全边界:目标端整表为空时,强制生成 TRUNCATE TABLE 回滚 SQL,兜底数据安全;
- 便捷回退:修复时同步生成回滚文件,后续可通过 repairDB ./rollsql 一键回退。
🗺️ 自定义数据类型映射:适配复杂迁移场景
针对 Oracle → MySQL、MySQL 跨版本升级、MariaDB → MySQL 等异构 / 跨版本迁移场景,新增 dTypeMappingFile 参数,支持自定义 YAML/JSON 格式的类型映射规则:
- 支持 schema/table/column 三级精细化控制,覆盖 nullable、unsigned、autoinc 等属性;
- 新增 --preview-dtype-mapping 参数,可预览最终映射规则,便于调试配置;
- 核心价值:告别手动对齐数据类型,适配各类复杂迁移场景。
🔒 DSN 密文 + SSL 加密:筑牢安全防线
安全能力双升级,从连接到存储全面防护:
- DSN 密文保护:srcDSN/dstDSN 密码必须用 ENC[…] 密文,新增 gt-dsn-crypt 工具(支持生成密钥、加密 / 解密),日志自动脱敏密码;
- SSL 加密连接:源端 / 目标端可独立配置 SSL 参数(支持 DISABLED/PREFERRED/REQUIRED 等 5 种模式),repairDB 同步支持目标端 SSL 配置。
✂️ truncateBeforeAlter:大表结构修复加速
针对大表结构修复时 ALTER 操作耗时的问题,新增 truncateBeforeAlter 参数(默认关闭):
- 功能:在 checkObject=struct 模式下,ALTER 前自动生成 TRUNCATE TABLE,并恢复源端 AUTO_INCREMENT 序列;
- 注意:仅适合「目标端数据可丢弃」的场景,生产环境需谨慎开启。
📊 在线修复状态列:结果一目了然
checkObject=data 且 datafix=table 模式下,终端和 CSV 结果新增 Fixed 列,清晰展示修复 SQL 的执行状态(执行 / 跳过 / 报错),修复结果可追溯。
三、功能优化 & 安全增强:细节处见实力
权限预检全面升级
- 区分源端(只读)/ 目标端(写权限)角色,按 checkObject 精确匹配所需权限;
- 缺失权限时输出清晰的授权建议(含 GRANT 语句),适配不同 MySQL/MariaDB 版本;
- 优化「目标表不可见」处理,避免误判为表不存在并生成错误修复 SQL。
COLLATE 修复逻辑优化
- 类型映射覆盖时,生成列级 MODIFY COLUMN SQL(含 collation + 类型映射);
- utf8mb4 默认 collation 漂移仅返回警告,减少无意义的修复 SQL;
- 修复列顺序调整被误判为属性变更的问题。
在线修复安全策略优化
- 执行顺序:先 DELETE 后 INSERT/UPDATE,降低主键 / 唯一键冲突风险;
- 非数据对象:struct/trigger/routine 模式下强制导出修复 SQL,需人工审核后执行;
- 无主键表:简化 DELETE 逻辑,避免 NULL 值导致的语句错误;
- 合并重复 DELETE 语句,减少回滚文件体积。
性能 & 代码重构
- 源 / 目标端行数并行查询,减少等待时间;
- repairDB、oracle_random_data_load 模块化重构,代码可维护性提升。
四、典型问题修复:踩过的坑都填上了
- Duplicate Key 处理:multi-values INSERT 遇主键冲突时,自动拆分为单行重试,避免整批失败;
- 回滚 SQL 修复:解决启动时序竞态、无索引表 TRUNCATE 回滚条件误判、断点续传回滚范围过大等问题;
- 无索引表修复:修复 datafix=table 场景下仅生成语句但未执行的问题;
- 类型映射 & SQL 输出:调整 Oracle NUMBER (19,0) 映射阈值,修复数值列 SQL 字面量输出错误;
- 断点续传:修复 datafix=file 场景下 chunk 状态误判、不完整事务截断等问题;
- repairDB 中断:收到中断信号时等待已执行文件完成,避免半执行文件重放。
五、测试全覆盖:稳定才是硬道理
v4.0.0 新增大量回归测试,覆盖核心场景:
- truncateBeforeAlter、在线修复主键冲突、回滚 SQL 生成;
- 权限预检、断点续传、数据类型映射;
- struct 校验修复、MySQL/Oracle 权限适配等。
六、生产落地建议
- 迁移验收:启用 resume=ON + genRollSQL=ON,确保中断可续、修复可回滚;
- Oracle → MySQL 迁移:用 dTypeMappingFile 自定义类型映射,提前预览验证;
- 安全敏感环境:使用 gt-dsn-crypt 加密密码,配置 SSL 连接,开启日志脱敏;
- 大表结构修复:目标端数据可丢弃时,可开启 truncateBeforeAlter=ON 加速;
- 在线修复:关注 Fixed 列状态,结合回滚文件做修复后验证。
七、未来规划:不止于此
v4.0.0 已完成 Roadmap 中「修复回滚、自定义类型映射、断点续传、SSL 连接、truncateBeforeAlter」等核心规划项,后续将聚焦:
- 守护进程模式运行;
- 实时监控数据变化;
- 全量 + 增量校验能力。
八、立即体验
-
下载地址:gt-checksum v4.0.0 发布页(预编译二进制包适配 Ubuntu/CentOS/RHEL 等系统);
- https://gitee.com/GreatSQL/gt-checksum/releases
-
完整手册:gt-checksum 使用手册;
- https://gitee.com/GreatSQL/gt-checksum/blob/master/gt-checksum-manual.md
-
问题反馈:提交 Issue。
- https://gitee.com/GreatSQL/gt-checksum/issues
总结
gt-checksum v4.0.0 不是简单的「参数新增」,而是一次面向生产环境的「系统性升级」—— 断点续传让大任务不再脆弱,回滚 SQL 让修复可审计,自定义类型映射适配复杂迁移,DSN 密文 + SSL 筑牢安全防线。无论你是做数据库迁移、主从一致性校验,还是跨版本升级,都推荐升级体验这款「更懂生产环境」的校验修复工具!
929

被折叠的 条评论
为什么被折叠?



