Apache Doris 4.0.2 版本正式发布

本文涉及的产品
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
简介: 亲爱的社区小伙伴们,Apache Doris 4.0.2 版本已正式发布。此版本新增了在 AI & Search、函数、物化视图、Lakehouse 等方面的功能,并同步进行了多项优化改进及问题修复,欢迎下载体验!

亲爱的社区小伙伴们,Apache Doris 4.0.2 版本已正式发布。此版本新增了在 AI & Search、函数、物化视图、Lakehouse 等方面的功能,并同步进行了多项优化改进及问题修复,欢迎下载体验!

新增功能

AI & Search

  • 倒排索引支持自定义分析器,包含拼音分词器和拼音过滤器
  • 倒排索引的搜索函数新增多位置短语查询(PhraseQuery)支持
  • 新增 ANN 索引仅扫描能力

函数

  • 新增 sem 聚合函数
  • 支持源自 Hive 的 factorial简单 SQL 函数
  • 部分正则表达式函数新增零宽断言支持
  • JSON 类型支持 GROUP BY 和 DISTINCT 操作
  • 新增 add/sub_time 时间函数
  • 新增 deduplicate_map 函数

物化视图

  • 非分区基表数据变更时,物化视图仍可参与透明查询重写
  • 创建 MTMV 支持基于视图创建
  • MTMV 刷新支持多 PCT 表
  • 物化视图包含窗口函数时,支持窗口函数重写

Lakehouse

优化改进

  • 优化 FROM_UNIXTIME 函数性能
  • 移除 PartitionKey 比较中的 castTo转换操作,提升分区处理效率
  • 降低 Catalog 中 Column 类的内存占用
  • Ann 索引训练前累积多个小批次数据,提升训练效率
  • 升级 Hadoop 依赖到 3.4.2 版本
  • 优化 FE 和 BE 的优雅退出机制,降低节点退出对查询的影响
  • 优化对包含大量分区的 hive 表的写入的效率
  • 优化 Paimon 表 Split 占用内存过大的问题
  • 优化对 Parquet RLE_DICTIONARY 编码的读取效率
  • 优化 FE 和 BE 的优雅退出机制,降低节点退出对查询的影响

问题修复

查询

  • 修复输入为 null 时 utc_time 函数返回结果错误的问题
  • 修复 UNION ALL 结合 TVF 时抛出异常的问题
  • 修复唯一键表创建物化视图时,WHERE 子句包含非键列的问题
  • 修复 window 函数:LAG/LEAD 偏移参数支持常量表达式计算
  • 修复聚合函数:可空列投影前下推聚合操作异常;非空列 count 下推聚合问题
  • 修复时间函数:second/microsecond 函数未处理时间字面量;time_to_sec 处理 null 值时因垃圾值报错
  • 修复 AI 函数:_exec_plan_fragment_impl 调用 AI 函数时出现未知错误
  • 修复地理信息:geo 模块内存泄漏
  • 修复 information_schema:偏移时区格式不兼容

物化视图与模式变更

  • 修复物化视图包含分组集合和扫描过滤器时重写失败的问题
  • 修复大流量模式变更时读取单行集非重叠段导致的 coredump 问题

存算分离

  • 修复 TopN 查询中广播远程读取的问题
  • 修复云环境下删除 tablet 任务堆积的问题
  • 修复云环境首次启动时服务上线耗时过长的问题

Lakehouse

  • 修复某些情况下,Hive 分区变更导致元数据缓存不一致的问题
  • 修复写入 TIMESTAMP 类型分区的 Iceberg 表错误的问题
  • 修复 Paimon 表 Incremental Read 行为和 Spark 不一致的问题
  • 修复某些情况下,外表元数据缓存可能导致的死锁问题
  • 修复 BE 端 s3 client 线程数不合理导致的 IO 吞吐低的问题
  • 修复某些情况,写入存储在非 S3 对象存储上的外表时失败的问题
  • 修复某些情况下,使用 query() 进行 JDBC Catalog SQL 透传失败的问题
  • 修复 JNI Reader 时间统计导致读取性能下降的问题
  • 修复 BE 侧 jni.log 无法打印的问题

其他

  • 修复在非 Master 阶段 UNSET GLOBAL 变量时错误的问题
  • 修复某些情况下,异常的 export 任务无法取消的问题
目录
相关文章
|
24天前
|
SQL 关系型数据库 Apache
Apache Doris 实时更新全解:从设计原理到最佳实践|Deep Dive
本文档将作为一份官方指南,系统性地阐述 Apache Doris 的数据更新能力,内容涵盖其核心原理、多样的更新与删除方式、典型的应用场景,以及在不同部署模式下的性能最佳实践,旨在帮助您全面掌握并高效利用 Doris 的数据更新功能。
145 0
Apache Doris 实时更新全解:从设计原理到最佳实践|Deep Dive
|
4月前
|
存储 数据挖掘 Apache
浩瀚深度:从 ClickHouse 到 Doris, 支撑单表 13PB、534 万亿行的超大规模数据分析场景
浩瀚深度旗下企业级大数据平台选择 Apache Doris 作为核心数据库解决方案,目前已在全国范围内十余个生产环境中稳步运行,其中最大规模集群部署于 117 个高性能服务器节点,单表原始数据量超 13PB,行数突破 534 万亿,日均导入数据约 145TB,节假日峰值达 158TB,是目前已知国内最大单表。
1083 10
浩瀚深度:从 ClickHouse 到 Doris, 支撑单表 13PB、534 万亿行的超大规模数据分析场景
|
16天前
|
人工智能 测试技术 Apache
面向 Agent 的高并发分析:Doris vs. Snowflake vs. ClickHouse
智能体能够独立推理、实时分析数据,甚至主动触发行动。这意味着分析模式正从被动报告转向主动决策,处理模式也从以查询为中心转向以语义和响应为中心。 这一转变对数据基础设施提出巨大挑战:工作负载已从“少量用户、繁重查询、慢容忍度”转变为“海量用户(智能体)、轻量级/迭代查询、零延迟容忍度”。如果数据库系统无法满足高并发低延迟的查询需求,那么其上构建的 AI 智能体就会变得缓慢、笨拙,尤其是在一些信息检索的领域产生幻觉,给人误导性的结果。 因此,面向智能体的高并发和低延迟处理能力,已不再是可选项,而是决定数据仓库能否支撑 AI 时代的生存基石。
71 1
面向 Agent 的高并发分析:Doris  vs. Snowflake vs. ClickHouse
|
26天前
|
存储 SQL 运维
Apache Doris 在小米统一 OLAP 和湖仓一体的实践
小米早在 2019 年便引入 Apache Doris 作为 OLAP 分析型数据库之一,经过五年的技术沉淀,已形成以 Doris 为核心的分析体系,并基于 2.1 版本异步物化视图、3.0 版本湖仓一体与存算分离等核心能力优化数据架构。本文将详细介绍小米数据中台基于 Apache Doris 3.0 的查询链路优化、性能提升、资源管理、自动化运维、可观测等一系列应用实践。
122 1
Apache Doris 在小米统一 OLAP 和湖仓一体的实践
|
NoSQL 应用服务中间件 Linux
Docker linux环境Docker的部署以及构建镜像
Docker linux环境Docker的部署以及构建镜像
1037 1
|
存储 机器学习/深度学习 消息中间件
数据处理能力相差 2.4 倍?Flink 使用 RocksDB 和 Gemini 的性能对比实验
在本篇文章中我们将对 RocksDB、Heap 和 Gemini 在相同场景下进行压测,并对其资源消耗进行对比。测试的 Flink 内核版本为 1.10.0。
数据处理能力相差 2.4 倍?Flink 使用 RocksDB 和 Gemini 的性能对比实验
|
10天前
|
人工智能 自然语言处理 Apache
Apache Doris AI 能力揭秘(四):HSAP 一体化混合搜索架构全解
AI 时代正在重塑数据库的角色。过去,数据库主要为人类分析者提供报表与查询能力;而现在,越来越多的查询来自智能代理(Agent),它们会自动检索知识、过滤数据、组合多种信号,并将数据库作为“实时信息源”支撑推理与决策。
57 0
Apache Doris AI 能力揭秘(四):HSAP 一体化混合搜索架构全解
|
1月前
|
SQL 存储 测试技术
Apache Doris 是如何保障系统稳定性的?
Apache Doris 面对多样化场景与高速迭代,构建了涵盖单元测试、混沌测试、升降级验证等多维测试体系,并通过工程实践、社区共建、系统重构与文档建设四大支柱,打造全方位稳定性保障体系,持续提升系统可靠性。
100 11
Apache Doris 是如何保障系统稳定性的?
|
10天前
|
SQL 缓存 分布式计算
较 Trino 省 67% 成本,速度快 10 倍,中通快递基于 SelectDB 的湖仓分析架构
中通快递基于 SelectDB 构建了湖仓分析架构,补齐 OLAP 分析能力。在离线场景中,实现 2000+ QPS 并发点查;在实时场景中,仅以 1/3 原集群机器数量覆盖所有业务,90% 分析任务从 10 分钟缩短至 1 分钟内,投入产出比大幅提升。
52 0
|
1月前
|
存储 消息中间件 关系型数据库
从 Snowflake 到 Apache Doris:Planet 实时分析成本直降 80%、查询加速 90 倍
Planet深耕支付与税务数字化近40年,服务全球零售、酒店与旅游行业。为应对数据增长挑战,其数据团队将数仓从Snowflake迁移至Apache Doris,实现月成本降低80%、查询性能提升最高90倍,并达成实时分析能力,构建了高效、低成本、可扩展的数据新架构,为业务发展奠定坚实基础。
143 0
从 Snowflake 到 Apache Doris:Planet 实时分析成本直降 80%、查询加速 90 倍