内容概述
作为一个成长中的开源项目,GreptimeDB 的进展离不开来自全球的社区贡献者们,感谢各位!
最近的内容更新如下:
发布 GreptimeDB v0.9.3,修复的主要 bug 包括
修复
last_value
函数由于缓存问题可能返回空集的 bug修复在
last_non_null
merge mode 下某些查询会导致 DB crash 的问题修复了在
append mode
下查询时间戳列会丢失部分数据的问题
为 Remote WAL 提供索引,减少读放大,提升 Replay 速度
社区贡献者名单
在过去的两周里,GreptimeDB 共合并了 94 个 PR,其中有 4 位独立贡献者,累计 5 个 PR 被成功合并,还有很多待合并的 PR。
祝贺以下各位在过去 2 周内成为我们活跃的贡献者:
👏 欢迎 @billy7x17 作为新的贡献者加入社区并成功合并了首个 PR,还有更多来自其他独立贡献者的 PR 正在等待合并。
同时衷心感谢我们所有的成员和贡献者,是你们的付出让我们的项目得以成功,也是你们让 GreptimeDB 成为一个更优质的产品。让我们一起努力,建立一个更棒的社区!
PR 亮点
db#4424 db#4461 db#4530 db#4565 为 Remote WAL 提供索引实现,缓解读放大并加快 Replay 速度
由于 Remote WAL 的 Topic 个数通常是有限的,在先前的版本中,如果一个 GreptimeDB 集群中存在大量的 Region,多个 Region 的 WAL 会映射到同一个 Topic 上,这导致 Region 在 replay WAL 的时候有严重的读放大从而占用较多带宽和拖慢 Replay 速度。以上几个 PR 实现了在 Remote Client 端的数据位点索引,高度有效地提升了 Replay 的速度。
db#4382 db#4639 db#4642 db#4654 完善数据库备份和恢复工具
我们已经有了备份和恢复功能来帮助在出现问题时备份和恢复数据库,但它并不容易使用。你必须同时使用 COPY DATABASE
SQL 和 Greptime CLI 工具。上面几个 PR 完善了 CLI 工具,支持一键备份数据库和一键恢复数据库。
db#4571 Log Pipeline 中构建数据流的重构优化
Pipeline 用于处理结构化的 KeyValue 结构数据,包括修剪、修改数据。此 PR 优化了 Pipeline 的构建数据流,并优化了 Pipeline 的中间状态类型。在一些主要的 Cases 中性能提升超过 10%。
💡 推荐各位用户尽快更新升级到最新版本 v0.9.3,享受更舒适的使用体验!
Good First Issue
db#4480 为 Mito Engine 增加 debug 级别的 Trace
当前的 Trace 并不适合用户性能调试,可以在 Mito Engine 中增加更细节的 Spans,比如从 S3 读取数据的时间等等。
关键词:Mito Engine, Trace
难度:中等
db#3285 为 COPY FROM
功能增加更多测试
COPY FROM
涉及到从外部数据源加载数据,因此需要更多的测试来确保功能的正确性。
关键词:SQL,Unit Tests,Coverage
难度:简单
关于 Greptime
Greptime 格睿科技专注于为可观测、物联网及车联网等领域提供实时、高效的数据存储和分析服务,帮助客户挖掘数据的深层价值。目前基于云原生的时序数据库 GreptimeDB 已经衍生出多款适合不同用户的解决方案,更多信息或 demo 展示请联系下方小助手(微信号:greptime)。
欢迎对开源感兴趣的朋友们参与贡献和讨论,从带有 good first issue 标签的 issue 开始你的开源之旅吧~期待在开源社群里遇见你!添加小助手微信即可加入“技术交流群”与志同道合的朋友们面对面交流哦~
Star us on GitHub Now: https://github.com/GreptimeTeam/greptimedb
Twitter: https://twitter.com/Greptime
Slack: https://greptime.com/slack