自 GreptimeDB 于 2022 年 11 月 15 日正式开源以来,我们持续致力于打造一个云规模、快速、高效的时序数据处理平台。感谢我们团队和社区的共同努力,GreptimeDB 已取得了许多成果。
当我们全力以赴迈入 2024 时,我们不禁思考:“下一代时序数据库究竟是什么样的?”
迈入 2024 年,我们将拥抱更多创新,GreptimeDB 也将迎来许多关键性的更新,这些关键更新将标志着我们产品能正式被纳入生产环境中使用,为用户呈现与行业内顶尖时序数据库相当的性能基准。
这篇 Roadmap 揭示了我们团队** 2024 正在努力实现的目标和暂定的版本发布计划**,为希望在 GitHub 上为 GreptimeDB 贡献代码的人提供一些切入点。
🌟 Roadmap issue on GitHub: https://github.com/GreptimeTeam/greptimedb/issues/3412
2024 年主要功能更新
2024 年,GreptimeDB 将会计划上线一系列重大升级更新,将极大提升 GreptimeDB 的功能和性能,优化用户体验。
下面是一些即将到来的亮点:
- Metrics Engine (RFC[1])
- Tracking Issue (db#2070[2])
一种针对可观测场景的全新引擎,它的主要目标是能处理大量的小表,特别适合云原生监控,比如使用 Prometheus 的场景。通过利用合成的宽表,这个新的 Engine 提供指标数据存储和元数据复用的能力,“表”在它之上变得更轻量,可以克服现有 Mito 引擎的表过于重量级的一些限制。
Greptime Flow (RFC[3])
- Tracking Issue (db#3187[4])
- 一个轻量级的可以对 GreptimeDB 数据流进行 Continuous Aggregation 的流计算组件。它可以被嵌入到 GreptimeDB 的 Frontend 中,也可以作为单独的服务独立部署在 GreptimeDB 的集群中。
- 一个 Flow Job 可以被以 SQL 的形式被提交:
sqlCREATE TASK avg_over_5m WINDOW_SIZE = "5m" AS SELECT avg(value) FROM table WHERE time > now() - 5m GROUP BY time(1m);
Index
Inverted Index (RFC[5])
- Tracking Issue (db#2705[6])
Smart Index
- 比如自动自动监控工作负载和查询性能,并在需要时自动创建相应的索引或者删除某些不被使用的索引。
Spatial Index
- 支持地理位置信息存储及检索
GreptimeDB Distributed & Autopilot
- Region Migration
- 提供在 Datanode 之间迁移 region 的能力,实现热点数据迁移,以及负载平衡的水平扩展。
- Auto Rebalance Regions
- 基于 Region Migration 实现的自动化负载平衡调度。
- Region Migration
Logs Engine
- 针对日志数据的特性实现的存储引擎,并共用大部分 GreptimeDB 的架构和能力,例如 SQL 查询层、数据分片、分布式路由,以及查询、索引和压缩等都可以共享。使得 GreptimeDB 最终能够成为基于多引擎架构同时提供对 Metrics 和 Logs 数据最极致优化的存储层和相同访问体验的单一系统。
GreptimeDB 版本发布计划
下图展示了 GreptimeDB 2024 年的重大版本迭代路线(计划将根据实际发展略微调整):
🌟 一键跟踪 GreptimeDB 版本升级的最新进程: https://github.com/GreptimeTeam/greptimedb/milestones
GreptimeDB v1.0 将标志着我们向生产就绪版本迈出重要一步,搭载智能索引等进阶功能,重新定义效率与性能的新高标。
我们诚挚地邀请您持续关注 GreptimeDB,亲自体验 GreptimeDB v1.0 的卓越性能,赋能时序数据管理和分析,挖掘数据背后更大的价值。
v0.7(3 月)
- Region Migration
- Inverted Index
- Metrics Engine
v0.8(4 月)
- GreptimeFlow
v0.9(6 月)
- Auto Rebalance Regions
v1.0(8 月)
- Smart Index
- Spatial Index
v1.1(10 月)
- Logs Engine
v1.2(12 月)
- Logs Engine
- Data ingestion from popular log collectors
加入 Greptime 社区
如果对上文提及的任何功能感兴趣,欢迎在 GitHub 上 Star GreptimeDB,也欢迎前往 issue 页面,寻找一些有趣的 Good First Issues 进行实践。
我们不仅欢迎同学们积极参与上述计划中的功能开发,也期待任何意义上的创新想法~扫码添加微信小助手(文末二维码)加入技术交流群,或在 Slack 上加入 GreptimeDB 社区,和我们随时沟通你的反馈和想法。
Reference:
[1] https://github.com/GreptimeTeam/greptimedb/blob/main/docs/rfcs/2023-07-10-metric-engine.md
[2] https://github.com/GreptimeTeam/greptimedb/issues/2070
[3] https://github.com/GreptimeTeam/greptimedb/blob/main/docs/rfcs/2024-01-17-dataflow-framework.md
[4] https://github.com/GreptimeTeam/greptimedb/issues/3187
[5] https://github.com/GreptimeTeam/greptimedb/blob/main/docs/rfcs/2023-11-03-inverted-index.md
[6] https://github.com/GreptimeTeam/greptimedb/issues/2705
GreptimeDB 作为开源项目,欢迎对时序数据库、Rust 语言等内容感兴趣的同学们参与贡献和讨论。第一次参与项目的同学推荐先从带有 good first issue 标签的 issue 入手,期待在开源社群里遇见你!
Star us on GitHub Now: https://github.com/GreptimeTeam/greptimedb
微信搜索 GreptimeDB,关注公众号不错过更多技术干货和福利~
关于 Greptime:
Greptime 格睿科技于 2022 年创立,目前正在完善和打造时序数据库 GreptimeDB,格睿云 GreptimeCloud 和可观测工具 GreptimeAI 这三款产品。
GreptimeDB 是一款用 Rust 语言编写的时序数据库,具有分布式、开源、云原生和兼容性强等特点,帮助企业实时读写、处理和分析时序数据的同时降低长期存储成本;GreptimeCloud 可以为用户提供全托管的 DBaaS 服务,能够与可观测性、物联网等领域高度结合;GreptimeAI 为 LLM 量身打造,提供成本、性能和生成过程的全链路监控。
GreptimeCloud 和 GreptimeAI 已正式公测,欢迎关注公众号或官网了解最新动态!
GitHub: https://github.com/GreptimeTeam/greptimedb
Twitter: https://twitter.com/Greptime
Slack: https://greptime.com/slack