今年,是 GreptimeDB 在开源之夏的第三年!
本次提交的 4 个项目已经全部审核通过了!
欢迎各位感兴趣的同学直接加入我们的项目交流群👇,也可以到「开源之夏 OSPP」官网了解更多项目信息,i 人同学推荐 email 联系导师获取相关项目的更多内容,增加入选概率哦~
💡 官网地址
🧾 项目列表
📺 项目视频
敲黑板划重点,不了解 GreptimeDB 的同学往这里看‼️
讲点知识
社区简介
GreptimeDB 是一个开源、云原生的可观测数据库,能够统一处理指标、日志和链路追踪等数据,适合任意规模的 IoT,个人项目与可观测性场景。
开源的两年多时间里,技术团队秉承开源的初衷和热忱持续迭代开源版本,参与开源活动,维护开源社区······目前已经在 GitHub 上获得了 5000 多 Star,累计拥有来自全球的 100+ 位个人贡献者和近 10 位 Committer,在 Twitter/Linkedin/Medium 上也获得了很多关注和积极反馈,不断繁荣开源社区。
社区项目主仓库
开源协议
Apache License 2.0
社区官方公共联系邮箱
技术 Tag
Database,Observability,Kubernetes,Prometheus,Grafana,Cloud Native,AWS IoT
编程语言:Rust
看看今年有哪些项目“上班”了!
说点正事
项目一:基于 Apache Iceberg 的 GreptimeDB 备份功能增强
**编号:**2532c0117
**难度:**基础
**支持语言:**中文 & English
导师 & 邮箱: Wenkang/wenymedia@gmail.com
透露一下: 一名热爱开源的数据库开发者,Apache OpenDAL 项目 committer,专注于分布式系统、性能优化与可扩展架构设计。收藏了很多「草莓熊」玩偶。
**技术领域:**Database
**编程语言:**Rust
**开源协议:**Apache License 2.0
项目简述:
GreptimeDB 是一款时序数据库,目前使用自研格式进行备份,这在一定程度上限制了其与企业级数据湖平台的兼容性。本项目将开发一套新的备份机制,使得 GreptimeDB 的数据可导出为 Apache Iceberg 格式(一个为大规模分析数据设计的开放表格格式)。该集成将有助于实现与 Apache Spark、ClickHouse 等大数据平台的数据互通与管理能力增强。
产出要求:
- 项目将支持将 GreptimeDB 中的时序数据导出为符合 Apache Iceberg 规范的表格格式,完整涵盖数据与元数据的映射关系;
- 编写测试用例,确保导出的 Iceberg 数据能够被 Apache Spark、ClickHouse 等主流大数据平台正确识别与读取,验证格式的兼容性与数据的一致性;
- 撰写详细的用户文档,说明如何启用 Iceberg 备份功能、导出数据,以及如何在下游平台中加载使用导出的数据,文档需配合配置说明与命令示例,帮助用户快速上手。
项目技术要求:
- 编程语言:熟练掌握 Rust;
- 数据格式:具备 Apache Iceberg 使用经验,了解其数据结构;
- 数据库系统:了解 GreptimeDB 的备份机制;
- 测试框架:了解数据库系统的测试方法与框架;
- 文档能力:能够撰写清晰、完备的技术文档。
项目二:在 GreptimeDB 中实现基于查询粒度的资源追踪与配额控制机制
**编号:**2532c0116
**难度:**进阶
**支持语言:**中文 & English
导师 & 邮箱: Yingwen/yingwen@greptime.com
透露一下: 一名专注于 GreptimeDB 存储引擎开发的 Rust 开源软件开发者,曾为 arrow-rs、OpenDAL、DataFusion 等高质量项目贡献过代码。业余时间热衷于学习摄影和驾驶。
**技术领域:**Database
**编程语言:**Rust
**开源协议:**Apache License 2.0
项目简述: GreptimeDB 当前已支持逻辑租户隔离,但尚未提供针对租户的资源使用监控与限制机制,尤其在查询执行层面。该项目旨在开发一套查询级别的资源追踪系统,用于监控每条查询的 CPU 和内存使用情况,并在其超过预设配额时终止查询执行。在执行阶段,查询会被优化为不同的执行计划,资源使用指标可以附加到这些计划上,从而让 GreptimeDB 实时感知资源消耗。
产出要求:
- 实现一套查询级别的资源追踪系统,可以追踪查询的资源消耗;
- 可以限制单个查询能使用的内存和 CPU 时间,可以提前终止超过限制的查询;
- 如有余力,可实现全局的资源限制,即限制所有查询最多可使用的资源。
项目技术要求:
- 编程语言:熟练掌握 Rust,GreptimeDB 的主要开发语言;
- 并发与异步编程:具备 Rust 异步编程模型和并发模式的实践经验;
- 数据库系统:理解数据库查询执行机制与资源管理逻辑;
- 性能监控:熟悉 Rust 应用中的 CPU 和内存监控工具与方法;
- 测试框架:了解 Rust 相关的测试方法和工具;
- 文档能力:能够撰写清晰、完备的技术文档。
项目三:为 GreptimeDB 实现异步索引构建机制
**编号:**2532c0118
**难度:**进阶
**支持语言:**中文 & English
导师 & 邮箱: Zhenchi/zhongzc_arch@outlook.com
透露一下: GreptimeDB 开发者,专注于分布式时序数据库的架构设计与性能优化,热爱简洁优雅的架构与解决方案。
**技术领域:**Database
**编程语言:**Rust
**开源协议:**Apache License 2.0
项目简述: 随着 GreptimeDB 索引类型的日益丰富(包括 minmax、倒排索引、全文搜索、布隆过滤器等),当前基于 SST 文件层级的同步构建机制已成为写入性能的瓶颈。现有的做法将索引构建与 flush/compact 操作耦合,阻塞了写入流程;而通过 DDL 操作修改 region 元数据实现灵活索引管理,以及查询优化器可智能选择索引的能力,为实现异步索引构建提供了可行性。本项目将重构当前索引构建流程,实现与写入解耦的异步机制。通过引入 double-read 操作,将索引构建与数据持久化解耦,为未来如远程索引器、基于数据分布的自适应索引选择等特性奠定基础。
产出要求:
- GreptimeDB 支持异步构建索引:把建索引过程从写入路径中摘除出来,并实现自动或按需为无索引的数据文件构建索引;
- 如有余力,可继续实现接续的旧数据重建索引功能和远程索引器。
项目技术要求:
- 编程语言:熟练掌握 Rust;
- 并发与异步编程:具备 Rust 异步编程模型和并发模式的实践经验;
- 数据库系统:了解 GreptimeDB 的索引机制;
- 测试框架:了解 Rust 相关的测试方法和工具;
- 文档能力:能够撰写清晰、完备的技术文档。
项目四:GreptimeDB 通用 UDF 执行框架设计与实现
**编号:**2532c0119
**难度:**进阶
**支持语言:**中文 & English
导师 & 邮箱: Ruihang/ruihang@greptime.com
透露一下: GreptimeDB 维护者,Apache DataFusion PMC 成员、Arrow Committer、HoraeDB PPMC 成员。
**技术领域:**Database
**编程语言:**Rust
**开源协议:**Apache License 2.0
项目简述: 用户自定义函数(UDF)是数据库系统提供可扩展能力的重要机制。本项目旨在为 GreptimeDB 实现一套 UDF 执行框架,涵盖 UDF 的定义、管理与执行。UDF 的后端可基于 Python 或 WASM,增强其生态适配性。该任务需要开发者具备 Rust 编程能力、数据库执行引擎的基本知识、SQL 编程经验以及相关系统知识。
产出要求:
- GreptimeDB 支持创建、修改、删除以及在 SQL 执行时调用用户提交的 UDF,并为 UDF 执行提供基本的运行时安全与隔离能力;
- 完善的设计并完成使用文档的撰写。
技术要求:
- 熟悉数据库系统,特别是执行引擎部分;
- 了解 PostgreSQL 等常见数据库的基本原理,了解 Python 或 WASM 的运行细节及生态;
- 有良好的设计与文档撰写能力。
项目结项
成功结项后,你还将获得一段真实宝贵的项目经验,手把手的开源导师带教,带着“中科院”名字的证书还有丰厚奖金哦!特别优秀的同学还能直接收到 GreptimeDB 的实习 Offer,和我们继续“打怪升级”!
对上述项目感兴趣的同学还请速速进群,或者联系导师,直接到「开源之夏官网」报名🐛
详细参与方式请点击此处获取。
关于 Greptime
Greptime 格睿科技专注于打造新一代可观测数据库,服务开发者与企业用户,覆盖从从边缘设备到云端企业级部署的多样化需求。
- **GreptimeDB 开源版:**开源、云原生,统一处理指标、日志和追踪数据,适合中小规模 IoT,个人项目与可观测性场景;
- **GreptimeDB 企业版:**面向关键业务,提供更高性能、高安全性、高可用性和智能化运维服务;
- **GreptimeCloud 云服务:**全托管云服务,零运维体验“企业级”可观测数据库,弹性扩展,按需付费。
欢迎加入开源社区参与贡献与交流!推荐从带有 good first issue
标签的任务入手,一起共建可观测未来。
⭐ Star us on GitHub | 📚 官网 | 📖 文档