开源社区健康指的是围绕一个开源项目形成的社区中关于项目的技术迭代、社区的组织架构、成员构成、开源治理、上下游协作、社区生态、商业化等多方面的多样性与管理、运作能力状态。这些因素在指导开源项目与相应社区不断发展的过程中至关重要。
开源社区健康指的是围绕一个开源项目形成的社区中关于项目的技术迭代、社区的组织架构、成员构成、开源治理、上下游协作、社区生态、商业化等多方面的多样性与管理、运作能力状态。这些因素在指导开源项目与相应社区不断发展的过程中至关重要。
今天为大家介绍的开源社区健康案例是OpenMLDB 社区,其是 2022 年度 OSC 中国开源项目评选 ——「2022 中国开源社区健康案例」 获奖社区 之一。
社区简介
OpenMLDB 是国内首款开源机器学习数据库,提供线上线下一致的生产级特征平台,主要面向 AI 数据治理难题,已落地上百个企业级人工智能场景。OpenMLDB 针对实时特征需求进行了深度优化,可达到毫秒级的计算延迟。开源以来,OpenMLDB 以特征数据治理能力、SQL 定制化开发能力,提供全栈的、低门槛的特征数据计算和管理平台,面向闭环解决 AI 工程化落地的数据治理难题,帮助企业低成本高效率地解决问题。
发展现状
OpenMLDB 已经稳定更迭了 6 个版本,高效合并 pr 达 1495 个,有效解决 issue 1058 个。社区共有来自世界各地的开源贡献者 133 人,仅在一年半的时间内就取得了 10 倍增长。贡献者来自 13 个国家,其中commits 排名前 15 的核心贡献者来自七个不同组织,开发者的数量和多样性都得到极大丰富。
OpenMLDB 积极建设生态合作,已携手 Pulsar、Kafka、RocketMQ、DolphinScheduler、Byzer、AirFlow、OneFlow、Hive、MaxCompute、Seatunnel 等社区拓展生态上下游,打通 MLOps 全流程,加速 AI 应用落地。
展开全文
OpenMLDB 已落地上百个企业级人工智能场景,已深入 Akulaku、慕尚集团、京东科技、37手游等客户的业务场景中,在金融、零售、科技多个领域得到实践应用,为人工智能工程化落地提供了有力支持。
治理模式
OpenMLDB 拥有专职开发运营团队十余人,具备完整的研发、测试、布道、运营体系,提供面向社区的支撑体系和面向社区需求持续迭代的产品机制,也承担着发展维护开发者关系、参与开源社区传播布道等促进社区健康稳定发展的工作。
OpenMLDB 共有开源贡献者 133 位,有明确的贡献者体系架构和成长路径。社区根据代码的贡献程度以及对于OpenMLDB技术方向的理解,将贡献者分为Contributor、Active Contributor、Reviewer、Maintainer 五类角色。OpenMLDB 社区不同贡献者角色之间的交流碰撞和合作贡献既营造了良好的开源生态,也促进了社区的多元化健康发展。
其中:
● Contributor 是参加过代码贡献的开发者;
● Active Contributor 作为社区的活跃贡献者,需要积极参与OpenMLDB的优化和改进,和其他社区成员进行交流讨论;
● Reviewer 负责 OpenMLDB 的规划和维护,关注并参与项目的更新;
● Maintainer 负责 OpenMLDB 的规划和维护,拥有合并主分支的权限,主导项目的更新并在在社区提供的平台或大型技术峰会进行传播布道。
运营实践
在开源布道传播方面,社区自 OpenMLDB 0.4.0 发布后每月举办 meetup,共举办 8 次 meetup 并整理会议资料和视频发布。社区成员在 GOTC、1024 程序员节、QCon、AICon、AISummit、DataFun summit、ArchSummit、ApacheCon Asia、WAIC、GLAC、SACC、开放原子全球开源峰会等国内外会议上担任出品人或进行技术分享。社区成员累计产出原创技术博客三十余篇,平均每周产出一篇干货内容,同步在国内外各技术社区,以视频图文等多种形式分享技术干货,传递行业经验,发扬开源精神。
在开源教育领域,OpenMLDB 研发团队和英特尔以及新加坡国立大学合作产出——基于英特尔®傲腾™持久内存的特征工程内存数据库,被国际顶级数据库学术会议 VLDB(Very Large Data Base)作为常规研究论文录取。与新加坡国立大学合作产出的基于 OpenMLDB 的联邦学习方案 "A System for Time Series Feature Extraction in Federated Learning" 被国际数据挖掘学术会议 CIKM 录取OpenMLDB 积极参与 2022 中科院开源之夏和首届 GLCC 编程夏令营,发起 OpenMLDB 暑期开源特别行动,社区成员作为导师引领开源新人共同建设良好的开源生态。OpenMLDB 深度融合学术创新与实际应用,尝试打造产学研协同发展的开源模式。
在应用实践方向,开源前 OpenMLDB 落地 100 多个场景,覆盖 300 多个节点,在广发银行、银联、百胜中国等公司的实时反欺诈、实时推荐等业务场景中广泛使用。开源后 OpenMLDB 收获 Akulaku、京东科技、华为、慕尚集团等多个企业开源用户,提供开源组件助力其业务发展,将开源产品落地于具体的业务实践中。
在行业中广受认可。21年8月,OpenMLDB 得到 Gitee 认可,荣获 GVP( Gitee Most Valuable Project,最有价值开源项目)称号。21年9月,OpenMLDB 通过了中国信通院“可信开源项目”评估和“尖峰开源项目”。22年3月,OpenMLDB 在 CSDN IT 技术影响力之星颁奖典礼上斩获 “年度开源项目”奖项。2022年9月16日,OpenMLDB 再次获选“OSCAR 尖峰开源社区及开源项目”。22年12月,OpenMLDB 获得了中国开源云联盟“2022年度中国优秀开源项目”奖项和 IT168 颁发的“2022年度技术卓越奖”。23年1月,OpenMLDB 团队获评 Infoq “2022 年度杰出开源运营团队”。
更多开源社区健康案例可查看 【开源社区健康案例合集】仓库:
查看 开源社区健康案例合集