本次节目,我们邀请到了郭炜(William Guo),Apache 软件基金会成员,Apache DolphinScheduler(海豚调度)PMC,ClickHouse 中国社区创始人。
曾任易观 CTO,联想研究院大数据总监,万达电商数据部总经理,并曾在中金、IBM、Teradata 公司担任大数据方向重要岗位。在大数据采集、存储、处理、挖掘、应用研发等方面具有丰富的理论和实践经验,同时在技术管理上有独特的见解与实践。
> 完整视频版本请点击至B站赏光)
> 点击阅读精华Q&A的文字稿)
# 开源传声筒 #
对本期节目感兴趣的小伙伴,欢迎在评论区随时献花或吐槽,也可微信添加OpenSourceGalaxy 或邮件[email protected]进行反馈。
# 加入我们 #
OpenTEKr 正在招募播客制作、内容编辑及推广的实习生和在职贡献者……申请函及履历表的接收邮箱为 [email protected]。
▼主持人/ Host
ZMA,「大话开源」主理人
▼嘉宾/ Guest
郭炜 William,Apache DolphinScheduler PMC
▼时间戳&内容提要
- 01:35 自报家门
- 02:10 “小海豚调度/DS”项目简介
- 02:45 DS 的优势
- 03:45 DS 如何运行
- 04:24 DS 的用户群体
- 05:21 DS 的发展历程
- 08:07 DS 社区有哪些活动
- 09:09 怎么加入DS社区
- 10:16 对开源的解读
- 12:05 为何坚定不移地投入开源
- 13:33 开源商业化之我见
- 15:34 开源项目成功的3大秘诀
- 20:49 和开源最初的故事
- 23:49 开源在中国的发展
- 28:01 开源社区的全球化布局
- 28:57 非常自豪的一件事儿
- 29:54 影响自己很深的引路人
- 31:36 力推2本书
- 33:35 平日里的兴趣爱好
- 34:35 未来5-10年的规划
▼延伸阅读
- ETL:是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。
- Master-Worker模式:是常用的并行模式之一,它的核心思想是,系统有两个进程协作工作:Master进程,负责接收和分配任务;Worker进程,负责处理子任务。
- Greenplum:公司成立于2003年,2006年推出了首款产品,其主营业务关注在数据仓库和商业智能方面
- 4.Hadoop:Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。
- 5.Cloudera:Cloudera成立于2008年,在企业和大型机构在寻求解决棘手的大数据问题时,往往会使用开源软件基础架构Hadoop的服务。在Hadoop生态系统中,规模最大、知名度最高的公司则是Cloudera。
- 6.Elasticsearch:是提供了一个分布式多用户能力的全文搜索引擎,是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。
- Terradata:是业界知名的MPP架构数据库
▼音乐
- Fugu Vibes - Spatial
- Magic Hat;Astral Search;Twilight Encounter;Fool For Love;True North
▼大伙儿
- 监制/ David
- 后期/ Hope
- 节目运营/ OTr 后厨团队
- 封面设计/ 权亭
▼ 关于节目
- 「大话开源」是一档由OpenTEKr 发起的访谈节目,专注于沉淀开源人的所思所行,力求摸索出有趣、有料、有品的「开源武林秘笈」。
- 每一期对话,我们会邀请身经百战的开源老兵,或冉冉升起的开源之星,来分享他们的前沿洞察、防坑指南,以及鲜为人知的走心故事。在这里,不管您是“开源发烧友”,还是“门外驻足观望的好奇宝宝”,都可以汲取与开源相关的更多心法与招数。
▼ 关于我们
OpenTEKr 憧憬科技普惠的美好未来,信奉**「自由与规则同在,免费与商业共生」**的开源理念,陪伴你我离真实的开源更近一步!
▼ 尽情互动
- 听友群:添加小助手微信OpenTEKr007,备注OSG即可入群
- 微信公众号:OpenTEKr 开源星系 (OSG)
- 微博:OpenTEKr
- 抖音:OpenTEKr
- Twitter:@kr_open