Pivotal数字化转型主题研讨会之北京大数据专场
收起
活动介绍
Pivotal作为数字化理念的领导者,助力了二分之一500强企业的数字化转型之路。今年我们已经成功举办了五场大数据、容器、云原生应用主题系列技术研讨会,受到了参会人员的一致好评,吸引了大批业内工程师加入我们的社区讨论群与我们一起探讨数字化转型的技术痛点,行业热点。 10月26日,我们将于北京举办《数字化转型主题技术研讨会》之大数据专场。此次,我们邀请了Pivotal中国研发中心的技术专家们为大家带来三个话题,参加者可以学习并了解到Greenplum 5.1发布的流数据加载工具—GPKafka的功能和应用;机器学习工具MADlib;微服务场景中GemFire的最佳实践等技术要点。 数字化转型技术主题系列的活动还在持续进行中,感谢大家的关注和支持,我们期望更多的小伙伴能加入进来,共同聚焦大数据、容器,和云原生应用的技术要领、探讨最新的技术发展、分享实践经验。 会议议程 时间 议程 演讲人 13:30 - 14:00 签到 14:00 - 14:15 开场致辞 姚延栋,纽交所上市企业 Pivotal 公司全球研发总监 14:15 - 15:00 GPKafka - Kafka数据导入工具简介 邱培峰,Pivotal中国研发中心 软件工程师 15:00 - 15:15 茶歇 15:15 - 16:00 数据科学实践 张桓,Pivotal 资深研发工程师 16:00 - 16:45 现代化数据微服务架构实践 庄怀轩,Pivotal 解决方案架构师 演讲摘要 GPKafka - Kafka数据导入工具简介 Kafka是分布式消息订阅系统,有非常好的横向扩展性,可实时存储海量数据,是流数据处理中间件的事实标准。当通过Kafka和greenplum搭建流处理管道时,如何高速可靠的完成流数据加载,成为用户最关心的问题。从5.10开始,Greenplum发布了新的工具GPKafka,为Greenplum提供了流数据加载的能力。本专题主要介绍如何使用GPKafka各种特性,用户可以轻易实现实时数据导入,以及断点续传,各种数据格式加载,以及transform等功能。 数据科学实践 在AI的浪潮下,机器学习在企业级计算领域的应用愈加广泛。企业大量核心数据都存储在关系型数据库中,针对海量数字资产应用机器学习技术的一个痛点问题是存储型系统和不同类型的分析型系统之间的数据拷贝开销。 Greenplum作为一款MPP分布式数据库引擎,内置支持海量数据的OLAP处理,同时Greenplum与顶级高校协作,共同开发的MADlib机器学习框架,实现了数据库内部分析,形成一套从数据存储到分析的一体化解决方案。 本次Meetup将介绍Greenplum的分布式执行引擎,以及借助MADlib,如何实现线性可扩展的机器学习平台。 现代化数据微服务架构实践 随着微服务生态的发展,传统的数据系统也面临着新的挑战。如何在保证大数据系统优异性能的前提下,充分利用现代化微服务架构实现系统改造,Pivotal数据套件可以给出一种新颖的解决方案。作为Spring技术的贡献者和推动者,Pivotal将新一代数据平台,分布式内存计算平台Gemfire与Spring生态完美结合,为数据平台的微服务改造提供了新的思路。 嘉宾介绍 姚延栋,纽交所上市企业 Pivotal 公司全球研发总监 作为Pivotal中国研发中心创始团队骨干成员,发起了Greenplum中国开源社区,同时领导Greenplum 和 HAWQ 中国工程团队成为大数据和机器学习意见领袖。加入 Greenplum/Pivotal之前, 曾在Sun Microsystem 与 Symantec 系统和存储部门工作多年. 于 2005年以荣誉研究生毕业于中科院软件所, 拥有多项国内外专利。 邱培峰,Pivotal中国研发中心 软件工程师 邱培峰,Pivotal中国研发中心软件工程师。自加入Pivotal以来,长期从事Greenplum内核的研发工作,重点解决外部数据源与Greenplum交互问题,参与开发S3 Connector,带领GPClient团队开发Greenplum实时流式数据导入接口,以支持Informatica, Kafka等数据源。加入Pivotal之前曾就职于微软,参与小娜语音合成系统研发。 张桓,Pivotal 资深研发工程师 张桓,Pivotal资深研发工程师。Apache HAWQ Committer,PPMC成员,曾设计开发HAWQ Data locality和Ranger模块。目前在Pivotal从事Greenplum分布式数据库研发工作,主要负责PLContainer及相关Greenplum extension项目。此前张桓在北京大学智能科学系就读,先后获得本科和硕士学位。 庄怀轩,Pivotal 解决方案架构师 庄怀轩在加入Pivotal公司之前先后就职于中国电子科技集团,VMWare等知名软件企业,一直专注于数据系统和应用的结合,拥有超过十年的行业经验,自2012年加入GemFire技术团队,致力于内存数据网格与云计算平台等新型数据架构在国内的推广和应用,在交通,金融,政务等行业都积累了丰富的经验。
Greenplum 是全球首个开源、多云大数据分析平台,被广泛运用于大规模商业智能和分析中,具有极高的稳定性.Greenplum被Gartner于2019年列为全球十大经典和实时数据分析产品中唯一开源数据库。2019年发布的Greenplum6版本使Greenplum拥有了更强的HTAP能力。 获得最新咨询,技术干货,欢迎访问Greenplum中文社区官网:https://cn.greenplum.org/; 加入Greenplum技术讨论群,欢迎微信添加Greenplum助手:gp_assistant.