更多精彩 >

58集团的StarRocks应用实践

2021-11-12 20:52:50   来源:中国资讯报道网  作者: 

摘要:58集团是中国互联网生活服务领域的领导者,旗下有国内最大的生活服务平台,覆盖各类业务场景,例如车业务、房产业务、本地服务、招聘业务、金融业务等等。

58集团是中国互联网生活服务领域的领导者,旗下有国内最大的生活服务平台,覆盖各类业务场景,例如车业务、房产业务、本地服务、招聘业务、金融业务等等。

  随着业务的高速发展,越来越多的分析需求涌现,例如:安全分析、商业智能分析、数仓报表等。这些场景的数据体量都较大,对数据分析平台提出了很高的要求。为了满足这些分析型业务的需求,DBA团队从2021年初就开始调研各类分析型数据库,其中包括StarRocks、TiFlash、ClickHouse等,评测他们的性能及功能。

  总体评测下来,StarRocks表现全面,在单表/多表查询性能、物化视图及SQL支持等方面能力都契合集团业务需求。目前,我们已经落地了两套StarRocks集群,还有1-2套正在测试阶段,后续会进行进一步推广和落地更多应用。

  一、评测信息

  我们从两个方面来评测以上这些分析型数据库:一个是功能,一个是性能。每种数据库都有各自的特点。

  1.功能方面

  2.性能方面

  2021年初,我们完整对比过3种数据库的性能,包括TiFlash(4.0.10)、ClickHouse(20.3.8.53)、StarRocks(1.11.0)单表及多表join的性能情况。TiDB5.0的TiFlash已经支持MPP,此处为4.0版本,无MPP。

  测试使用业界流行的Star Schema Benchmark星型模型测试集。结论如下:

  ·单表/多表查询,StarRocks总体时间均最短。

  ·单表查询:StarRocks最快次数最多,ClickHouse次之。

  ·多表查询:StarRocks所有执行均最快。

  关于TiDB/TiFlash

  ·TiDB/TiFlash总体时间单表/多表查询均最长。

  ·TiDB执行计划多数走TiKV,导致执行时间长,且数据量越多,执行时间越长。

  ·TiDB强制走TiFlash,单表多数提速多,多表多数变慢,但4.0.10版本的执行计划多数不走。

  关于Clickhouse

  ·ClickHouse多表查询需要更改SQL,使类型一致才可以,且字段名、表名区分大小写。

  ·ClickHouse单机性能强悍,性价比较高。

  ·ClickHouse大单表查询方式效率好,多表关联效率降低明显。

  关于StarRocks

  ·StarRocks单表和多表关联查询速度都非常快。

  【单表查询结果】

  【多表关联查询结果】

  二、业务需求及应用

  1.安全分析相关业务

  每天,内部服务器上的各类操作和运行情况,是内部安全人员比较关心的。但是服务器上每天有大量的信息,如何能快速收集落地、统一实时分析,是这个数据分析场景面临的挑战。具体来说,安全分析业务需要应对以下情况:

  ·写入数据量大,每天大约几亿的数据需要落地;

  ·实时快速的分析支持,例如:最近15分钟,机器信息的情况是怎样的;

  ·需要定期进行数据清理;

  ·数据量不断累积,数据总量规模增长快。

  综合评估后,我们选择了StarRocks来支持安全分析相关业务。在使用初期,我们使用了StarRocks的明细模型(即保留所有历史数据),20天左右,数据行数总量就800亿+了,磁盘空间占用8T左右,由于明细数据量庞大导致查询性能也受到影响。

  后与内部研发人员讨论,业务分析并不需要详细的历史明细,数据按照指定时间粒度进行聚合汇总即可。便将数据模型改成聚合模型,设置日期、小时和15分钟三个时间维度,指标数据按照这个级别的时间维度进行聚合,聚合后每天新增的数据在10亿左右,数据量降低了75%,查询性能也得到大幅提升。且采用kafka+routine load的方式在StarRocks中进行导入聚合,避免了引入冗余的组件,统一了技术栈。

  2.DBA内部业务

  MySQL中间件,我们使用的ProxySQL,ProxySQL支持展示SQL情况。但是操作较为繁琐,每次需要重置,才重新开始统计。如何分析指定时间的SQL情况,是困扰我们的另一问题。

  每个ProxySQL有自己的全日志,我们可以分析全日志来获取需要的信息。第一个架构方案,我们想到了使用ES,ProxySQL全日志–>Filebeat采集–>Kafka–>Logstash–>ES。但是实际使用中,发现虽然可以查看流水,但是分析时就比较麻烦,不如写SQL的方便。

  后来架构又改成了ProxySQL全日志–>Filebeat采集–>Kafka–>StarRocks,这样就可以进行快速分析了。

  另一个问题,因为线上的ProxySQL的日志量特别大,不能所有集群都开,我们设置了可以选择开启,这样有需要的集群才进行分析。降低存储的压力。

  举例:分析某30分钟某集群的SQL执行情况,按照次数排序,查询很快。

  除了上述两个场景之外,StarRocks还被用在了销售使用的报表系统等场景中,包含实时数据分析等业务场景,共50+张表,占用约100T存储空间,查询并发量100-500+。

  三、系统运维

  1.数据接入

  StarRocks支持的数据导入方式很丰富,例如本地文件、HDFS、Kafka(支持csv、json格式)、外表、批量SQL等。数据接入时有以下需要注意的问题:

  ·HDFS导入需要提供Namenode的信息,有些不方便提供就支持不了。

  ·外表模式,创建外表后,可以使用insert into select的方式,循环导入到StarRocks的本地表,能比较方便的从MySQL、TiDB导入数据。

  ·日常最常用的是Kafka的Json格式的数据,需要开发提供:

  -表字段、字段类型及模型(明细模型,聚合模型和更新模型)。

  -Kafka信息:kafka_broker_list,kafka_topic,client.id等。

  ·Kafka的方式,DBA创建表及导入任务就可以导入数据了;日常需要注意的是:最好写个小工具,查看下Kafka的数据信息,然后指明字段,这样来保证成功率。

  ·查看导入任务:SHOW ROUTINE LOADG;关注Statistic,ErrorLogUrls。

  2.集群架构

  目前为单套集群,3个FE,3个BE,Broker按需建立,搭建1套监控(Prometheus+Grafana),推荐使用kafka来接入数据。

  3.运维及自动化

  因为StarRocks标准版无管理组件,需要DBA自己实现:

  ·标准制定,例如:运维标准、开发接入标准等;

  ·自动化部署;

  ·自动化扩缩容;

  ·自动化升级;

  ·拓扑展示、登录;

  ·搭建开源监控;

  ·自己实现报警,例如存活报警、性能报警;

  ·相关运维报表,例如表大小、集群磁盘使用情况、流量情况、SQL情况等。

  目前我们自己已经实现了部分运维规范的制定,例如集群端口、目录、拓扑架构等,并开发了拓扑工具:qStarRocks,可以查看所有集群、指定集群、登录、展示监控节点信息等。

  后期我们会开发相关自动化管理工具,并整合至我们内部的CDB平台,开发相关报表、工单等,方便开发人员使用。

  【查看指定集群拓扑】:

  【查看所有集群】:

  4.服务器

  当前我们使用如下机器进行部署,后期会考虑将FE节点使用虚拟机部署。

  四、发现的问题及注意事项

  ·如果想混合部署,需要提前计划好端口,集群间需要有一定间隔;

  ·StarRocks升级比较快,如果遇到bug可以咨询官方,及时升级避开;

  ·查询报错:2021-05-09 11:38:56-WARN

  ·com.mysql.jdbc.PacketTooBigException:Packet for query is too large(1095400>1048576).You can change this value on the server by setting the max_allowed_packet’variable;

  -处理:set global max_allowed_packet=102410248;

  ·账号授权跟MySQL不同,需要注意;

  ·标准版的周边较少,希望能不断丰富,让更多的人用起来;

  ·Json格式数据导入,字段没法复用,推荐官方添加上,例如:求最大最小时间,需要开发写入Kafka两个时间字段,无法复用一个;

  ·导入数据需要一定的调试经验,例如Kafka,可以自己写个工具,查看下Kafka里面的数据,再进行测试;

  五、场景及定位

  StarRocks是优秀的分析型数据库,可以满足多种数据分析场景的需求。但还有不少业务场景需要用其他数据库来服务,目前58DBA提供了多种数据库,方便业务方根据自身的场景进行选择。

  总结

  目前,我们已经落地了两套StarRocks集群,还有1-2套正在测试阶段,后续会进行进一步推广和落地更多应用。最后,十分感谢StarRocks鼎石科技团队专业的支持服务,希望我们能一起把StarRocks建设得更好。(作者:刘春雷负责58同城MySQL、TiDB数据库、StarRocks的运维工作,主要从事数据库自动化、平台化的建设)

基金巨亏300亿,但张坤赢麻了!

张坤输了吗?拿着天价年薪和管理费提成的张坤当然没输,他简直赢麻了。

2天前

新潮能源上演罗生门:核心海外资产控制权疑团

新潮能源

3月底,吴瑞将多封实名举报信分别寄往了上交所、深圳证监局等多个有关部门。

2天前

Cleer获沙利文权威认证,2023开放式真无线智能耳机销量第一

Cleer

近年来,随着通信、物联网及智能硬件相关技术的不断发展,无线耳机产品的市场规模迅速增长,各大厂商纷纷入...

2天前

匠心独运,铸就非凡——贝佳人“拂晓冬耀”2024秋冬新品发布会圆满成功

贝佳人

近日,以“拂晓冬耀”为主题的贝佳人2024秋冬新品发布会在湖北、广州、吉林、湖南等数十个城市陆续召开...

2天前

大摩看多后穆迪又升评级,权威机构为何扎堆拉抬宁德时代?

宁德时代

4月15日,世界三大信用评级机构之一穆迪评级(Moody’s Ratings,以下简称“穆迪”)将宁...

2天前

康桥资本,一场潜伏八年的并购征途

康桥资本

2022年8月的一天,云顶新耀遭遇成立以来最“至暗时刻”——股价经历五连阴,最低下探至6港元/股。曾...

2天前

诠释品牌深度与温度,《舍得智慧人物》对话游本昌的“舍”与“得”

舍得酒业

4月17日,酒业朋友圈再度被舍得酒业王牌IP《舍得智慧人物》刷屏。

2天前

量化派入选“中关村数智人工智能产业联盟大模型工作委员会”首批成员单位

量化派

4月16日,2024人工智能大模型产业发展大会暨中关村数智人工智能产业联盟第一届第六次会员大会在北京...

2天前

圣基茨和尼维斯首届投资门户峰会延期:与会体验再升级

圣基茨和尼维斯投资门户峰会

备受期待的2024圣基茨和尼维斯投资门户峰会(IGS)宣布改期,原定于5月11日至15日举行的峰会将...

2天前

首个服务于外资跨国企业的IFM项目,世茂服务与科莱恩中国达成合作

世茂服务科莱恩中国

2024年4月17日,世茂服务与科莱恩中国IFM项目服务合作签约仪式在上海举行。

2天前

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

避免卡脖子,硬科技如何“逆境”突围?

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

VC/PE眼中的“专精特新”

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

国内首次!可重复使用技术验证火箭复用飞行成功!

星际荣耀双曲线二号可重复使用验证火箭第二次飞行试验圆满成功

坚守17年,AI“老兵”要上市了

科创板即将迎来一名新成员。

金山云旗下公司增资至4亿美元

金山云旗下公司增资至4亿美元

2024汽车科技创新与成果转化大会在常州成功召开

2024汽车科技创新与成果转化大会在常州成功召开

4月12日,2024汽车科技创新与成果转化大会在常州经开区成功召开。

不响不辍 | 第18届中国投资年会·年度峰会即将启幕

不响不辍 | 第18届中国投资年会·年度峰会即将启幕

2024年5月8-10日,由投中信息、投中网主办,以“不响不辍”为主题的第18届中国投资年会·年度峰...

投资家网协办:首届深圳湾资本市场年会隆重举行

投资家网协办:首届深圳湾资本市场年会隆重举行

12月20日,由南山区资本市场协会主办,投资家网、桐鹏汇财金高管俱乐部协办的资本巿场年会随即举行。

“投资家网·2023中国价值企业榜”重磅发布

“投资家网·2023中国价值企业榜”重磅发布

身处百年未有之大变局,中国经济这艘万吨巨轮,早已屹立于世界舞台中央。

朱民对话瑞•达利欧:2024全球政治风险大于经济与金融风险|和讯财经2023年会

朱民对话瑞•达利欧:2024全球政治风险大于经济与金融风险|和讯财经2023年会

在全球经济经历了激进加息、经济增速放缓、地缘冲突、石油减产等种种事件之后,全球经济增长的态势继续放缓...