业务挑战
在数据报表场景,原先采用Hadoop数仓对数据做预聚合,然后放到MySQL里面做查询,随着业务增长,报表形式更加多样化,MySQL的扩展性成为瓶颈。MySQL。1 +1“”“”“”“”“”“”“”
解决方案
缇布,缇布,缇布,缇布。
在数据报表场景,直接使用TiDB直接替换MySQL, TiDB可以通过增加节点进行扩容,并且可以自动实现数据的重新均衡。通过搭建实时流把在线业务层分库分表的MySQL Binlog写到TiDB并进行合库,将一万张分表合成TiDB的一张大表,在TiDB进行查询,事务和聚合等操作,都不会影响主库。
反欺诈数据分析场景应用TiDB之后,把T + 1的提交改成由Flink SQL实时写入,打点数据产生的速率峰值每秒达到三四万,单表一天写入5个亿左右的数据。小红书绕过Hadoop数仓,通过TiDB HTAP提供实时查询,在分钟级就可以看到促销发放优惠券的使用与分发情况,为业务提供高效、稳健的实时数据服务。
小红书将其他数据汇聚至基于Amazon S3和EMR所构建的数据湖中,实现对数据的预处理和聚合,然后加载至TiDB集群,实现统一、高效的运营分析。
应用效果
中文:TiDB HTAP
![小红书](https://img1.www.m.rzhenli.com/prod/logo_29_2x_897f19aec1.jpg)
客户简介
- 零售与电商
小红书是年轻人的生活方式平台,用户可以通过短视频、图文等形式记录生活点滴,分享生活方式。截至到 2019 年 10 月,小红书月活跃用户数已经过亿,并持续快速增长。