TiDB x TiDB HTAP

为解决MySQL分库分表过于复杂及反欺诈分析T + 1时效不足问题,小红书引入TiDB HTAP方案,在数据服务层采用TiDB提供全部数据服务,高效满足业务诉求。

业务挑战

在数据报表场景,原先采用Hadoop数仓对数据做预聚合,然后放到MySQL里面做查询,随着业务增长,报表形式更加多样化,MySQL的扩展性成为瓶颈。MySQL。1 +1“”“”“”“”“”“”“”

解决方案

缇布,缇布,缇布,缇布。

TiDB HTAP

在数据报表场景,直接使用TiDB直接替换MySQL, TiDB可以通过增加节点进行扩容,并且可以自动实现数据的重新均衡。通过搭建实时流把在线业务层分库分表的MySQL Binlog写到TiDB并进行合库,将一万张分表合成TiDB的一张大表,在TiDB进行查询,事务和聚合等操作,都不会影响主库。

反欺诈数据分析场景应用TiDB之后,把T + 1的提交改成由Flink SQL实时写入,打点数据产生的速率峰值每秒达到三四万,单表一天写入5个亿左右的数据。小红书绕过Hadoop数仓,通过TiDB HTAP提供实时查询,在分钟级就可以看到促销发放优惠券的使用与分发情况,为业务提供高效、稳健的实时数据服务。

小红书将其他数据汇聚至基于Amazon S3和EMR所构建的数据湖中,实现对数据的预处理和聚合,然后加载至TiDB集群,实现统一、高效的运营分析。

应用效果

【翻译

中文:TiDB HTAP

小红书

客户简介

  • 零售与电商

小红书是年轻人的生活方式平台,用户可以通过短视频、图文等形式记录生活点滴,分享生活方式。截至到 2019 年 10 月,小红书月活跃用户数已经过亿,并持续快速增长。

【中文翻译