如何用分表存储来提高性能推荐

站长资源 2025/1/29 佚名

2 0 1

首先，童家旺介绍了他认为的什么是优化：第一、做任何事情最快的方法就是什么也不做。

▲支付宝资深数据库架构师童家旺

　　第二、不访问不必要的数据：使用B*Tree/hash等方法定位必要的数据。使用column Store或分表的方式将数据分开存储。使用Bloom filter算法排除空值查询。

　　第三、合理的利用硬件来提升访问效率：使用缓存消除对数据的重复访问。使用批量处理来减少磁盘的Seek操作。使用批量处理来减少网络的Round Trip。使用SSD来提升磁盘访问效率。

　　响应时间和吞吐量之间的关系

　　1、性能。衡量完成特定任务的速度或效率。

　　2、响应时间。衡量系统与用户交互式多久能够发出响应。

　　3、吞吐量。衡量系统在单位时间里可以完成的任务量。

　　▲反应时间

　　▲传统磁盘的访问特性

　　B*Tree优化数据访问介绍

　　▲B*Tree优化数据访问

　　B*Tree优化数据访问模拟场景

　　▲B*Tree优化数据访问模拟场景

　　童家旺通过阿里巴巴的真实应用场景介绍了如何用分表存储来提高性能。

　　一、场景介绍：

　　1、表VeryBigTable含有30个列

　　2、表的记录数为50,000,000条

　　3、平均每个用户为300条左右

　　4、其中有2个列属于详细描述字段,平均长度为2k

　　5、其它的列的总长度平均为250个字节

　　6、此表上的查询有两种模式

　　7、列出表中的主要信息(每次20条,不包含详细信息,90%的查询)

　　8、查看记录的详细信息(10%的查询)

　　9、保存与Oracle数据库,默认block_size(8k)

　　二、要求：

　　1、对此业务进行优化

　　2、分析数据,说服开发部门实施此优化

　　三、性能分析

　　1、每块记录数

　　8192 * 0.80(1) / 250 = 25.5 (主表)

　　8192 * 0.80 / 2000 = 3.27(详情表)

　　8192 * 0.80 / ( 2000 + 250 ) = 2.91

　　2、访问的逻辑IO(内存块访问)

　　List的查询代价

　　改进后=( 300/25.5 ) * y + 4 + x = 4 + x + 11.8y = 4(2) + 7(3) + 11.8 * 1.5(4) = 28.7

　　改进前=( 300/2.91 ) * y + 4 + x = 4 + x + 103.y = 4 + 7 + 103 * 1.5 = 165.5

　　3、访问涉及到的物理读(磁盘块访问)

　　List的查询代价(逻辑IO * ( 1 – 命中率 ))

　　改进后=28.7 * ( 1 – 0.85(5)) = 4.305

　　改进前=165.5 * ( 1 – 0.85 ) = 24.825

　　4、访问时间(ms)

　　改进前=逻辑IO时间+物理IO时间= 28.7 * 0.01(6) + 4.305 * 7(7) = 30.422ms
　　改进后=逻辑IO时间+物理IO时间= 165.5 * 0.01 + 24.825 * 7 = 175.43ms

分表存储,性能

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

评论“如何用分表存储来提高性能推荐”

暂无评论...

www.wwsws.com 伏龙阁资源网

39,976影音资源

44,792技术资源

21,817软件资源

651,128站长资源

更新日志

2025年01月29日

如何用分表存储来提高性能推荐

大数据量，海量数据处理方法总结

程序员应该知道的数据库设计的两个误区

评论“如何用分表存储来提高性能推荐”

更新日志

友情链接

如何用分表存储来提高性能 推荐

大数据量，海量数据处理方法总结

程序员应该知道的数据库设计的两个误区

评论“如何用分表存储来提高性能 推荐”

更新日志

友情链接

如何用分表存储来提高性能推荐

评论“如何用分表存储来提高性能推荐”