您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 人事档案/员工关系 > 构建生态化分布式数据库架构体系(陶勇)
构建生态化分布式数据库架构体系Alibaba.comAbout自我介绍陶勇brave.taoy@alibaba-inc.comTwitter&Sina:@bravetaoIndex内容概要• 分布式数据库解决方案@AlibabaB2B– 分布式数据存储与访问• Cobar– 准实时增量数据获取与消费• Erosa/Eromanga– 多维度数据同步与网站镜像• Otter• 构建分布式数据库生态架构@AlibabaB2B– 全站数据架构– 思考与展望Keywords关键词MySQLprotocolSchema垂直拆分Table水平拆分实时日志解析事务顺序实时镜像双向同步同步事务支持GlobalIDGlobalFailover分布式数据库解决方案分布式数据存储与访问Cobar遇到的问题-2008Oracle50%CPU/IOOracle:index100G产品表上亿条上万TPSOracle4000连接Sharding数据分片v0.6-1.0.x(08-10)遇到的问题-2010v1.1.x(10-11)现在(10-2012.12.23)细节:线程复用模型细节:事务、ResultSet特性SQL事务线性扩展性能QOS按schema权重进行资源隔离NIO&StreamingResultSetmysql5.5语法支持mysql协议级事务支持连接绑定的事务支持对称集群⼀一些数据• 20+Cobar• 线上高峰期4-5wTPS,单机性能10wTPS• 15并发以上,整体性能超过直接访问mysql• 支持mysql5.5全部DML和部分DDL语法分布式数据库解决方案准实时增量数据获取与消费E&E遇到的问题产品实时索引反馈及时回复订单及时通知实时报表网站cache刷新实时透明的获取数据库变更准实时增量数据获取与消费• 以前的做法– DBTrigger– Dumptable– ApplicationMQ• 问题– 运维困难– 数据库、网络瞬时压力大– 业务侵入性强整体架构细节• 数据解析– oracle:redologparser• Archivelog~2min• Onlinelog10ms• Opencolumnsupplementallog– mysql:binlogparser• COM_BINLOG_DUMP• 数据消费– 对称集群– Datacursor:ZooKeeper特性实时性可用性扩展性事务性完整性忠实反映数据库数据变更严格按照事务顺序高峰期1s平时30msN份拷贝可配置对称集群分布式数据库解决方案多维度数据同步与网站镜像Otter遇到的问题数据关联图片同步异构事务支持MixedO+M数据迁移9i-10gO-MEncoding网站实时镜像A-A网站异地容灾数据实时同步整体架构细节• 数据同步– 自定义字段过滤– 自定义文件同步逻辑– 按事务表并发加载– 按表PKhash并发加载• 数据冲突– 实时字段级冲突合并– 冲突判断及解决现有的应用场景• 数据库– 备份:多master-单slaver– 异构迁移、跨版本迁移– OracleActive-Active• 网站容灾– 容灾备份– 读写分离• 网站镜像– 双向读写– 按字段同步– 按事务并发同步分布式数据库解决方案构建分布式数据库生态架构Ecosystem遇到的问题Failover前后⼀一致性Cobar后端mysql动态扩容网站镜像mysql自增主键问题Cobar集群负载均衡Cobar透明升级LSDEcosystem分布式数据库架构生态体系EcosystemLargeScaleDataEcosystemErosa数据解析Eromanga数据消费Cobar数据存储Otter数据同步前端到后端的整体解决方案构建数据流转的生态架构整体架构思考与展望• 产品架构闭环– Underconstructing• OLTP&OLAP• NoSQL数据库• 软硬结合– 单机多实例– 单机高性能MySQL优化单机多实例单机高性能• 存储技术飞速发展,IO不再是瓶颈• MySQL对多核CPU利用率低• RAID:BBWC/Fastpath• Fusionio• Flashcache• Semi-SyncQ&AThanks!Nobest,onlythemostsuitable
本文标题:构建生态化分布式数据库架构体系(陶勇)
链接地址:https://www.777doc.com/doc-4797243 .html