主机参考:VPS测评参考推荐/专注分享VPS服务器优惠信息!若您是商家可以在本站进行投稿,查看详情!此外我们还提供软文收录、PayPal代付、广告赞助等服务,查看详情! |
我们发布的部分优惠活动文章可能存在时效性,购买时建议在本站搜索商家名称可查看相关文章充分了解该商家!若非中文页面可使用Edge浏览器同步翻译!PayPal代付/收录合作 |
继“一部手机游云南&;后,抗疫时期,云南在全省范围内的公共场所推广由截至2月24日,云南省累计有1.65亿人次扫码登记“云南抗疫情&;微信小程序,用户数1325.81万人(数据来自昆明信息港)。市民使用起来也极其便捷,在进入公众场所前用微信扫描“入&;二维码,离开时再扫描“出&;二维码,这两张二维码就是云南打赢新冠肺炎疫情防控阻击战的两杆枪。
如此“简单&;的操作背后下的功夫可不“简单&;。
PartⅠ 高效处理急速爆发的亿级流量
如果把每天新增亿级数据存放在普通单机数据库里,数据库的查询性能会急剧下降,甚至分析能力也会受影响。同时,急速的增长量受空间限制无法长期存储,即使通过大批量扩容满足了性能要求,随之而来的是极高的成本投入。最重要的是,普通单机数据库数亿数据的查询性能无法满足秒级返回的需求。
因此业务方迫切需要一款支持PB级,且可以应对高速联机分析和高并发的事务处理的云上可伸缩的HTAP分布式数据库TBase是腾讯自研的分布式数据库,可以轻松应对亿级数据的存储、分析和查询。集高扩展性、高
腾讯云TBase集群架构图
上图是TBase的集群架构图:
Coordinator:协调节点(简称CN),对外提供接口,负责数据的分发和查询规划,多个节点位置对等,每个节点都提供相同的数据库视图;在功能上CN上只存储Datanode:处理存储本节点相关的元数据,每个节点还存储业务数据的分片,简称DN。在功能上,DN节点负责完成执行协调节点分发的执行请求。
GTM:全局事务在这个架构下,TBase集群具有下面几个能力:
多活/多主:每个coordinator提供相同的集群视图,可以从任何一个CN进行写入,业务无需感知集群拓扑;
读/写扩展:数据被分片存储在了不同的DN,集群的读/写能力,随着集群规模的扩大做而得到提升;
集群写一致:业务在一个CN节点发生的写事务会一致性的呈现在其他的CN节点,就像这些事务是本CN节点发生的一样;
集群结构透明:数据位于不同的数据库节点中,当查询数据时,不必关心数据位于具体的节点。
在云南抗疫小程序中,为满足业务高并发的入库和业务分析查询,TBase使用高性能分区表功能,根据数据量的大小将人群流动数据按照天或者间隔几天进行分区存放,解决了业务分库分表的痛点,并且可以进行冷热数据分离,为海量数据的处理提供了高效的方案。同时,利用TBase智能扫描快速定位数据的位置,减少人群范围,实现快速定位。另外,TBase采用分布式架构,可根据业务压力大小灵活扩展计算和存储资源,在节省成本的同时帮助业务高效稳定运行。
要实现亿级数据的秒级返回,最重要的是提高数据节点执行效率,这里就需要提到数据重分布技术。
大家都知道,在分布式执行中通用的技术是数据重分布,数据重分布时容易导致数据节点内部资源使用不平衡,从而影响效率。TBase的数据重分布模型进行了业界独一无二的优化,该优化利用了CPU多核并行计算能力,增强了对复杂通过TBase的shard算法可以将数据快速均匀的分布到各个数据节点中,提升检索效率的同时也解决了单库的存储压力瓶颈问题。
Part Ⅱ 海量数据智能处理分析与建模
通过抗疫小程序,在疫情病患恢复期间,一旦发现确诊人员就可以快速回溯病患曾经出入过的场所,从而快速找出可能和他有过接触的人员并及时通过短信、电话等方式向可能接触者发出提醒,尽最大可能减少交叉传播的可能性。特别是复工人潮的冲击下,为确保市民安全防止病毒扩散,需要不间断的对人群进行流动和回溯分析。
在TBase的智能分析与建模能力下,仅需30秒即可实现亿级数据量去重。这样的秒级响应是怎么实现的呢?TBase利用两个计算特性对海量数据进行分析和关联:
分布列下推查询
非分布列join
在人流不断进出公共场所时,由于前端在设计表结构并未增加主键,存在业务重复扫码以及误操作等情况,这将导致一部分数据是重复,但是这些数据依然是有参考价值的,将这些数据用在后续计算模型丰富,但这无疑给模型带来了不必要的计算。因此我们需要对业务数据进行数据去重操作。利用TBase独特的node_id和ctid以及业务主键属性进行快速筛选以及去重处理之后,简化了后续数据建模中产生的不必要中间结果。
根据扫码数据以及人群的动态轨迹信息,首先根据业务数据量的一些特征分布列设计。比如一些主属性的唯一特征,利用分布列进行下推查询,提升分布式的join计算能力。一些无法下推的查询,将复杂查询的各部分数据转化成重分布查询,利用CPU内存计算优势提高计算。通过针对业务主属性快速的分析,合理进行相关表结构设计,快速的将分析结果提供给前端设备进行预警。
另外,TBase的多核计算能力也成功将CPU多核并行计算能力、执行SQL能力实现秒级返回,保障了模型的稳定分析能力。
在TBase强悍性能的支持下,“云南防抗疫&;小程序从接入数据库到上线仅用了18个小时,有效运用科技化、信息化、的手段,推动疫情防控工作更加高效和精准,进一步降低疫情防控风险。
这几篇文章你可能也喜欢:
- 暂无相关推荐文章
本文由主机参考刊发,转载请注明:1.65亿人次扫码登记的背后,是TBase的秒级返回 - 主机参考VPS测评 https://zhujicankao.com/7566.html
主机参考仅做资料收集,不对商家任何信息及交易做信用担保,购买前请注意风险,有交易纠纷请自行解决!请查阅:特别声明 |
相关推荐
-      Cloudflare加速好不好?CloudflareCDN网站加速好用吗?Cloudflare可以进行cdn加速吗?
-      Amazon CloudFront好用吗?AWS CDN好不好?,Amazon CloudFront可以进行cdn加速吗?
-      租用韩国服务器有哪些优势?使用韩国服务器的好处有哪些?
-      中国电信香港沙田电信机房,香港IDC机柜租用机房,香港免备案VPS云服务器机房
-      香港新世界电讯NWT机房,香港IDC机柜租用机房,香港免备案VPS云服务器机房
-      香港电讯盈科PCCW机房,香港IDC机柜租用机房,香港免备案VPS云服务器机房
-      香港九仓WTT机房汇港电讯,香港IDC机柜租用机房,香港免备案VPS云服务器机房
-      香港宽频HKBN机房,香港IDC机柜租用机房,香港免备案VPS云服务器机房
-      主机参考:Managed VPS和Unmanaged VPS有什么区别?我们应该如何正确选择Managed和Unmanaged VPS云服务器?Linux VPS的正确选择姿势
-      华为云“云游戏日”大咖云集,共同探讨游戏极速体验
-      见屏如面,华为云WeLink助力国网湖北电力开启远程办公模式
-      高效共享GPU!浪潮AIStation突破企业AI计算资源极限
评论前必须登录!
注册