云计算、大数据、人工智能等技术不断发展和应用,使得银行也面临着新的挑战。除却广大用户对银行服务连续性的需求,监管部门也提出了更高的要求。如何提高业务的可用性、强连续性?银行业在讨论这个课题的时候,绕不开的话题之一,就是灾难备份与业务连续性管理。
实际在灾备与业务连续性管理上,银行业算是 “领头羊”了。这不仅是由于其起步早,IBM大中华区业务连续性与灾备服务首席技术顾问苏翔表示:“灾备建设高速发展起来还有个很重要的外部因素就是2001年的9·11事件。此后,尤其是银行业,对灾备建设的重要性和建设的诉求快速提升。”加之,2006年以来,银行业对灾难备份与业务连续性管理深入认识,一些模糊的概念逐渐被澄清,监管机构出台相关指引和管理规范逐步被采纳和推广,灾备咨询与外包也更加深入而规范,银行业真正将灾备提升到了业务连续性管理的高度。
在本期“连线‘赢’行家——行话连播”中,华夏银行总行数据中心副主任于锋和IBM大中华区业务连续性与灾备服务首席技术顾问苏翔,探讨了银行该如何在双活时代提升业务连续性、做好灾备管理、灾备指挥体系建设问题。
当我们在谈论灾备与业务连续性管理时,我们在谈论什么?
于1992年成立的华夏银行,如今已建成了覆盖全球主要贸易区的结算网络。华夏银行总行数据中心副主任于锋表示:“很长时间以来,我们与相关IT厂商的合作都是产品导向的。”也就是说,银行只根据厂商提供的技术和产品来选择服务,“但银行业务发展迅速,原有产品、方案慢慢显现局限性。”再有就是,在一般银行中IT部门人员只占3%,对开源等新技术的掌握与应用是个很大的问题;最后,银行在过去几十年中建立的传统、集中式的业务系统稳固且庞大,将传统IT架构彻底升级或转移也是个令人头疼的问题。
对此,IBM发现,银行业内没有相对标准的双活的定义;加之建立灾备环境本身就有一定的难度,双活会给灾备建设工作提出更高要求。
面临以上的发展困惑和挑战,于锋点明:“银行对多活数据中心核心需求首先是保障业务的连续性;其次,多活数据中心要实现对资源的有效利用和应用的灵活弹性部署;第三,从银行利润价值上考虑,多活数据中心需实现低成本高效能。”
那么在庞大且复杂的业务背后,华夏银行是如何进行灾备建设与业务连续性管理的呢?
“就目前银行的状况来说,我们既要建立自主团队,也要请外部的团队一起做这个事情”,于锋表示,前期请相关能力厂商来做这件事,让更专业的团队在短期内实现基本目标是个很好的选择;同时要按照自身的实际情况和现有系统架构去选择合适的合作伙伴。
双活建设要根据自身条件选路径,提早规划稳步推进
IBM经统计认为,灾备建设经历了四个形态阶段。一是 “主数据中心+备用数据中心”模式,具备了进行集中灾备建设的条件;十年前,随着虚拟化技术的应用,灾备模型第二阶段演进到灾备服务使用模型;而后,双活建设正式成为银行业课题,自动化等技术使得银行在双活甚至多活的模式下,生产和灾备的边界愈发模糊,灾备中心被要求能灵活、快速的接管一些生产业务,管理精度也大幅度提高;近期,云计算等技术的发展推动数据中心和灾备相关的建设向云端延伸。
苏翔从实践角度点明:“建设双活系统,就要将灾备中心所有维度的建设都提升到一个更高水平。”这从建设角度来说是个很大的挑战;作为延伸,对于银行究竟应选择哪种双活结构,苏翔表示:“有的用户重视数据的双活,有的则重视业务,我们应该允许和接受不同的特征,按照银行自身的发展需求来排布他的双活结构。除此之外,自动化之前要做标准化,如果不做标准化以后很难做自动化。”
具体来说,IBM将灾备建设划分为七个不同维度,在这个复杂的环境下,自动化层级的建设要符合双、多活的要求,首先就要保证自动化平台的技术能力。
关于如何选择双活系统软硬件,苏翔提出有几点需要注意,一是基础结构要满足标准化的需求;二是,在技术的选择上要关注其是否具有未来与自动化结构对接的能力;另外,在一些辅助性平台选择上,一定要按照应用、业务的长期发展趋势来提出软硬件的要求。
总而言之,灾备自动化需要“总体规划,分步实施,稳步推进,逐步完善”,在目前绝大多数银行已经开始将灾备系统转型向双多活或者灾备云模式的情况下,对自动化的诉求就是向基础服务转型,随着运维本身自动化水平的提升和灾备自动化水平提升,双活数据中心的价值一定会实现。
点击此处观看完整视频:《双活时代下智能化灾备指挥管理实践之路》
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。