在金融行业数字化转型的浪潮中,数据库架构的革新正成为决定业务效能的关键因素。
传统存算一体架构的局限性日益凸显——资源利用率低下、故障恢复缓慢、运维复杂度飙升,已成为金融机构应对高并发、实时数据分析的瓶颈。
中国银保监会发布的《关于银行业保险业数字化转型的指导意见》中明确提出,要推进传统架构向分布式架构转型。“存算分离”凭借其资源解耦、弹性扩展和高可用性,正迅速成为金融行业的首选方案。
“数据库厂商都纷纷走向了存算分离,无一例外。”日前,华为闪存存储领域总裁谢黎明向21世纪经济报道记者表示,“许多金融客户已经总结了在数据库改造和存算分离方面的最佳实践,存算分离不再仅仅是理论,而是已经落地实践并取得了成果。”
与此同时,AI技术的深度融合正在进一步推动数据库架构的智能化演进,从AI赋能数据库运维到数据库支撑AI应用,金融数据库的未来正朝着更高效、更智能的方向发展。
这场架构升级的背后,也是金融业对数字化未来的前瞻布局。
存算分离成必然选择
金融行业对数据库的要求极为严苛,高可用性、高性能和低成本运维是核心诉求。然而,传统的存算一体架构在实践中暴露出了诸多问题,成为金融机构数字化转型的绊脚石。谢黎明向记者指出,存算一体架构在资源利用率、可用性和运维复杂度方面存在显著短板。
首先,资源利用率低下是存算一体架构的致命伤。“在分布式切片模式下,很多客户的CPU和磁盘利用率可能不到5%。”谢黎明提到。
其次则是可用性。金融业务对系统可用性的要求极高,任何宕机或数据丢失都可能造成严重后果。存算一体架构由于依赖服务器本地硬盘,其故障率较高。
“本地硬盘的年故障率可能达到1%。”谢黎明向记者表示,一旦发生故障,数据库需要进行切换和数据重建,不仅耗时,还可能影响业务连续性。
运维复杂度是金融行业在数据库改造过程中面临的另一大挑战。存算一体架构下,随着集群规模扩大,磁盘亚健康状态(如慢盘、超时)频发,运维团队需要频繁介入处理。“这时候本地盘带来的是运营非常复杂,定位非常困难,而且恢复起来非常繁琐。”谢黎明表示。
相比之下,存算分离架构通过将计算和存储资源解耦,实现了更灵活的扩展能力和更高的系统稳定性,成为金融行业技术演进的必然趋势。
“存和算解开,它彼此之间不会绑定,它的资源扩展变得非常灵活,这是存算分离的最大好处。”谢黎明向记者表示。
江南农村商业银行数据库总监王浩特别强调了存算分离架构的可靠性和灵活性。可靠性方面,在存储计算分离架构下,通过共享存储的高可用性,可有效隔离硬盘故障对数据库的影响,使数据库运行保持稳定状态。
灵活性方面,存储计算分离架构将计算节点从物理机改造为虚拟机并大规模应用。以往物理机出现硬件故障时,即使有备件,更换也至少需半小时。而在存储计算分离架构下,计算节点改为虚拟机后,出现故障可快速拉起,尤其在工作时间内,能极大保障业务连续性。
灵活性延伸出经济性。王浩补充道,中小金融机构尤其受限于成本压力,而存算分离架构通过虚拟化技术显著降低了服务器成本。
“我们通过将物理机改造成虚拟机,在存算分离架构下实现了服务器成本的大幅降低。如果采用传统物理机加本地盘的方式,无论是采购成本还是机房建设投入,对中小银行都是难以承受的。”王浩向记者表示。
AI带来新可能
如果说存算分离是当下数据库架构的主流趋势,那么AI的融入则代表了未来的方向。当前,AI与数据库的关系被拆解为两个维度:AI赋能数据库(AI for Database)和数据库赋能AI(Database for AI)。前者聚焦于通过人工智能提升数据库的效率,后者则关注如何优化数据库以更好地服务AI应用。
在AI for Database领域,智能运维成为关键词。传统数据库管理高度依赖数据库管理员(DBA)的人工操作,从参数调优、索引维护到备份恢复,每一项任务都需要专业人员的精细把控。然而,随着数据量的爆炸式增长和业务复杂度的提升,人工管理的局限性日益凸显。AI技术的引入,为数据库的自动化管理提供了新的思路。
过去,AI赋能的方式多集中在小模型,但小模型主要基于规则进行运维和兼容性处理,泛化能力较差。入局大型模型的出现,尤其是其进入Agent(智能体)模型阶段,AI已经发展为具备强大推理能力的模型。
“过去看似复杂的任务,如今借助AI可以轻松完成。”谢黎明向记者举例称,“例如,在海量的日志更新方面,我们过去很难进行联合认证分析,到底性能问题出在哪一段,怎么找到时空关联性,现在借助大模型可以做到这件事。”
深圳计算科学研究院首席架构师沈刚认为,未来的数据库应该像智能汽车一样,具备自我学习和动态调整的能力。例如,数据库在初始部署时可以根据系统环境自动配置最优参数,并在运行过程中持续收集数据,通过机器学习不断优化性能。
而“Database for AI”则代表了另一种变革——数据库技术需要适应AI时代的数据消费模式。谢黎明指出,AI时代的数据交互方式正在从SQL向自然语言转变。“未来用户不再需要编写复杂查询语句,直接用人类自然语言交互,数据的形式会发生变化。”
此外,随着Agent技术的普及,机器与机器之间的数据交互将变得更加频繁和复杂。“数据库必须能够支撑这种新型的‘机器消费模式’”,谢黎明向记者表示,未来的数据库可能需要支持图谱等多种新的模式,更好地适应AI的发展需求。
然而,这场变革也伴随着挑战。业内普遍认为,自动化虽然提升了效率,但也可能引入新的风险,如何确保AI决策的透明性和可控性成为关键。此外,传统数据库并非为AI场景设计,在支持自然语言查询、向量计算等新需求时也可能面临性能瓶颈。
但AI与数据库的融合已是大势所趋。未来,数据库将不再仅仅是数据的容器,而是智能生态的核心枢纽。