📰 中国工商银行&华为推动面向金融AI场景的存储推理加速技术创新

中国工商银行与华为联合研发的存储推理加速技术方案,在2025中国算力大会上被纳入“DC Tech创新先锋”案例集,重点解决金融AI推理效率瓶颈。该方案通过KV Cache技术和NDS直通技术,显著提升了长文档处理的速度和精度,支持金融业务中的财报分析等核心环节。

通过KV Cache缓存加速技术,工行在财报分析场景中实现了首token时延降低和吞吐量提升,单位Token成本也显著下降。同时,分层计算与KV缓存优化提高了AI对财报中关键数据的识别准确度,为信贷决策提供了更深入的智能支持。

最终,该技术方案使得金融行业在长文本、高并发AI推理性能上实现了200%的吞吐量提升和65%的时延降低,单位Token成本节省33%-67%。未来,工行将继续与产业链伙伴合作,探索存储技术在金融AI更多场景的应用,推动金融行业的数智化转型。

🏷️ #金融AI #存储技术 #推理加速 #KV Cache #智能决策

🔗 原文链接
 
 
Back to Top