让算力更自由:智能网卡的国产化突围

记者:林岑

 

截至2025年,随着“东数西算”工程持续深入推进,智能网卡(IPU)等关键基础设施组件正逐步成为新型算力网络体系中的核心支撑技术。东部地区海量的算力需求通过一体化的数据中心和云计算架构有序向西部转移,而算力资源的调度与优化愈发依赖于底层架构的灵活性和可扩展性。在这一背景下,国内外领先技术企业加速开展架构创新和资源重构,以构建更高效、更智能的算力基础。

 

但值得关注的是,尽管IPU等新型卸载设备近年来被频繁提及,真正具备系统级落地经验的技术专家仍然凤毛麟角。尤其是在国内市场,大多数企业仍处于样机验证或小规模测试阶段,缺乏面向生产环境、复杂部署场景的成熟实践。在调研中,我们关注到康文静女士这位在“智能卸载”技术领域深耕多年的资深架构专家。她在国际排名前列的半导体与计算架构公司中不仅主导完成了国内首套基于FPGA架构的IPU方案,还率先实现了该方案在大型云主机集群中的稳定商用,填补了国内在该领域系统级实践的空白。为深入了解这项突破背后的技术路径与实现逻辑,我们对康女士进行了专访,力图还原她在关键决策、工程实现与体系构建中的深度思考,也希望借此为中国云基础设施迈向大规模异构算力部署提供可借鉴的经验。

 

谈起基于FPGA架构的智能网卡(IPU)方案,康女士回忆,在调研了几乎所有主流中国云服务商的网络需求后,她敏锐捕捉到一个趋势:在如今的数据中心中,云厂商不仅追求更高的计算效率,也迫切需要更强的网络卸载能力和更可靠的多租户隔离机制。尤其是在“裸金属、容器与虚拟化”等多种技术混合部署的场景下,智能网卡的重要性正快速上升。

 

她指出,传统的网络接口卡(NIC)在面对大规模横向数据流时,仍高度依赖主处理器,导致CPU资源被大量占用,成为云基础设施进一步扩展的瓶颈。而过去常用的网络加速方案,如DPDK或SR-IOV,在面对复杂部署和安全隔离等新需求时,也逐渐显得力不从心。正是基于这些一线观察与判断,康女士推动了全新IPU方案的落地探索。

 

她带领三个独立开发部门,组建了横跨中美印爱四地、涵盖固件开发、网络协议、架构设计与验证测试的虚拟协同开发团队,并首次引入异构算力协同调度的设计理念,系统性提出了软硬件一体化的IPU解决方案。该方案通过深度卸载网络协议栈、虚拟交换、存储访问、加解密计算、安全策略匹配等一系列高频系统调用,显著减少了主CPU介入次数,从而有效释放主机计算资源,降低延迟,提升整体IO吞吐量和系统并发能力。

 

在虚拟化方面,该架构支持VMM功能卸载与多租户流量隔离,从IPU层即实现微隔离与资源审计机制,为大规模多租户环境下的稳定运行与安全合规提供技术保障。在实践方面,引入了灵活的IPU微架构配置框架,支持用户按业务负载灵活调配卸载模块,并设计了自适应流量引导机制,可动态优化流量路径、降低跨NUMA节点访问延迟。她还亲自参与构建IPU生命周期管理平台,实现从部署、监控到远程升级的闭环自动化运维流程,大幅降低了运维成本。

 

这一技术路线已率先应用于中国最大移动通信商的数据中心项目中,成为国内首批将IPU成功用于商用云主机的案例,标志着国内云基础设施从传统IO架构向卸载架构迈出了关键一步。该架构亦成功实现了虚拟主机与裸金属的统一底层设计,为用户提供更灵活的业务部署模式,并显著提升了客户系统的整体资源利用率与运行效率。

 

通过与业内横向性能对比,结果表明该定制IPU服务器在多个关键性能指标上已达到行业前列的水平,特别是在微秒级时延控制、每秒并发连接数及每瓦性能比等维度表现出显著优势。该方案已被多家头部企业试点采纳,在超大规模并发推流及边缘节点智能转发场景中展现出良好扩展性。

 

康女士的工作不止于产品开发层面,她还参与构建了面向IPU场景的软硬件生态体系,牵头发起了公司内的智能卸载接口标准化倡议,推动IPU核心接口在生态合作伙伴中的互通兼容,并协同开源社区共同建立了针对IPU场景的负载生成、调度优化、能效评估工具链。依托该项目成果,康女士带领团队获得了公司技术进步奖与最佳组织奖,并在同行中确立了其在全球IPU技术领域的影响力。

 

目前,康女士仍在继续牵头将该方案进一步扩大中国云服务商市场,通过与第三方智能网卡合作伙伴的联合开发,推动IPU方案的商业化拓展,并探索与容器原生环境(如Kubernetes CNI插件)的深度融合路径。根据国际咨询机构预测,到2025年,中国市场IPU年营收将达到约14.6亿美元,显示出该技术未来广阔的发展潜力。

 

评论

2025-05-08 09:33

相关内容

本内容为作者独立观点,不代表商业评论网立场。

原创内容未经允许不得转载,授权事宜请联系微信“零售君”(lingshoujun2018)或“商评小微”(xmi8607)。