本文作者:访客

算力革命!沈抖:百度智能云昆仑芯超节点推理性能飙升 13 倍

访客 2025-04-25 15:59:36 63079
算力革命!沈抖:百度智能云昆仑芯超节点推理性能飙升 13 倍摘要: 文 / 大力财经4月25日,以“模型的世界,应用的天下”为主题的Create 2025百度AI开发者大会在湖北武汉盛大启...

算力革命!沈抖:百度智能云昆仑芯超节点推理性能飙升 13 倍

文 / 大力财经

4月25日,以“模型的世界,应用的天下”为主题的Create 2025百度AI开发者大会在湖北武汉盛大启幕。百度集团执行副总裁、百度智能云事业群总裁沈抖在会上重磅揭晓百度智能云智能基础设施建设的最新成果,并围绕算力、模型及应用等维度,推出一系列全新产品,为企业大模型应用落地注入强劲动能。

在AI时代,大模型的高效落地离不开从底层算力到应用的全栈、系统级支撑,既需要高性能硬件与集群优化,也离不开灵活的开发工具链与场景化解决方案。基于在大模型研发与产业落地领域多年的深厚积淀,百度智能云打造出新一代系统级智能基础设施,为企业大模型应用落地量身定制最佳解决方案。

亮眼的市场表现印证了百度智能云的实力。数据显示,2024全年,百度智能云在大模型相关中标项目数、行业覆盖数、央国企中标项目数三个关键维度均位居行业第一,在能源、政务、金融三个重要行业的中标项目数也领跑所有厂商。截至目前,千帆平台企业用户数量已突破40万,平台组件数量超1000个,企业在该平台上开发的应用数量更是超过100万个。

沈抖强调,系统的核心价值在于赋予企业“创造的能力”。企业可充分结合自身数据、业务流程和逻辑,借助百度智能云的系统级能力,打造专属的AI基础设施,实现个性化、智能化的升级转型。

百舸+昆仑芯超节点:性能飞跃,成本锐减

算力堪称AI时代的“新电力”。百度智能云凭借自研昆仑芯P800芯片及百舸大规模推理加速能力,在算力性能与成本控制上实现重大突破。

大会现场,百度正式点亮昆仑芯P800三万卡集群。在金融领域,招商银行与百度智能云基于昆仑芯P800开展算力合作,稳定支撑各类开源大模型,在智能客服、多模态数据分析等场景中展现出卓越性能,显著提升业务效能。目前,昆仑芯P800算力已在国家电网、中国钢研等央企,同济大学、北京大学等高校,以及众多互联网企业实现规模化部署。

为进一步降低算力使用成本,百度智能云全新发布昆仑芯超节点。该超节点支持将64张昆仑芯AI加速卡集成于同一机柜,单节点性能超强,一个机柜的算力相当于过去100台机器。与传统方案相比,昆仑芯超节点以更快的机内通信替代机间通信,有效降低带宽成本,实现卡间互联带宽提升8倍,单机训练性能提升10倍,单卡推理性能提升13倍。

不过,仅有高性能芯片和大规模集群还远远不够,如何稳定、高效地释放算力价值才是关键。沈抖指出,未来三年,推理降本将成为企业的核心工作。

百度智能云全面升级百舸推理加速能力。通过大规模分布式推理的PD分离技术,百舸支持客户根据不同业务场景特点,灵活设置PD配比,并实现token级别的PD负载均衡。针对MOE模型,百舸进行了大规模多机专家并行的极致优化,大幅降低推理通信开销。同时,对核心链路的每个细节进行系统级工程优化,显著提升GPU有效利用率。

在实际应用中,百舸推理加速能力作为千帆的算力底座,为40万客户提供服务。自上线以来,千帆推理吞吐提升20倍,推理速度提升50%以上。在外部,百舸不仅满足招商银行、中国石化、长安汽车等企业的超大规模算力需求,也为初创企业和合作伙伴的模型训练、推理提供有力支持。

以北京人形机器人创新中心为例,百度百舸为其构建稳定的超大算力集群,保障具身模型训练和推理高效进行,助力人形机器人快速迭代。在全球首个人形机器人半程马拉松比赛中,北京人形机器人创新中心的纯电驱全尺寸人形机器人“天工”,凭借百舸算力支持,以2小时40分42秒的优异成绩率先冲线夺冠。

千帆平台推新:提效企业应用开发

企业部署大模型,既需要高性价比的模型服务,也离不开全面的模型工具。在模型服务方面,千帆平台目前汇聚超过100个模型,涵盖文心4.5Turbo、文心X1 Turbo等百度自研模型,以及DeepSeek、Ilama、Vidu等第三方模型,服务稳定可靠。在模型开发层面,千帆平台提供完善的模型开发工具链,支持深度思考模型、多模态模型的定制与精调。

以模型蒸馏为例,智联招聘在人岗匹配场景中,借助千帆平台的模型蒸馏工具链,以千亿参数的DeepSeek R1作为“教师模型”,百亿参数的ERNIE Speed作为“学生模型”。经过调优后的小参数模型,效果可与“教师模型”相媲美,成本却降低至原来的30%。

在应用开发领域,本次大会上,千帆平台全面升级企业级Agent开发工具链,推出全新推理式智能体——智能体Pro。智能体Pro实现从“快问快答”到“深思熟虑”的跨越,并支持企业定制专属智能体。以污水宝为例,基于千帆Agentic RAG能力,智能体Pro能够结合企业私域数据和知识库,根据任务需求制定检索策略,大幅减少模型幻觉。同时,智能体Pro支持Deep Research深度研究模式,可自主完成复杂任务的步骤规划、信息筛选整理,还能模拟人类操作电脑浏览网页进行探索式知识收集,以及使用多种工具绘制图表、撰写专业报告。

基于DeepResearch能力,荣耀正携手千帆平台,面向高校学生、职场白领等群体,开发一款科研场景深度研究应用,该应用即将在荣耀笔记本上线。

此外,百度智能云正式发布国内首个企业级MCP服务,首批上线超1000个MCP Servers,供企业和开发者灵活选用。开发者还可在千帆平台开发专属MCP Server,并发布至MCP广场,享受免费托管服务。百度搜索将索引这些MCP Server,使其获得更多开发者的关注与引用。

从模型服务到应用开发,企业客户借助千帆平台实现了众多行业创新。民生银行与百度智能云合作,探索大模型在商业银行的落地,成功完成金融领域首个涵盖算力、平台、模型、应用四层架构的端到端项目。

自研AI应用升级:营销与视觉新体验

百度智能云打造的智能基础设施,也为自身应用创新提供了坚实支撑。本次大会上,百度智能云针对智能营销、视觉AI两大领域,升级两大自研AI应用产品。

在金融营销领域,精准获客、优质客服及高效流失预警至关重要。百度智能云升级发布客悦·ONE,全面优化核心营销场景,为客户提供全生命周期智能营销服务,助力企业提升营销效能。以理财撤单场景为例,传统模式下用户操作繁琐、效率低下,而客悦通过AI驱动的智能交互,简化流程,不仅能识别并安抚用户焦虑情绪,还能引导解决问题,自动提炼关键信息回流数据,持续优化服务体验。目前,客悦已服务50余家银行、证券、保险等金融企业,落地10余个金融行业场景。

针对视觉AI模型训练周期长、门槛高、人工干预多的问题,百度智能云升级发布一见5.0。在标准化高、规则清晰的任务中,用户仅需一句自然语言,即可秒级生成专业级视觉AI应用,一线业务人员也能轻松上手。借助云边协同技术,一见5.0大幅降低应用成本,加速视觉智能规模化落地。

目前,百度智能云从算力、平台到应用的系统级能力,已在多个企业场景中稳定运行。中国钢研与百度智能云携手打造全栈智能基础设施,基于昆仑芯和百舸搭建专属智算平台,在千帆平台进行模型精调,采用大、小模型结合的方式实现最佳效果,并结合一见视觉平台,快速完成表面缺陷检测、金相分析等核心场景的应用开发。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享