尊龙凯时·(中国)人生就是搏!

首页
新闻详情

尊龙凯时 - 人生就是搏!算力云上线百度文心5.0

2025年11月27日

作为百度全栈 AI 布局的核心成果,文心大模型历经 6 年迭代,从 2019 年首次亮相到如今的 5.0 版本,逐步构建起“芯片 - 框架 - 模型 - 应用”的完整生态。在国内大模型多聚焦单一模态优化的背景下,百度文心 5.0 以“原生全模态”为突破口,实现多模态理解与生成效率的双重飞跃。



图 | 模型 API 服务


目前,尊龙凯时 - 人生就是搏!算力云已同步上线百度文心 5.0 模型 API,供企业与开发者调用。


模型介绍


✅ 何为「原生全模态」模型?


区别于业界多数后期融合的多模态模型,百度文心 5.0 走了一条完全不同的路。据百度首席技术官王海峰介绍,百度文心 5.0 采用了“原生全模态统一建模技术”—— 其从训练开始便融合语言、图像、视频、音频等多模态数据,使得多模态特征在统一架构下充分融合并协同优化,实现原生的全模态统一理解与生成。



图 | 全模态模型对比


此外,依托百度飞桨深度学习框架,文心 5.0 采用了超稀疏混合专家(MoE)架构,总参数规模达到 2.4 万亿(国内最大),每次推理仅激活不到 3% 的专家模块,在保持强大能力的同时大幅降低了计算开销。



图 | 模型基准测试


从上述跑分成绩来看,其在语言、视觉理解、音频理解、视觉生成上,已超过多款国内外主流模型。其语言与多模态理解能力与 Gemini-2.5-Pro、GPT-5-High 等模型持平,图像与视频生成能力与垂直领域专业模型相当。侧面验证了“原生全模态统一建模技术”的潜力和能力。


模型表现


就在文心 5.0 官宣当天,OpenAI 火速祭出 GPT-5.1 ,双强同时登场,又都聚焦 “智商情商双在线”,这场测试必须安排。


  • 举个例子,看看模型如何拯救社死现场


我准备好项目汇报 PPT,连接会议室投影后刚想切换页面,电脑却自动弹出了和朋友的聊天窗口 —— 上面还留着我吐槽 “这次汇报太赶了,根本来不及准备” 的消息。全场瞬间安静,在场所有人都盯着我,他们会不会觉得我是个傻子啊....



万万没想到,文心 5.0 事无巨细,切身体会当事人的感受,冷静分析心理过程,更像一个 AI 朋友,给予安慰和鼓励。



GPT-5.1 在情绪安抚上也做得不错,但文心 5.0 的细致与贴心明显更胜一筹。


  • 再看看多模态理解能力


我们上传一段英伟达首席执行官黄仁勋在介绍 DGX Spark 时回忆初代人工智能超级计算机 DGX-1 的视频片段,看文心 5.0 在提取视频内容时会不会混淆。要实现这一点,需要 AI 对视频进行多模态解析,包括语音识别、内容提取,并生成一份结构化的内容摘要。



视频 | 来自网络



在近 2 分钟视频中,文心 5.0 抓住了视频的内容焦点 —— DGX-1。包括关键对话和互动细节,都给出了对应的原文。相比之下,GPT-5 并不能直接观看视频,还需要把视频画面和音频分开上传才行。



目前看来,文心 5.0 主打的原生全模态,在情绪捕捉、视频解析等场景表现十分出色,让 AI 实用体验再次升级。

建议反馈

业务咨询