
掘金握先机,关注@春华财智
发言人互动:开场围绕 “任务完成”“老搭档协作” 展开,提及 “人力资源研究”“大脑与小脑能力攻克”,初步关联 AI 技术研发逻辑,强调 “高质量数据 + 强大 AS 算力” 的核心支撑,明确百度智能云(Baidu Intelligent Cloud)在算力、仿真平台、数据标注服务的基础作用,例如 “实现工具误差 0.1 毫米以内的装配”。
办公痛点共鸣:多位发言人吐槽办公场景痛点 ——2 小时会议需 3-4 小时整理记录、跨国会议翻译滞后丢订单、内容创作中找素材 / 排版耗时,为后续智能硬件发布铺垫需求场景。
会前提示:33:19 提示嘉宾 “尽快落座并将手机调至静音”,33:30 完成会前准备,36:47 宣布 “有请百度创始人李彦宏先生(Robin Li)”。
大会背景:李彦宏指出百度世界大会自 2006 年起已举办 20 届,核心定位是 “开放沟通平台”,主题从首届 “世界从你开始” 到本届 “效果涌现(AI in Action)”,聚焦 “AI 落地应用与价值创造”。
AI 产业结构变革(核心逻辑):正金字塔结构(过去):最底层芯片占据绝大部分价值,模型价值不足芯片 1/10,应用价值再低一个数量级,“不健康且不可持续”,因芯片不直接产生价值,应用才是价值核心。倒金字塔结构(现在 / 未来):芯片之上的模型需产生 10 倍于芯片的价值,基于模型的应用需创造 100 倍价值,“这才是健康的产业形态”,市场对 AI “泡沫” 的质疑将随应用价值释放化解。
关键观点:“AI 能力内化是核心”:当 AI 成为企业 / 个人的 “原生能力”,智能不再是成本而是生产力,可提升决策质量、发现新增长点、降低成本、缩短创新周期。“临界点已至”:AI 从 “智能有限” 走向 “效果有限”,从 “演示级技术” 变为 “解决方案级应用”,这是本届大会主题 “效果涌现” 的核心依据。
数字人技术定位:“AI 时代的通用交互界面”,原因有二:让 AI 拥有 “人的面孔”,实现 “表情、语气、情感的自然交互”,人机对话如真人沟通。可渗透至电商、教育、医疗、客服、销售等 “所有需要人机交互的场景”。
新产品发布:慧播星实时互动型数字人(Huiboxing Real-time Interactive Digital Human)核心功能:在 “高说服力数字人” 基础上升级,1 秒内实时响应,多模态(表情、声音、动作)协调统一,能理解连麦者形象 / 背景并动态反馈,“对真实世界有深度理解”。商业化数据(双 11 成果):83% 开播主播使用慧播星数字人,开播直播间数同比增长 119%,GMV 同比提升 91%;老罗(Luo Yonghao)数字人直播间单场 GMV 达 5500 万元(26 分钟),“复刻真人习惯(如忘点头),接梗比真人更流畅”。
全球化布局:慧播星技术向全球开放,率先落地巴西,“20% 数字人主播每分钟订单生成能力超越真人”;后续将拓展东南亚、美国,接入 Shopee、Lazada 等平台,海外节点部署保障用户体验。
重构方向:从 “文字链接为主” 转为 “富媒体(图片、视频、直播、数字人)为主”,首条搜索结果富媒体覆盖率达 70%(全球首创),“10 个问题中 7 个以富媒体直接回应”。
核心能力(产品经理徐丽演示):模糊问题精准解答:如 “外国电影讲一家人收养男孩,靠橄榄球成冠军”,AI 深度理解后直接匹配《弱点》并生成剧情解读。小众内容 AIGC 生成:如 “科学家如何判断动物相当于人类智力”,网络无匹配视频时,AI 实时生成含 “镜子自我认知测试” 等内容的视频。数字人智能体调用:如咨询滑雪装备,可对话冬奥冠军张虹数字人,获取 “三层穿衣法(外层冲锋衣 + 中层抓绒 / 羽绒 + 内层速干衣)”“米兰冬奥会观赛攻略” 等个性化建议。真实服务链接(MCP Server):如 “电动车以旧换新补贴”,搜索结果直接提供视频解读、官网注册入口、电商下单通道,“从找信息到完成任务一步到位”。主动个性化推荐:基于大模型 “长期记忆 + 推理能力”,推测用户意图生成定制内容,如为 “肠胃疾病 + 关注 AI 工具” 的用户定制调理食谱、专属头像、播客。
行业开放:发布百度搜索 AI API,沉淀百度 25 年搜索技术,已与三星、荣耀、vivo 等主流厂商合作,625 家厂商通过百度智能云接入,“成为行业技术底座”。
百度地图(Baidu Maps):个性化路线规划:如 “广西十一假期路线”,结合 “爱美食、爱自驾” 偏好推荐 “喀斯特地貌景区 + 避堵路线”,实时解答 “喀斯特地貌形成原因”。导航语音定制:支持 “明星 / 个人数字人语音”,如 “出行有我赞” 代言人语音包。
豆豆游戏伙伴 1.0(DouDou Game Partner 1.0):核心功能:基于 VLM 模型理解游戏画面 / 进展,实时陪玩、出谋划策,支持所有游戏;依托百度智能云实现 “1 秒内实时响应 + 高并发稳定交互”。数据:测试阶段用户 800 万,上线当天流量暴增,百度智能云 10 分钟内完成 3 次线上扩容。
小度 AI 眼镜(Xiaodu AI Glasses):发布信息:大会现场推出,计划 2025 年内开售,定位 “出行 / 生活辅助智能硬件”,功能含 “语音交互、实时导航、信息查询”。
新产品:秒搭 2.0(Miaoda 2.0)核心升级点:全站应用一键生成:覆盖 “开发→调试→部署→线上托管” 全环节,小白可通过 “一句话指令” 操作(如 “创建闲置服装交易平台,含商品展示、AI 试衣、下单支付、商家 / 用户双端”)。一站式开发与分发:生成应用可一键发布至公网(接入百度搜索获一级流量)、微信小程序(私域运营)。工作流程(原理):产品经理智能体:分析需求,生成专业 PRD(产品设计文档)。程序员智能体:自动写代码,“复杂电商系统几分钟完成,远超人类 20 年经验的 1-2 周工作量”。数据成果:累计生成 40 多万个应用,平均每分钟 1 个落地,服务超千万用户,覆盖教育、办公、电商等领域。本届百度世界大会 “邀请函官网→留资系统→现场活动系统” 均由秒搭无代码生成。出海进展:海外版Oreate上线,获 Product Hunt 日榜第一,访问地址 “oreate.dev”。
新产品:GenFlow 3.0(通用智能体)定位:首个全端通用智能体,覆盖 “学习→工作→创作” 全场景。核心功能:自动学习资料整理:如 “下载 AI 产品经理学习资料”,自动扫描站点、筛选优质内容、分类存储至网盘,支持定时重复执行(如每周三 8 点更新)。多任务并行处理:接收 “数据分析 + 产品文档 + 交互效果 + PPT” 多指令,支持 “干预模式”(中途补充需求无需重启),具备 “全局记忆”(记住用户风格 / 历史数据)。全格式生成与编辑:支持文档、图片、音频、视频、网页、地图等格式,如 “Excel 数据着色 + 图表生成 + 分析结论”“文档图文环绕排版”“PPT 模板替换 + 动态效果”。创意创作:如 “将猫咪照片生成摩托骑士形象”“全屏模式下涂鸦创作视频,支持多人协同”。数据成果:国内用户超 2000 万,海外版Oreate(一站式 AI 学习办公平台)短时间内获 120 万用户,AI 播客活跃用户超 5000 万。
技术与运营数据:每周全无人订单超 25 万,全球出行服务次数超 1700 万,全无人里程突破 1.4 亿公里,自动驾驶总里程超 2.4 亿公里(相当于绕地球 6000 圈)。安全性:全无人驾驶平均行驶 1014 万公里才触发 1 次安全气囊,“远超人类驾驶员,也超越谷歌 Waymo”。
全球化落地:中东阿布扎比:已进入 “全无人商业化运营阶段”,将为 F1 世界大奖赛收官战(12 月)提供接驳服务,计划打造当地最大全无人 Robot Taxi 车队。技术适配性:在国内复杂道路验证成熟,可快速适配全球城市,“从旧金山到迪拜,无人驾驶正在重构城市生态”。
未来价值:当 Robot Taxi 每英里成本降至 0.25 美元(2030 年预测),打车需求将放大 5-7 倍,无人车将成为 “移动生活空间”,重构土地价值、居住需求等城市空间。
核心架构:百度智能云提供 “算力 + 智能体” 双基础设施,助力企业内化 AI 能力。
新产品 1:AI Infrastructure(算力基础设施)昆仑芯(Kunlun Chip)系列:昆仑芯 M100:针对大规模推理场景优化,MOE 模型推理性能大幅提升,2026 年初上市。昆仑芯 M300:针对超大规模多模态大模型训练 / 推理,性能卓越,2027 年初上市。现有成果:昆仑芯 P800 已点亮 3 万卡集群,支撑百度内部 90% 推理任务,5000 卡集群训练多模态模型,合作客户含招商银行、南方电网、吉利汽车、vivo 等上百家。天池超节点(Tianchi Super Node):天池 256:256 张 P800 卡组成超节点,卡间互联总带宽提升 4 倍,推理单卡吞吐超 P800 集群 3.5 倍,2026 年上半年上市。天池 512:512 张 P800 卡组成,卡间带宽再翻倍,“单个超节点可完成万亿参数模型训练”,2026 年下半年上市。未来规划:2027 年推出 “千卡 / 4000 卡级超节点”,5 年内持续迭代,推动集群规模从 3 万卡至百万卡。
新产品 2:Agent Infrastructure(智能体基础设施)定位:“将模型、数据、工具、运行环境封装为智能体系统”,实现 “与真实世界交互 - 执行任务 - 反馈优化” 闭环。核心能力:模型支持:内置文心大模型及 150 + 主流模型,支持自定义模型开发。数据与工具:数据服务将企业经验转化为模型可理解信息;工具服务接入百度 AI 搜索、地图等自有组件,或通过 MCB 链接企业 / 第三方工具。安全合规:含权限管理、安全防护机制。
餐饮行业:一键多人协同 SOP 分析 Agent场景:连锁快餐 “多员工、多菜品、多工序” 的标准化管理难题。功能:识别视频中 “工序时空关系”,自动检测错漏(如汉堡制作漏撒黑胡椒粉),同步统计物料消耗,“减少外卖缺件问题,降低库存成本”。
金融行业:银河证券场外交易 Agent场景:交易员服务数十个客户,询价需求复杂(含行业黑话),易错失交易。功能:理解询价需求,辅助生成报价方案,“客户转化率提升 3 倍,业务规模翻倍”。
航空行业:东航数字员工 “东东”(Dongdong)场景:机票预订、选座、值机、宠物托运等全流程服务。功能:如 “办理泰迪进客舱”,自动校验宠物箱尺寸(≤35×28×24cm)、剩余名额,生成申请表,“实现一站式服务,优化用户体验”。
电力行业:深圳供电局配电网监视 / 操作票审核 Agent场景:深圳供电局年处理 20 万 + 告警、4 万 + 故障,人工调度压力大。功能:1 分钟内分析告警并通知站点,100 秒内审核操作票(零差错),“用户平均停电时间大幅降低,获得电力指标全国第一,超伦敦、纽约”。
产品定位:“自我演化的超级智能体”,名称源自《孙子兵法》“上兵伐谋”,核心目标是 “解决复杂问题的全局最优解”。
原理(关键逻辑):模拟生物进化论:“将几亿年的生物进化过程压缩到几天 / 几小时”,从优秀解中提取规律,结合专家经验库 / 行业算子库,“动态迭代最优方案”,而非 “暴力计算或依赖人工经验”。优势:“不固定方案,随条件变化自动刷新”,可模拟甚至超越顶尖算法专家。
应用案例:交通调度:鄂尔多斯伊金霍洛旗跨河通勤,AI 信控 + 伐谋优化信号灯,车均延误降低 13%,通勤时间从 3 分 20 秒降至 2 分钟内(降幅超 50%),覆盖全国 4942 个路口。金融风控:中信百信银行应用,“短时间内挖掘海量风险特征,找到人工忽略的高价值特征”,达专业数据工程师水平。海上能源:中能建广东院 “电缆桥架布局优化”,“节省近一周工序,释放工程师创造性工作”。港口调度:辽港集团 “20 个岸桥 + 80 条船 + 5 万集装箱” 调度,实现 “效率 - 成本 - 风险最优平衡”。
开放方式:通过 “邀请码 + 官网(famou.com)申请” 提供服务,支持能源、物流、工厂调度、农田灌溉等场景,未来可拓展至新药研发、新材料发明等科学领域。
产品定位:“新一代原生全模态大模型”,百度 CTO 王海峰(Wang Haifeng)主讲,代表大模型技术的四大迭代方向:智能水平突破:2019-2025 年智能水平提升 5 万倍。任务长度扩展:AI 可完成任务长度每 7 个月翻一番。原生多模态统一:统一架构融合文本、图像、音频、视频,推动数字人、无人驾驶等应用爆发。自我学习迭代:具备创新能力,加速物理、生物、材料科学突破。
核心技术(原理):原生全模态建模:不同于 “后期融合”,训练初始即融合多模态数据,多模态特征在 “统一自回归架构” 下协同优化,实现 “理解与生成一体化”。超稀疏混合专家架构:总参数 2.4 万亿,激活参数<3%,依托飞桨(PaddlePaddle)框架实现 “稳定训练 + 高效推理”。强化学习训练:基于 “四类链 + 行动链” 端到端多轮训练,提升智能体与工具调用能力。
核心能力(演示案例):多模态理解:对比分析 2 个戴森吹风机视频,从 “痛点解决、卖点清晰度、场景代入感” 维度,判定 “秀场后台 + 细节展示” 的视频 1 更易赢单。多模态生成:将《甄嬛传》片段二创为《武林外传》佟湘玉风格,“还原佟湘玉泼辣口音与语言习惯,实现形象与语音的精准匹配”。智能体规划:生成 “2025 AI + 医疗 / 金融 / 交通 / 教育行业变革报告”,自动拆解任务→全网检索 100 + 高质量结果→自主总结→生成图表→完成报告。代码能力:响应飞桨社区 “增加比较运算” 需求,从 5000 + 代码文件中定位需修改文件,经几十轮迭代生成代码→单元测试→代码合入,“实现开源社区需求自动响应”。
体验方式:文心 5.0 Preview 已上线文心 App(ERNIE App),开发者 / 企业可通过百度千帆大模型平台调用 API。
文新杯大赛成果:连续 3 年举办,2025 年收到全球近千份报名(覆盖文娱、编码、营销等领域),评选 8 支优胜团队。累计 3200 + 全球创业团队参与,提供数亿元资金支持,配套技术、资源全方位扶持,“点亮创业星火,让应用燎原”。
面向不同角色的 AI 应用建议:职场人士:让 AI 成为 “新同事 / 新助手”,突破创造力边界。开发者:重心从 “写代码” 转向 “理解用户痛点→构思产品→快速验证”。企业老板:聚焦 “高成本 / 高重复劳动环节”,用 AI 降本增效。大型企业 CEO:将 AI 作为 “核心战略”,渗透至 “决策→执行→客户→供应链” 全链条。
“AI 内化是生产力革命的关键”:只有当 AI 成为 “原生能力”,才能在千行百业实现 “效果涌现”,推动 “智能红利转化为社会红利”。
未来展望:“从 AI 效果涌现的今天,奔向超级智能的明天”,AI 将持续渗透至地震后心理干预、残障人士出行、乡村直播带货、海洋生物保护等 “民生与公益场景”,“用科技种子生长善意与希望”。
