来源:泽平宏观展望
导读
人工智能引领第四次科技革命,是当前最火的、最具前景、最具爆发力的科技赛道。进入到2025年,发生了什么新的变化?中国人工智能正告别“百模大战”的规模竞赛,向以DeepSeek等六小虎为代表的头部大模型集中。AI发展的核心,从追求模型“可用”转向实现场景的“好用”。
2025年,AI发展有四大核心:
趋势一是应用革命,未来是执行任务的行动式AI,AI能帮你接近真实的问题,而不仅仅是知识生成的生成式AI。执行任务,在数字世界就是代理AI,AI Agent,在物理世界就是具身智能AI。
趋势二是代理AI正在重塑交互范式,以后能颠覆当前的软件APP。 AI正从“对话AI”变成“干活AI”。AI能自主规划、调用工具、完成复杂任务,成为未来新的流量分配中心。字节、百度等大厂已入局,抢占生态位。
趋势三是硬件+AI,具身智能AI多点开花,商业化进程加速。智能驾驶是最先落地的成熟场景,正迎来市场渗透率拐点。随着将高阶智驾下放至入门车型,预计2025年高速与城市NOA渗透率有望实现翻倍增长,突破20%大关。人形机器人则处于商业化黎明期,正以汽车和物流工厂为首个试验场,探索B端应用场景。AI眼镜赛道被大模型重新激活,未来中国企业有望凭借市场消费者兴趣度高涨、供应链完备和研发速度三大独特优势实现跨越式发展。
趋势四是基础设施层,算力与数据是支撑产业发展的两大基石,未来算力国产化加速、打破数据枯竭。中国的AI算力正在围堵中寻求突围。在英伟达占据全球数据中心GPU市场98%份额的背景下,美国的三轮精准封锁使国产算力替代迫在眉睫。国产芯片性能已快速追赶(如华为昇腾910C在性能方面已开始追平先进水平),未来先进制程工艺与核心生态上,依然需要面临加速国产化替代的挑战。全球AI界正面临高质量训练数据将在2028年枯竭的危机,在数据枯竭预期下,未来需要重构AI数据筑护城河。
目录
1 大模型层:迭代永不停歇
1.1 头部大模型格局更加稳定
1.2 后训练是破局关键
1.3 推理需求显著增长
2 应用层:AI应用革命
2.1 软件应用:通用Agent出圈
2.2 硬件应用:具身智能爆发
2.3 人形机器人:从B端开始商业化
2.4 AI眼镜:具备三大产业优势
2.5 智能驾驶:渗透率快速提升
3 基础设施层:算力与数据仍是两大发展基石
3.1 算力:GPU自主化迫在眉睫
3.2 数据:巨大资源潜力待挖掘
正文
1 大模型层:迭代永不停歇
1.1 头部大模型格局更加稳定
大模型领域的发展正经历着从无序竞争到头部集中的演变。早期“百模大战”时期,市场充斥着大量技术水平参差不齐的模型,企业间以快速推出产品抢占市场为首要目标。但随着应用场景不断深化,用户对模型的性能、稳定性和安全性要求大幅提升,单纯追求数量的竞争模式难以为继。在此背景下,阿里巴巴、DeepSeek、字节跳动、腾讯、阶跃星辰、智谱AI六家厂商凭借强大的研发能力、数据资源和资金投入,率先突破技术瓶颈,将大模型从“可用”阶段推向“好用”阶段。
随着“六小虎”的崛起,大模型领域的马太效应开始显现。强者利用先发优势不断扩大领先幅度。阿里巴巴依托电商场景积累的海量数据,持续优化通义千问的商业应用能力;Deepseek凭借在算法创新上的突破,在科研辅助领域独树一帜;字节跳动凭借火山引擎的算力支持和全球化生态,让豆包大模型在多语言交互上表现突出。这些企业通过持续迭代模型、拓展应用场景,吸引更多开发者和用户,进而获取更丰富的反馈数据用于优化模型,形成技术提升-用户增长-数据反哺的良性循环,使得头部与其他企业的差距不断拉大,行业集中度持续提高。
1.2 后训练是破局关键
预训练的Scaling Law曾是推动大模型发展的重要法则,它表明模型性能与模型规模、数据集大小和计算资源之间存在幂律关系,即随着这三者的增加,模型性能会相应提升。通俗讲就如学英语,背100个单词只能蹦单词,背1000个单词能组句子,背1万个单词可能就懂语法和隐喻了,这就是 “学得多 = 能力强” 的朴素 Scaling Law。
然而如今,大模型预训练Scaling Law的发展趋势有所放缓。数据面临挑战,像是可用的高质量数据增长速度受限,公共互联网数据预计在不久后被耗尽,且数据标注成本高昂;另一方面,算力提升遭遇瓶颈,构建和维护大规模算力基础设施的成本极高,技术上也趋近现有硬件的极限,导致通过传统Scaling Law来提升模型性能的难度增大。
尽管Scaling Law放缓,但探索基础大模型能力上限仍极具必要性。基础大模型作为AI发展的基石,其能力的提升能带动众多领域的变革。如马斯克的xAI用全球规模最大的20万张H100算力集群训练出的Grok3,后续预计今年推动的GPT-5、Llama 4等基础大模型也值得期待。
在AI的持续发展进程中,后训练(Post-training)正逐渐成为推动其进化的关键所在。传统大模型完成预训练后,虽掌握了基础能力,但面对复杂场景仍有不足。后训练的出现,为突破这一困境提供了有效途径。GPT-o1借助强化学习和测试时间搜索等后训练技术,在数学、代码等复杂推理任务上成绩斐然,有力证实了后训练扩展律的正确性,彰显出后训练挖掘模型潜力、拓展能力边界的强大功效。
与预训练的“广撒网”不同,后训练聚焦特定任务与场景,精准优化模型。医疗领域中,通过病例数据和医学知识图谱进行后训练的大模型,疾病诊断准确率显著提升;金融投资场景里,利用市场数据后训练的模型,对风险评估等任务的处理能力也大幅增强,使模型从通用智能迈向 “专家型”智能。
今年5月,Deepseek发布了Deepseek-R1-0528版本。根据官网,0528版本在后训练阶段,团队投入了更多算力,使得模型在数学、编程及通用逻辑等方面的表现得到大幅优化。更新后的R1模型的整体表现已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。后训练同样遵循Scaling Law,Scaling Laws已从预训练维度扩展至后训练+实时推理三个维度。
1.3 推理需求显著增长
随着AI应用场景不断拓展,推理端需求呈爆发式增长态势。微软、谷歌等头部客户的日均token调用量已突破数万亿级别,较传统chatbot时代的处理规模实现指数级跃升。多模态模型、Agentic AI等创新形态的加速落地,正催生实时推理需求与大规模低延迟计算的新一轮结构性增长,推动AI算力需求从“模型训练为主”向“推理落地优先”的产业范式迁移。
我们认为推理需求规模有望达到训练阶段的5-10倍。若杀手级应用如AI Agent广泛落地,推理算力需求将进一步攀升。预计到2026年,消费级AI日活跃用户(DAUs)将突破10亿。到2026年,推理计算的需求可能占GenAI总计算需求的70%以上,推理计算需求将超过训练计算需求,并达到后者的4.5倍。
“慢思考”能力(如深度逻辑推理、多步规划)和多模态理解(文本、图像、语音等跨模态交互)正成为AI应用的标配。"慢思考"借鉴了人类认知的双系统理论,强调AI在复杂任务中需进行深度推理与迭代计算,而非仅依赖直觉式响应。这种模式通过引入反思机制、蒙特卡洛树搜索等技术,显著提升了AI在数学推理、策略规划等领域的表现。
多模态则是人类世界的本来样貌,大模型的发展趋势一定是走向多模态。人类通过视觉、听觉、触觉等多种感官接收信息,多模态技术就是模拟这一过程,让机器能够同时处理文本、图像、音频等多种类型的数据。以自动驾驶为例,车辆不仅依靠摄像头的视觉图像识别道路状况,还借助雷达的距离探测数据、传感器的震动反馈等,全方位感知周围环境,做出更安全、准确的驾驶决策。多模态大模型打破了单一模态的局限,极大丰富了信息输入,使模型对世界的理解更加全面、深入。
2 应用层:AI应用革命
技术实现闭环需要应用的落地,软件领域的代理式AI(Agent)、硬件领域的具身AI,正成为备受瞩目的大模型应用方向。
2025年GTC大会上,黄仁勋提出自2012年深度学习革命开始以来AI发展的四个阶段:感知AI、生成式AI、代理式AI、具身AI。
一是感知AI,这是人工智能的初始阶段,让机器能“看见”和“听见”,即具备计算机视觉和语音识别能力,如人脸识别、语音助手等应用。
二是生成式AI,在过去3年里发展迅速,主要以内容生成为核心,能够创造文本、图像、视频等等。文本生成的普及度和使用率最高,以Deepseek、ChatGPT等大模型为代表,大大冲击了传统的检索式搜索引擎,让人们逐渐习惯了与大模型交互来获取知识。
Agent和具身AI则被认为是接下来的发展方向。人工智能发展必然要从“智慧”到“智能”,也就是让AI具备行动能力,这是发展Agent和具身AI的共同意义。Agent聚焦于计算机世界,给予AI调用软件工具的能力,让AI在计算机世界中执行工作任务。而具身AI则聚焦于物理世界,把AI装在新能源汽车、人形机器人这样的物理实体上,让AI在物理世界中感知、理解和行动。
2.1 软件应用:通用Agent出圈
软件领域,大模型正从单纯的“对话AI”向“干活AI”转变。2025年,通用Agent迎来爆发元年。
大模型是知识库,而Agent是行动者。Agent直译为代理,本质就是由大模型驱动的一套自动化软件系统,代表使用者完成任务;其在工作中展现出极高的自主性,无需或极少需要使用者介入。如果说大模型如同一个庞大的知识库,在推理后生成用户需要的答案;那Agent则如同一个行动者,它能够拆解任务、调用工具、最终交付给用户成果。
Agent是大模型向前发展的重要一环,是大模型发展的L3阶段。Agent可以简单理解成是让大模型调用各种工具;工具种类丰富,包括信息检索类工具、 代码与计算类工具、软件与系统操作类工具等。对外部工具的调用能极大拓展大模型的能力范畴,拔高大模型的生产力,是从知识库向行动者跃升的一大显著标志。
Manus的空降发布,推动通用Agent爆火出圈;“干活AI“成为人工智能行业新浪潮,并迅速引起了大厂和创企的生态卡位战。
从应用范畴看,Agent有专用和通用之分。专用Agent即专用于某一特定领域,最成熟的是编程Agent。与之相比,通用Agent则不受限于特定任务类型,能执行各种复杂任务。
Manus是最先出圈的通用Agent产品,由中国人工智能公司Monica于3月发布,并引起巨大热度。在官方展示的几十个案例中,Manus可以完成的任务包括但不限于旅行规划、股票分析、PPT制作、网页制作等等,展现出非常高的通用性。Manus空降后,大厂和AI创企迅速拉开了针对通用Agent的生态卡位战,竞相发布通用Agent产品,大厂如字节跳动和百度、创企如Flowith和天工AI。
通用Agent本质是一场范式革命,未来可能成为最大的流量分配中心,重构当前软件生态。因此Agent未来的发展不仅是一个技术问题,比如大模型本身的推理决策能力要再一步提升、降低幻觉问题;更是一个生态问题,即有多少应用愿意加入通用Agent的生态。值得注意的是,去年11月以来,表示支持Anthropic提出的MCP协议的大模型和应用越来越多,通用Agent的生态建设未来有望逐步强大。
2.2 硬件应用:具身智能爆发
硬件领域,具身智能在2025年热度高涨,人形机器人、AI眼镜和智能驾驶三大赛道迎来催化。
2025年政府工作报告提出要“建立未来产业投入增长机制,培育生物制造、量子科技、具身智能、6G等未来产业”。作为人工智能的重要分支,具身智能浪潮将至。人工智能有两条发展路径:一条是非具身智能,即聚焦于抽象计算所需的智能;非具身智能不具备物理身体,在数字世界运行,通常表现为程序、算法等;典型案例如Deepseek、ChatGPT等大语言模型。另一条则是具身智能,核心在于“具身”二字,即用物理实体来承载AI,从而构成一个可感知真实世界、可理解问题并制定规划、可在真实世界中行动的智能系统,特点是形成“感知——行动”闭环;人形机器人、AI眼镜、智能驾驶是典型案例,依次是“AI+类人机器”、“AI+新能源汽车”、“AI+XR眼镜”。
2.3 人形机器人:从B端开始商业化
人形机器人承载着人类对“通用性”具身AI的终极愿景。传统的工业机器人和服务机器人通常专用于单一任务,如工业机械臂用于流水线的某一环节、扫地机器人用于家居环境清理等等。然而人形机器人从构型设计开始便承载了人类对于“通用性”具身AI的美好愿景,即未来要能像人一样使用各种各样的工具、执行各种各样的任务。人类社会中的许多工具与空间都是围绕着人类设计的,理论上讲完全拟人形态的人形机器人其适用场景会更为广泛,因此双足、全尺寸的构型成为目前最受关注的人形机器人形态。
人形机器人要经历从实验环境到工厂环境再到家庭环境的跨越,其商业化可分为三个阶段:第一个阶段是将人形机器人用于科研教育、娱乐表演等。第二个阶段面向B端,人形机器人替代人从事重复枯燥性、高危险性的工作。第三个阶段面向C端,人形机器人成为智能家居的一环,提升居住生活体验,甚至满足人的养老陪护需求。
当前产业发展重心仍在研发制造环节,但已有部分人形机器人进入B端试水,“进厂”成了人形机器人冲锋商业化的首个试验场。汽车工厂和物流工厂是人形机器人试点部署最主要的两大结构化工业场景,人形机器人在其中执行简易装配、搬运码垛、分拣等工作,任务相对重复且单一。也有一些其他场景,比如有部分人形机器人企业和电子制造企业建立了合作,优必选和富士康、Apptronik和Jabil(捷普)等等。此外,部分企业在2024年也透露了其人形机器人的销售情况或量产计划,基本在数百或者数千台。
伴随宇树科技等企业的出圈,2025年人形机器人赛道迎来浪潮,未来产业发展将围绕两大方向展开:一是利用大模型使人形机器人有更强的“大脑”、使用机器学习技术让其有更强的“小脑”功能。二是谐波减速器、行星滚柱丝杠、六维力传感器等核心上游零部件突破技术壁垒,推动人形机器人做优整机以及降低造价。而诸如人形机器人马拉松赛、拳击赛等活动也会越来越多,都是人形机器人走出实验室要完成的锤炼。
2.4 AI眼镜:具备三大产业优势
大模型的广泛应用,为AI眼镜带来了质的飞跃。多模态大模型赋予AI眼镜强大的功能,使之具备物体识别、实时翻译、导航等实用功能,显著提升用户体验。
眼镜是AI落地的良好载体,具备相当的想象空间。表层上,AI眼镜是对传统眼镜的智能升级,融入多模态传感,内置大模型软件,且仍然可具备MR/AR的现实融合能力。深层上,其核心优势在于便携、交互平滑、功能丰富——AI眼镜既可以兼容智能手机内容生态,也能此基础上开发更丰富的智能应用。
2025年,AI 眼镜成为消费电子领域的热门话题之一,科技巨头纷纷布局这一赛道,苹果、Meta、小米、百度、华为等公司都在积极研发或推出AI眼镜产品。Well-sennXR的数据显示,预计2029年,AI眼镜的年销量将达到5500万副,到2035年有望突破14亿副。未来AI眼镜对传统眼镜的渗透率空间极大,部分中国品牌在此领域有可能实现跨越式发展。有三大原因:
一是国内消费电子市场的优势,不仅用户基数大,而且创新技术接受度高。根据德勤调研,2024年中国消费者对AI、AR/VR产品的兴趣度高达73%,超过美国的58%。
二是供应链和产业优势,中国集合了全球消费电子产品供应链的中上游,珠三角和长三角地区产能占全球70%。品牌实力也不逊色,2025年Q1,中国智能手机品牌在全球市场份额超过1/3。
三是技术迭代快,得益于市场拥抱新兴技术叠加产业链完整,中国厂商的新品研发和改进升级周期短。根据波士顿咨询,中国厂商的综合研发周期在6-8个月,而美国品牌在12-18个月。
AI眼镜赛道方兴未艾,技术路线(如Micro LED、光波导)、应用场景(消费级vs工业级)和区域市场(北美、亚洲、欧洲需求差异)的多元化,使得任何具备核心技术突破或生态整合能力的企业都可能塑造未来的行业格局,值得期待。
2.5 智能驾驶:渗透率快速提升
具身AI率先在智能驾驶领域爆发。2025年,高速NOA和城市NOA渗透率或将迎来超预期增长。2025年2月10日,比亚迪高阶智驾系统“天神之眼”正式发布,比亚迪全系车型将搭载该系统,首批有21款车型上市。天神之眼”分为三个版本:“天神之眼A”(DiPilot 600)配备三个激光雷达,支持全国无图领航,主要搭载于仰望品牌上;“天神之眼B”(DiPilot 300)配备单激光雷达,支持全国无图领航,主要搭载于腾势、比亚迪等品牌上;“天神之眼 C”(DiPilot 100)为高阶智驾三目版,支持高速领航和代客泊车,主要搭载在比亚迪秦PLUS DM-i等入门款车型。天神之眼C最低可搭载于海鸥车型,是行业内首次将高阶智驾下放到7万元级市场的A00级车。
回顾智能手机及新能源汽车的发展路径,科技产品在市场渗透率突破5%之后,通常会迎来加速普及的阶段。比亚迪的入局是智驾行业最大预期差,有望推动L2+级别销量基本盘从100万辆快速提升至1000万辆级别,预计2025年高速NOA+城市NOA有望实现翻倍增长,渗透率超20%。
3 基础设施层:算力与数据仍是两大发展基石
3.1 算力:GPU自主化迫在眉睫
算力是AI的基石,GPU是算力最具象的代名词。GPU(图形处理器),最初是为了图形渲染任务而设计的,它拥有数千甚至数万个计算核心。与CPU(中央处理器)相比,CPU通常只有几个到几十个核心,更擅长逻辑控制和串行处理任务。而大模型训练和推理过程涉及到大量的矩阵运算,对并行计算有着很高的要求,GPU凭借其多核架构展现出无可比拟的优势,因此成为AI领域关键的支撑硬件。
纵观全球GPU版图,美国的控制力是绝对的,达到垄断级别。英伟达作为全球 GPU 市场的龙头企业,其市场份额和技术实力遥遥领先。随着生成式AI大爆发,2023年全球数据中心GPU总出货量达385万颗,同比增长44.2%;其中英伟达出货了约376万个数据中心GPU,市场份额高达98%。英伟达凭借其先进的GPU技术和完善的生态体系(CUDA生态),在AI 算力领域占据着难以撼动的主导地位。
美国GPU霸权下,中国的AI发展事实上处于受制于人的状态,随着全球政治、经济、科技对峙的加剧,针对中国的GPU封锁事件也时有发生。自2022年,标志性的限制事件已经经历了三轮。
第一轮封锁(2022年10月):美国首次将AI芯片纳入出口管制,直接禁止英伟达向中国出售旗舰级AI计算芯片A100和H100。这两款芯片是训练大模型的核心硬件,性能属行业顶尖。面对管制,英伟达迅速推出“合规版”A800/H800芯片,通过性能阉割来规避出口限制,勉强维持对华供应。
第二轮封锁(2023年10月):为封堵“中国特供版”漏洞,美国调整管制标准,将A800/H800纳入禁售范围,同时扩大管制国家至40余国,严防转口贸易。此次封锁后,英伟达又推出中国特供版H20芯片,相当于二次阉割版的H100,性能仅为15%。
第三轮封锁(2025年1月):构建三极世界体系,将全球划分为三个等级—— 17个盟友圈可自由获取GPU;对100多个中间国实施配额制,约能获得5万块GPU;对中国、俄罗斯等敌对国家则全面禁售。
短期看,企业往往通过囤货实现对GPU出口管制的缓冲,然而非长久之计;中长期看,全力加速国产化替代十分必要。一些国产力量正在站出来,例如华为的昇腾910C性能达英伟达H100的60-80%。但是差距仍难以忽视,一方面英伟达最新一代GB200算力再次跃升3倍;另一方面在制程工艺上,英伟达采用5nm/4nm先进制程,而国产主流仍为14nm级别。未来在设计、制程和生态建设方面都需要持续发力,加速自主化脚步。
3.2 数据:巨大资源潜力待挖掘
数据是Gen-AI时代的燃料;基于神经网络的大模型具备典型的“垃圾进、垃圾出”的特征,训练数据的数量和质量直接决定了大模型的性能上限。以OpenAI为例,从GPT-1迭代到GPT-4,随着模型性能的跃升,训练数据量也经历了跨越式增长:2018年GPT-1数据集仅4.6GB,而2023年GPT-4训练数据量达到惊人的百TB级别,翻了数万倍。
然而随着大模型的快速更迭,对于数据枯竭的担忧也越发明显。OpenAI原科学家苏茨克维尔曾表示,“我们只有一个互联网”,虽然计算在增长,但数据却没有增长,预训练毫无疑问会结束。无独有偶,2024年研究机构Epoch AI发布的一份报告预测:人类生成的公开文本数据总有效存量仅约300万亿tokens,总量年增速不足10%,而AI训练数据集规模以每年翻倍的速度扩张,这种剪刀差导致互联网所有高质量文本数据将在2028年枯竭。
内容屏障日益高筑等因素则进一步加剧了数据短缺危机。数据拥有方正通过技术和法律手段限制访问。技术手段比如通过爬虫反制来限制内容调用;而法律手段则更激进,表现为直接的版权诉讼。例如海外《纽约时报》对OpenAI的版权诉讼、杂志巨头康泰纳仕集团曾向Perplexity发出的侵权通知;国内也有类似案例,比如知网对秘塔AI的侵权警告。
数据短缺或成为制约大模型技术发展的关键瓶颈,应对这一危机,有两大思路:一是合成数据,即让大模型生成用于自身训练的新数据;二则是深入挖掘现有的数据资源。
马斯克曾在公开演讲中表示:“现实世界中用于训练AI模型的数据几乎已经耗尽”,并指出合成数据将成为未来唯一的替代路径。然而,合成数据却存在着一些难以规避的问题,例如质量参差不齐、偏离真实分布、并且可能产生模型自噬现象,即模型因反复学习自身生成的数据而导致性能退化的问题。
相比之下,盘活现有数据资源的巨大潜能,则是一种更务实、更富战略价值的解法。我国在此方面展现出独特优势,不仅具备深厚的数据资源积累,同时正在加速完善国家级的数据要素市场。
一方面,我国的数据资源体量和增量都十分强大。中国拥有全球最庞大的网民群体与最活跃的数字化应用生态,有机构预测到2025年数据总量将占全球的近30%。当前,我国数据生产总量呈高速增长态势,2024年同比增长25%。AI相关的数据资源增长尤其快:用于开发、训练和推理的数据量同比增长超40%。智能家居、智能网联汽车等智能设备数据增速位居前列,分别为50%和30%左右。
另一方面,国家级数据标记体系正加速成型,以充分挖掘各行业数据潜力。所谓数据标注,是对数据进行添加标记、说明、解释、分类和编码的过程,是提升人工智能算法、模型核心能力的关键环节。我国数据标注产能全球领先并持续建设:2024年起国家数据局统筹的全国七大标注基地快速推进中,分别位于四川成都、辽宁沈阳、安徽合肥、湖南长沙、海南海口、河北保定和山西大同。2025年3月,七大基地的数据标注总规模达到17282TB,相当于中国国家图书馆数字资源总量的6倍左右。目前已形成医疗、工业、教育等行业的高质量数据集超300个,标注从业人员近6万人。