无尘阁日记

无尘阁日记

90天定律:从落后到突围,国产AI的崛起周期|赛博月刊2507
2025-07-08

1️⃣ 本期概览

  • 时间:2025年7月

  • 内容:AI行业大事记(共106件)

  • 关键词:

    • 国产模型迎头赶上

    • 全模态(文本+图像+音频+视频+3D)

    • Agent与端侧落地

    • 视频生成和音频播客爆发

    • 大额融资回流到应用公司自研模型

    • Meta重金布局引发人才地震

2️⃣ 趋势精华

【模型】

  • 国产迎窗口期:海外仅OpenAI o3-Pro发布,字节Seed-1.6等国产模型已达到全球第一梯队。

  • 垂直领域爆发:高考志愿模型、数学教育模型、端侧长文本模型表现亮眼。

  • 开源化加速:网易、腾讯、百度、小红书等均发布可在消费级GPU运行的高性能开源大模型。

【图像】

  • SeedEdit 3.0、OmniGen2等登场,GPT-Image-1能力已被国产快速追平。

  • 后续竞争将集中在审美、商业策略与训练数据质量

【视频】

  • 字节Seedance、Minimax Hailuo 02等领跑,支持多镜头叙事。

  • 视频Agent出现,尝试突破生成时长限制,视频将是下一轮爆发领域。

【音频】

  • 字节豆包播客模型可实时生成双人对话播客,效果极佳。

  • 腾讯开源音乐生成大模型,音质逼近Suno 3.5,预示着Vibe Music领域可被开源模型快速替代。

【3D与机器人】

  • 腾讯持续深耕3D生成,高质量材质生成效果优异。

  • 机器人智能体尚在早期,但完成大额融资(宇树科技、银河通用),为长研发周期做准备。

【应用】

  • AI IDE战场白热化:阿里通义灵码、百度Comate、Cursor等均在快速更新并集成AI代理。

  • 浏览器+Agent:Genspark、Fellou等推出AI浏览器,网页搜索、代码生成、自动任务交付正在融合。

  • 端侧模型与AI眼镜落地,苹果、小米、Meta均发力为下一代交互准备。

3️⃣ 重大事件速览

日期事件精要
7月国产AI全面追平全球模型能力差距缩小至训练数据差异
7月Meta重金挖角引发行业震动成立Superintelligence Labs,Scale AI CEO跳槽Meta
7月视频生成与视频Agent全面落地字节Seedance、Minimax Hailuo、HeyGen上线可商用生成
7月开源模型遍地开花百度文心4.5、华为盘古、腾讯混元持续发布
7月端侧AI硬件加速部署小米AI眼镜、Gemma 3n端侧大模型发布
7月AI IDE与AI浏览器成为新战场Genspark、Fellou、Windsurf快速迭代

4️⃣ 关键观点提炼

“国产突围”进入加速闭环:

  • 海外大模型更新放缓,国产快速追赶。

  • 端侧模型开源后加速在手机、眼镜等硬件落地。

  • 应用公司反向推出自研模型,应用和模型界限逐渐消失。

“视频+音频”成为国产AI领先突破口:

  • 视频生成的多镜头叙事和高质量画质已实现商业可用。

  • 音频生成模型迅速成熟,播客和音乐生成门槛极大降低。

Agent成为核心趋势:

  • Coding Agent、浏览器Agent、视频Agent快速出现。

  • AI不再仅仅生成内容,而是执行任务和自动交付完整成果。

“资本狂热”与“人才争夺战”并行:

  • 美国资本市场出现过亿跳槽费、百亿美金投资案例。

  • Meta、OpenAI、Google核心人才流动频繁,AI领域竞争白热化。

5️⃣ 为什么值得关注?

🔹 对研究者:

  • 可快速参考全球最新模型架构(MoE、Sparse、端侧多模态)演进与开源实现。

  • 可跟进图像/音频/视频生成能力与微调工具,支持科研或产品开发。

🔹 对产品与运营:

  • 理解Agent与端侧落地机会,探索视频生成、播客生成、AI浏览器新赛道。

  • 把握国产模型飞速崛起带来的窗口期。

🔹 对投资者:

  • 把握垂直领域(视频、音频、3D、法律、教育等)AI创业窗口。

  • 关注国产模型及Agent落地后对算力、数据及下游应用带来的长期价值。

6️⃣ 推荐阅读和使用工具

📚 推荐书/论文:

  • Scaling Laws for Neural Language Models (Kaplan et al.)

  • Sparse Mixture of Experts are Watching: Modality-Aware Gating for Efficient Multi-modal Transformers (Google)

  • Agentic AI: Tasks, Capabilities, and Evaluation (Anthropic)

🔧 推荐使用工具:

如夜话,至此。