Physical AI 火了，为什么 FPGA 变得更加重要？

最近我在看 Physical AI、机器人边缘计算和 AI4FPGA 的资料时，越来越强烈地感觉到：AI 硬件的竞争正在从“单点算力”走向“系统闭环”。

过去我们谈 AI 芯片，很容易把注意力放在训练集群、推理吞吐、HBM、先进封装、TOPS 和大模型参数量上。但当 AI 真正进入机器人、无人系统、智能汽车、工业现场，问题会突然变得更“硬”：相机帧什么时候到？IMU 和编码器怎么对齐？控制指令最晚多久必须下发？传感器异常时系统如何降级？

所以我更愿意把这个问题换一种问法：不是 FPGA 为什么“又回来了”，而是 Physical AI 为什么让 FPGA 这类可编程硬件变得更加重要。

图 1｜Physical AI 的实时闭环中，FPGA 更容易出现在传感器入口、硬件快路径和低时延数据流位置。

一、先讲清楚：Physical AI 和屏幕里的 AI 有什么不同？

屏幕里的 AI 主要处理信息世界：文字、图片、视频、代码、知识问答。它可以慢一点，可以重试，可以把答案交给人判断。

Physical AI 不一样。它要进入物理世界：机器人要移动，机械臂要抓取，无人机要避障，工业设备要控制，智能汽车要对环境做实时反应。这里的 AI 不只是“输出一个答案”，而是要把判断变成动作。

一旦动作进入现实世界，系统立刻多出四类硬约束：

时间约束：动作必须在规定时间内发生，晚了就是失败。

空间约束：设备有体积、功耗、散热、线束、接口和成本限制。

安全约束：系统必须能检测异常、降级、急停，不能只追求平均性能。

接口约束：真实设备里有大量相机、雷达、IMU、编码器、工业总线和私有协议。

二、最近一个月的行业信号：大家开始谈系统工程，而不只谈模型

这不是我个人的主观感受。最近几条行业动态放在一起看，趋势很清楚：Physical AI 的竞争正在从模型能力，扩展到实时系统、边缘硬件、机器人软件架构和可编程数据通路。

2026 年 5 月 27 日，QNX 发布机器人架构报告。报告调研 1000 名全球机器人开发者，里面有几组数字值得硬件工程师认真看：89% 的开发者认为 Physical AI 对未来 3-5 年组织战略关键；95% 认为确定性、实时执行对系统至关重要；但 91% 的团队仍在实时或安全关键负载中使用通用操作系统。

图 2｜QNX 机器人架构报告显示，Physical AI 的难点正在从单点算力转向确定性、实时性、软件架构和系统集成。数据来源：QNX, 2026-05-27。

这组数字背后的矛盾很典型：大家都知道机器人需要确定性，但真实工程里又不得不面对 Linux、复杂中间件、多传感器、多处理器、多控制器带来的系统集成问题。

2026 年 5 月 20 日，Intel 发布面向 Edge AI 和 Robotics 的 Core Ultra Series 3。这类平台强调在边缘侧把 CPU、GPU、NPU 放到同一个系统里，说明机器人和边缘设备正在需要更多本地 AI 能力。

2026 年 4 月底，Altera 把 FPGA AI Suite 2026.1.1 与 deterministic Physical AI、spatial architecture 放在一起讲。这说明 FPGA 厂商已经开始把 FPGA 放到 Physical AI 的数据流、确定性和边缘部署语境里，而不只是传统通信、工业控制和原型验证。

2026 年 5 月，AMD 连续更新 Spartan UltraScale+ 和 Versal Prime Series Gen 2 相关内容。一个强调低成本、低功耗、小封装和可靠连接，一个强调 adaptive SoC 的系统能力。它们共同指向的是：边缘设备需要更灵活的硬件形态，不可能所有东西都等 ASIC。

三、为什么 FPGA 变得更加重要？先从一条机器人数据链路看

很多人谈机器人 AI，第一反应是 VLA/VLM 模型。但一台机器人真正动起来，链路比模型推理长得多：传感器采集、时间戳、数据搬运、预处理、模型推理、策略输出、控制转换、总线传输、执行器响应。

近期 RIO 这类机器人 I/O 研究给了一个非常直接的提醒：评估机器人系统不能只看模型推理时间，还要看 observation-to-action 的全链路延迟。项目页给出的对比图里，RIO 的真实机器人观测到动作延迟约 130.3 ms，而 LeRobot 基线约 581.2 ms。这里重点不是比较某个框架“谁一定更好”，而是说明一个事实：机器人延迟经常被 I/O、数据搬运和中间层开销吃掉。

图 3｜RIO 项目展示 observation-to-action latency：机器人系统不能只看模型推理时间，还要看观测、传输、中间层和动作输出的全链路。图源：RIO 项目页，2026。

这正是 FPGA 变得更加重要的地方。FPGA 擅长的不是“和 GPU 比谁跑最大模型”，而是硬件级数据流：多路传感器同步、行级/帧级预处理、像素流/点云流处理、协议转换、时间戳、触发、过滤、压缩，以及把某些确定性任务绕开通用软件栈。

四、FPGA 的位置：不是最大大脑，而是神经接口

今天讲 FPGA，最容易误解的地方是把它和 GPU/NPU 放在同一个维度上比较：谁 TOPS 更高，谁能跑更大的模型，谁的算子库更多。这个比较有意义，但不能解释 FPGA 在 Physical AI 里的真实价值。

在机器人边缘计算栈里，GPU/NPU 更像“大脑”，负责模型推理；MCU/RTOS 更像“反射弧”，负责电机控制、安全状态机和低层实时任务；FPGA 更像“神经接口”，把外部世界的高速、不规则、多协议信号，整理成系统能稳定消费的数据流。

图 4｜机器人边缘计算栈中，FPGA 更像神经接口：把真实世界的数据按确定时序接入系统，并承担硬件快路径。

所以 FPGA 的价值不是替代所有计算单元，而是让系统在真实世界里接得上、跑得稳、改得动。这三个词很朴素，但非常工程。

五、Physical AI 让 FPGA 变得更加重要的五个原因

图 5｜Physical AI 让 FPGA 变得更加重要，根源来自五类工程约束：传感器、多协议、低时延、边缘功耗和架构不确定性。

传感器变多，数据先到硬件接口，不先到模型

机器人不会只靠一个摄像头理解世界。实际系统里会同时出现 RGB 摄像头、深度相机、ToF、LiDAR、毫米波雷达、IMU、编码器、力传感器、麦克风阵列甚至触觉传感器。

这些数据有不同采样率、不同协议、不同带宽、不同时间戳。模型再强，也要先吃到对齐过、清洗过、同步过的数据。FPGA 可以在入口处做同步、时间戳、滤波、裁剪、缓存和预处理，减少后端 AI SoC 的数据混乱。

机器人看最坏情况延迟，不只看平均 FPS

云端 AI 可以用平均吞吐讲性能，机器人不能。机器人要看的是：最坏情况下多久能发现障碍物？多久能触发刹车？机械臂发现异常后，多久能停下来？

FPGA 的硬件流水线天然适合确定性路径。它不像通用软件栈那样容易受到线程调度、缓存、系统负载和中断抖动影响。

工业现场永远有大量非标准接口

真实工程里，最麻烦的往往不是模型，而是接口：MIPI CSI-2、LVDS、SLVS-EC、GigE Vision、CAN、EtherCAT、TSN、PCIe、SPI、I2C、UART，以及各种厂商自定义协议。

FPGA 的长期价值之一就是做 bridge：把现场的不规则接口，转换成 AI SoC、CPU 或网络系统能够稳定消费的数据流。

边缘设备受功耗、体积和散热约束

机器人、无人机、工业边缘盒子和智能相机都不能无限堆 GPU。很多任务并不需要完整跑一遍大模型，而是需要在前端做裁剪、触发、编码、压缩、滤波、ROI 提取。

这些任务如果都扔给 CPU/GPU，会消耗后端推理预算；放到 FPGA 上做 streaming pipeline，反而能把 GPU/NPU 留给真正需要模型判断的部分。

Physical AI 还没定型，硬件必须能改

这是我认为最关键的一点。现在的机器人软件栈、VLA 模型、传感器组合、控制接口都还在快速变化。这个阶段如果直接做 ASIC，风险很高；如果完全靠通用芯片，又可能扛不住时延和接口压力。

六、别把 FPGA 神化：它更重要，但不是万能

这里必须说清楚：FPGA 不是所有 Physical AI 问题的答案。它有开发门槛，有工具链复杂度，有时序收敛和验证成本，也不适合直接承载所有大模型推理。

我建议用一个很简单的判断法：如果一个 Physical AI 系统主要是标准摄像头 + 标准模型 + 没有严格实时约束，那么 CPU/GPU/NPU 可能就够了；但如果系统出现下面这些特征，FPGA 的价值会明显上升：

多路高速传感器需要同步和预处理；

存在复杂或非标准协议桥接；

要求确定性低时延，而不是只看平均吞吐；

需要在低功耗边缘设备里做硬件级数据流；

需要安全隔离、硬件触发、异常保护和快速降级；

产品还在迭代，接口和算法还没有稳定到可以直接 ASIC 化。

七、CPU、GPU/NPU、FPGA、MCU 到底怎么分工？

这张表背后的核心不是“谁更强”，而是谁负责哪段链路。Physical AI 是系统工程，真正的能力来自异构计算组合，而不是单颗芯片孤军奋战。

八、从产业角度看，FPGA 的叙事正在变化

过去很多人理解 FPGA，主要是三个场景：通信、工业控制、原型验证。今天 Physical AI 带来了新的叙事：FPGA 不只是 ASIC 前的过渡方案，也不只是传统接口胶水，而是边缘智能系统里的 adaptive fabric。

这个变化可以从四个方向观察：

工具链更靠近 AI 开发者。Altera 讲 FPGA AI Suite，AMD/Xilinx 讲 Vitis、Versal、adaptive SoC，背后都是降低 FPGA 进入 AI 系统的门槛。
边缘 AI SoC 更需要前端硬件适配层。AI SoC 越强，前端越需要把传感器数据整理成稳定、低时延、可消费的数据流。
机器人从 demo 进入产品，会暴露大量工程细节。演示视频里看不到的问题，量产时会变成传感器校准、总线抖动、时钟同步、异常保护和现场升级。
Physical AI 需要硬件可验证性。系统不是跑通一次就够了，而是要证明在边界条件、故障条件、长期运行条件下依然可靠。

图 6｜RIO 项目展示的机器人 I/O 抽象很有启发：机器人系统不是单一模型，而是接口、传感器、机器人、策略和中间层共同组成的闭环。图源：RIO 项目页，2026。

九、AI4FPGA 真正该做的，不是只让 AI 写几行 RTL

前面几篇我一直强调：AI 写代码只是入口，工程闭环才是价值。放到 FPGA 这里也一样。AI4FPGA 不能只停留在“自动生成一段 Verilog/VHDL/HLS 代码”，而应该进入更完整的 FPGA 工程流程。

我认为 AI4FPGA 在 Physical AI 方向至少有五个值得做深的方向：

传感器数据流自动设计。根据相机、雷达、IMU 等输入规格，自动生成同步、缓存、时间戳、预处理和协议转换模块。

低时延 pipeline 搜索。在吞吐、延迟、资源、功耗之间做设计空间探索，而不是只生成功能正确的 RTL。

HLS/RTL 与验证联动。自动生成 TestBench、Assertion、覆盖率目标和边界场景，确保硬件数据通路可验证。

软硬件划分建议。判断哪些任务放 GPU/NPU，哪些放 FPGA，哪些放 MCU/RTOS，而不是所有东西一股脑塞进模型。

现场日志和波形驱动优化。把机器人运行中的失败轨迹、波形、统计数据反馈到下一轮硬件设计中。

这也是我认为这类内容对芯片工程师有价值的地方：不是看完一个新闻，而是建立一个判断框架：什么问题该用模型解决，什么问题该用硬件数据流解决，什么问题必须回到验证闭环。

十、团队现在应该补什么能力？

如果一个团队想抓住 Physical AI 带来的 FPGA 机会，我建议不要一上来就追最新模型，而是先补一套更扎实的系统能力。

补传感器和接口知识。理解 MIPI、LVDS、Ethernet、CAN、EtherCAT、PCIe、时间同步和数据格式。
补硬件数据流思维。不要只从软件函数看问题，要能从 pipeline、buffer、backpressure、clock domain crossing 看问题。
补实时系统和安全思维。理解最坏情况延迟、jitter、watchdog、降级路径、故障检测和安全状态机。
补 FPGA 验证能力。TestBench、Assertion、波形、覆盖率、形式验证，这些比“写出模块”更重要。
补软硬件协同能力。知道哪些东西该放在 CPU/GPU/NPU，哪些应该靠 FPGA，哪些必须交给 MCU/RTOS。

十一、我对未来 6-12 个月的几个观察点

接下来我会重点看这几个方向：

VLA/VLM 能不能真正从云端 demo 走向边缘部署。如果模型继续下沉，前端数据通路和低时延接口会更重要。

机器人 I/O 和中间件能不能标准化。接口抽象一旦稳定，FPGA/HLS/AI Agent 的自动生成空间会变大。

FPGA 工具链能不能降低门槛。如果 AI Suite、HLS、自动验证、自动时序分析继续进步，FPGA 会更容易进入 AI 团队。

Physical AI benchmark 会不会从“成功率”扩展到 latency、jitter、功耗、安全回退。一旦指标变细，硬件系统能力会被重新定价。

AI4EDA/AI4FPGA 能不能读懂真实工程证据。包括仿真日志、波形、时序报告、资源报告、板级调试日志，而不是只读代码。

到这里，结论其实很清楚：FPGA 变得更加重要，并不是因为行业回到了过去，而是因为 AI 正在进入更复杂的现实世界。真实世界有噪声、有时延、有传感器、有执行器、有安全边界，也有大量短期无法标准化的接口。

后面我会继续沿着 AI4FPGA、AI4EDA、AI4Chips 和 Physical AI 这条线往下拆：比如芯片 AI Agent 如何参与 FPGA pipeline 设计，AI 如何读懂时序报告和资源报告，以及 Physical AI 时代的芯片工程师应该如何建立新的能力栈。

参考来源

QNX, Inside the Robot: Architecture Benchmark Report, 2026-05-27：https://qnx.software/en/blog/2026/inside-the-robot

Intel Newsroom, Intel Core Ultra Series 3 for Edge AI and Robotics, 2026-05-20：https://newsroom.intel.com/artificial-intelligence/intel-core-ultra-series-3-for-edge-ai-robotics

NVIDIA, Physical AI Data Factory Blueprint, 2026：https://www.globenewswire.com/NewsRoom/AttachmentNg/b0b3b938-bae6-4f9e-b0c2-dd1fad672cce/en

Altera, FPGA AI Suite 产品资料：https://www.altera.com/products/development-tools/fpga-ai-suite

AMD, Announcing New AMD Versal Prime Series Gen 2 Devices, 2026-05-27：https://www.amd.com/en/blogs/2026/announcing-new-amd-versal-prime-series-gen-2-devices.html

AMD, Spartan UltraScale+: The FPGA You Can Count On, 2026-05-12：https://www.amd.com/en/blogs/2026/amd-spartan-ultrascaleplus-the-fpga-you-can-count-on.html

RIO: Flexible Real-Time Robot I/O for Cross-Embodiment Robot Learning, 2026：https://robot-i-o.github.io/