最近我在看 Physical AI、机器人边缘计算和 AI4FPGA 的资料时,越来越强烈地感觉到:AI 硬件的竞争正在从“单点算力”走向“系统闭环”。
过去我们谈 AI 芯片,很容易把注意力放在训练集群、推理吞吐、HBM、先进封装、TOPS 和大模型参数量上。但当 AI 真正进入机器人、无人系统、智能汽车、工业现场,问题会突然变得更“硬”:相机帧什么时候到?IMU 和编码器怎么对齐?控制指令最晚多久必须下发?传感器异常时系统如何降级?
所以我更愿意把这个问题换一种问法:不是 FPGA 为什么“又回来了”,而是 Physical AI 为什么让 FPGA 这类可编程硬件变得更加重要。
图 1|Physical AI 的实时闭环中,FPGA 更容易出现在传感器入口、硬件快路径和低时延数据流位置。
一、先讲清楚:Physical AI 和屏幕里的 AI 有什么不同?
屏幕里的 AI 主要处理信息世界:文字、图片、视频、代码、知识问答。它可以慢一点,可以重试,可以把答案交给人判断。
Physical AI 不一样。它要进入物理世界:机器人要移动,机械臂要抓取,无人机要避障,工业设备要控制,智能汽车要对环境做实时反应。这里的 AI 不只是“输出一个答案”,而是要把判断变成动作。
一旦动作进入现实世界,系统立刻多出四类硬约束:
时间约束:动作必须在规定时间内发生,晚了就是失败。
空间约束:设备有体积、功耗、散热、线束、接口和成本限制。
安全约束:系统必须能检测异常、降级、急停,不能只追求平均性能。
接口约束:真实设备里有大量相机、雷达、IMU、编码器、工业总线和私有协议。
二、最近一个月的行业信号:大家开始谈系统工程,而不只谈模型
这不是我个人的主观感受。最近几条行业动态放在一起看,趋势很清楚:Physical AI 的竞争正在从模型能力,扩展到实时系统、边缘硬件、机器人软件架构和可编程数据通路。
2026 年 5 月 27 日,QNX 发布机器人架构报告。报告调研 1000 名全球机器人开发者,里面有几组数字值得硬件工程师认真看:89% 的开发者认为 Physical AI 对未来 3-5 年组织战略关键;95% 认为确定性、实时执行对系统至关重要;但 91% 的团队仍在实时或安全关键负载中使用通用操作系统。
图 2|QNX 机器人架构报告显示,Physical AI 的难点正在从单点算力转向确定性、实时性、软件架构和系统集成。数据来源:QNX, 2026-05-27。
这组数字背后的矛盾很典型:大家都知道机器人需要确定性,但真实工程里又不得不面对 Linux、复杂中间件、多传感器、多处理器、多控制器带来的系统集成问题。
2026 年 5 月 20 日,Intel 发布面向 Edge AI 和 Robotics 的 Core Ultra Series 3。这类平台强调在边缘侧把 CPU、GPU、NPU 放到同一个系统里,说明机器人和边缘设备正在需要更多本地 AI 能力。
2026 年 4 月底,Altera 把 FPGA AI Suite 2026.1.1 与 deterministic Physical AI、spatial architecture 放在一起讲。这说明 FPGA 厂商已经开始把 FPGA 放到 Physical AI 的数据流、确定性和边缘部署语境里,而不只是传统通信、工业控制和原型验证。
2026 年 5 月,AMD 连续更新 Spartan UltraScale+ 和 Versal Prime Series Gen 2 相关内容。一个强调低成本、低功耗、小封装和可靠连接,一个强调 adaptive SoC 的系统能力。它们共同指向的是:边缘设备需要更灵活的硬件形态,不可能所有东西都等 ASIC。
三、为什么 FPGA 变得更加重要?先从一条机器人数据链路看
很多人谈机器人 AI,第一反应是 VLA/VLM 模型。但一台机器人真正动起来,链路比模型推理长得多:传感器采集、时间戳、数据搬运、预处理、模型推理、策略输出、控制转换、总线传输、执行器响应。
近期 RIO 这类机器人 I/O 研究给了一个非常直接的提醒:评估机器人系统不能只看模型推理时间,还要看 observation-to-action 的全链路延迟。项目页给出的对比图里,RIO 的真实机器人观测到动作延迟约 130.3 ms,而 LeRobot 基线约 581.2 ms。这里重点不是比较某个框架“谁一定更好”,而是说明一个事实:机器人延迟经常被 I/O、数据搬运和中间层开销吃掉。
图 3|RIO 项目展示 observation-to-action latency:机器人系统不能只看模型推理时间,还要看观测、传输、中间层和动作输出的全链路。图源:RIO 项目页,2026。
这正是 FPGA 变得更加重要的地方。FPGA 擅长的不是“和 GPU 比谁跑最大模型”,而是硬件级数据流:多路传感器同步、行级/帧级预处理、像素流/点云流处理、协议转换、时间戳、触发、过滤、压缩,以及把某些确定性任务绕开通用软件栈。
四、FPGA 的位置:不是最大大脑,而是神经接口
今天讲 FPGA,最容易误解的地方是把它和 GPU/NPU 放在同一个维度上比较:谁 TOPS 更高,谁能跑更大的模型,谁的算子库更多。这个比较有意义,但不能解释 FPGA 在 Physical AI 里的真实价值。
在机器人边缘计算栈里,GPU/NPU 更像“大脑”,负责模型推理;MCU/RTOS 更像“反射弧”,负责电机控制、安全状态机和低层实时任务;FPGA 更像“神经接口”,把外部世界的高速、不规则、多协议信号,整理成系统能稳定消费的数据流。
图 4|机器人边缘计算栈中,FPGA 更像神经接口:把真实世界的数据按确定时序接入系统,并承担硬件快路径。
所以 FPGA 的价值不是替代所有计算单元,而是让系统在真实世界里接得上、跑得稳、改得动。这三个词很朴素,但非常工程。
五、Physical AI 让 FPGA 变得更加重要的五个原因
图 5|Physical AI 让 FPGA 变得更加重要,根源来自五类工程约束:传感器、多协议、低时延、边缘功耗和架构不确定性。
- 传感器变多,数据先到硬件接口,不先到模型
机器人不会只靠一个摄像头理解世界。实际系统里会同时出现 RGB 摄像头、深度相机、ToF、LiDAR、毫米波雷达、IMU、编码器、力传感器、麦克风阵列甚至触觉传感器。
这些数据有不同采样率、不同协议、不同带宽、不同时间戳。模型再强,也要先吃到对齐过、清洗过、同步过的数据。FPGA 可以在入口处做同步、时间戳、滤波、裁剪、缓存和预处理,减少后端 AI SoC 的数据混乱。
- 机器人看最坏情况延迟,不只看平均 FPS
云端 AI 可以用平均吞吐讲性能,机器人不能。机器人要看的是:最坏情况下多久能发现障碍物?多久能触发刹车?机械臂发现异常后,多久能停下来?
FPGA 的硬件流水线天然适合确定性路径。它不像通用软件栈那样容易受到线程调度、缓存、系统负载和中断抖动影响。
- 工业现场永远有大量非标准接口
真实工程里,最麻烦的往往不是模型,而是接口:MIPI CSI-2、LVDS、SLVS-EC、GigE Vision、CAN、EtherCAT、TSN、PCIe、SPI、I2C、UART,以及各种厂商自定义协议。
FPGA 的长期价值之一就是做 bridge:把现场的不规则接口,转换成 AI SoC、CPU 或网络系统能够稳定消费的数据流。
- 边缘设备受功耗、体积和散热约束
机器人、无人机、工业边缘盒子和智能相机都不能无限堆 GPU。很多任务并不需要完整跑一遍大模型,而是需要在前端做裁剪、触发、编码、压缩、滤波、ROI 提取。
这些任务如果都扔给 CPU/GPU,会消耗后端推理预算;放到 FPGA 上做 streaming pipeline,反而能把 GPU/NPU 留给真正需要模型判断的部分。
- Physical AI 还没定型,硬件必须能改
这是我认为最关键的一点。现在的机器人软件栈、VLA 模型、传感器组合、控制接口都还在快速变化。这个阶段如果直接做 ASIC,风险很高;如果完全靠通用芯片,又可能扛不住时延和接口压力。
六、别把 FPGA 神化:它更重要,但不是万能
这里必须说清楚:FPGA 不是所有 Physical AI 问题的答案。它有开发门槛,有工具链复杂度,有时序收敛和验证成本,也不适合直接承载所有大模型推理。
我建议用一个很简单的判断法:如果一个 Physical AI 系统主要是标准摄像头 + 标准模型 + 没有严格实时约束,那么 CPU/GPU/NPU 可能就够了;但如果系统出现下面这些特征,FPGA 的价值会明显上升:
多路高速传感器需要同步和预处理;
存在复杂或非标准协议桥接;
要求确定性低时延,而不是只看平均吞吐;
需要在低功耗边缘设备里做硬件级数据流;
需要安全隔离、硬件触发、异常保护和快速降级;
产品还在迭代,接口和算法还没有稳定到可以直接 ASIC 化。
七、CPU、GPU/NPU、FPGA、MCU 到底怎么分工?
这张表背后的核心不是“谁更强”,而是谁负责哪段链路。Physical AI 是系统工程,真正的能力来自异构计算组合,而不是单颗芯片孤军奋战。
八、从产业角度看,FPGA 的叙事正在变化
过去很多人理解 FPGA,主要是三个场景:通信、工业控制、原型验证。今天 Physical AI 带来了新的叙事:FPGA 不只是 ASIC 前的过渡方案,也不只是传统接口胶水,而是边缘智能系统里的 adaptive fabric。
这个变化可以从四个方向观察:
-
工具链更靠近 AI 开发者。Altera 讲 FPGA AI Suite,AMD/Xilinx 讲 Vitis、Versal、adaptive SoC,背后都是降低 FPGA 进入 AI 系统的门槛。
-
边缘 AI SoC 更需要前端硬件适配层。AI SoC 越强,前端越需要把传感器数据整理成稳定、低时延、可消费的数据流。
-
机器人从 demo 进入产品,会暴露大量工程细节。演示视频里看不到的问题,量产时会变成传感器校准、总线抖动、时钟同步、异常保护和现场升级。
-
Physical AI 需要硬件可验证性。系统不是跑通一次就够了,而是要证明在边界条件、故障条件、长期运行条件下依然可靠。
图 6|RIO 项目展示的机器人 I/O 抽象很有启发:机器人系统不是单一模型,而是接口、传感器、机器人、策略和中间层共同组成的闭环。图源:RIO 项目页,2026。
九、AI4FPGA 真正该做的,不是只让 AI 写几行 RTL
前面几篇我一直强调:AI 写代码只是入口,工程闭环才是价值。放到 FPGA 这里也一样。AI4FPGA 不能只停留在“自动生成一段 Verilog/VHDL/HLS 代码”,而应该进入更完整的 FPGA 工程流程。
我认为 AI4FPGA 在 Physical AI 方向至少有五个值得做深的方向:
传感器数据流自动设计。根据相机、雷达、IMU 等输入规格,自动生成同步、缓存、时间戳、预处理和协议转换模块。
低时延 pipeline 搜索。在吞吐、延迟、资源、功耗之间做设计空间探索,而不是只生成功能正确的 RTL。
HLS/RTL 与验证联动。自动生成 TestBench、Assertion、覆盖率目标和边界场景,确保硬件数据通路可验证。
软硬件划分建议。判断哪些任务放 GPU/NPU,哪些放 FPGA,哪些放 MCU/RTOS,而不是所有东西一股脑塞进模型。
现场日志和波形驱动优化。把机器人运行中的失败轨迹、波形、统计数据反馈到下一轮硬件设计中。
这也是我认为这类内容对芯片工程师有价值的地方:不是看完一个新闻,而是建立一个判断框架:什么问题该用模型解决,什么问题该用硬件数据流解决,什么问题必须回到验证闭环。
十、团队现在应该补什么能力?
如果一个团队想抓住 Physical AI 带来的 FPGA 机会,我建议不要一上来就追最新模型,而是先补一套更扎实的系统能力。
-
补传感器和接口知识。理解 MIPI、LVDS、Ethernet、CAN、EtherCAT、PCIe、时间同步和数据格式。
-
补硬件数据流思维。不要只从软件函数看问题,要能从 pipeline、buffer、backpressure、clock domain crossing 看问题。
-
补实时系统和安全思维。理解最坏情况延迟、jitter、watchdog、降级路径、故障检测和安全状态机。
-
补 FPGA 验证能力。TestBench、Assertion、波形、覆盖率、形式验证,这些比“写出模块”更重要。
-
补软硬件协同能力。知道哪些东西该放在 CPU/GPU/NPU,哪些应该靠 FPGA,哪些必须交给 MCU/RTOS。
十一、我对未来 6-12 个月的几个观察点
接下来我会重点看这几个方向:
VLA/VLM 能不能真正从云端 demo 走向边缘部署。如果模型继续下沉,前端数据通路和低时延接口会更重要。
机器人 I/O 和中间件能不能标准化。接口抽象一旦稳定,FPGA/HLS/AI Agent 的自动生成空间会变大。
FPGA 工具链能不能降低门槛。如果 AI Suite、HLS、自动验证、自动时序分析继续进步,FPGA 会更容易进入 AI 团队。
Physical AI benchmark 会不会从“成功率”扩展到 latency、jitter、功耗、安全回退。一旦指标变细,硬件系统能力会被重新定价。
AI4EDA/AI4FPGA 能不能读懂真实工程证据。包括仿真日志、波形、时序报告、资源报告、板级调试日志,而不是只读代码。
到这里,结论其实很清楚:FPGA 变得更加重要,并不是因为行业回到了过去,而是因为 AI 正在进入更复杂的现实世界。真实世界有噪声、有时延、有传感器、有执行器、有安全边界,也有大量短期无法标准化的接口。
后面我会继续沿着 AI4FPGA、AI4EDA、AI4Chips 和 Physical AI 这条线往下拆:比如芯片 AI Agent 如何参与 FPGA pipeline 设计,AI 如何读懂时序报告和资源报告,以及 Physical AI 时代的芯片工程师应该如何建立新的能力栈。
参考来源
QNX, Inside the Robot: Architecture Benchmark Report, 2026-05-27:https://qnx.software/en/blog/2026/inside-the-robot
Intel Newsroom, Intel Core Ultra Series 3 for Edge AI and Robotics, 2026-05-20:https://newsroom.intel.com/artificial-intelligence/intel-core-ultra-series-3-for-edge-ai-robotics
NVIDIA, Physical AI Data Factory Blueprint, 2026:https://www.globenewswire.com/NewsRoom/AttachmentNg/b0b3b938-bae6-4f9e-b0c2-dd1fad672cce/en
Altera, FPGA AI Suite 产品资料:https://www.altera.com/products/development-tools/fpga-ai-suite
AMD, Announcing New AMD Versal Prime Series Gen 2 Devices, 2026-05-27:https://www.amd.com/en/blogs/2026/announcing-new-amd-versal-prime-series-gen-2-devices.html
AMD, Spartan UltraScale+: The FPGA You Can Count On, 2026-05-12:https://www.amd.com/en/blogs/2026/amd-spartan-ultrascaleplus-the-fpga-you-can-count-on.html
RIO: Flexible Real-Time Robot I/O for Cross-Embodiment Robot Learning, 2026:https://robot-i-o.github.io/
