无论你是脑洞大开的创新者,还是善于钻研的开发者,高性能、易操作的开发工具总是必不可少。在这个过程中,以 Jetson 系列为代表的自主机器开发工具大大降低了自主开发创造的技术门槛。
近期,一位知乎极具影响力的 KOL 袁博融(HIT Robot Group DL 工程师,拥有 7,418 名粉丝)针对 Jetson “家族”产品进行了一系列的探索,本篇文章,我们将来看一下关于 NVIDIA Jetson Xavier NX 开发者套件的评测。
Jetson Xavier NX 开发者套件评测
Jetson Xavier NX 开发者套件和 Jetson Nano 体积大小相同,性能却提升了几十倍。
虽说今年初 Jetson Nano 开发者套件更新 B01 后,载板已经兼容 Jetson Xavier NX 模块,但这次开发者套件还是配套了新的载板。目前注意到有几个区别:
- 自带 wifi 模块,且安装位置移到载板反面,也就是说拆装 wifi 模块无需先取下核心模块
- 载板自带塑料底座,且集成了 wifi 天线。但只要卸掉 wifi 天线和 4 个固定螺丝,就可以取下载板。经测试可直接使用之前给 Jetson Nano 设计的外壳,但要防止影响散热
- 增加了一个 m.2 接口,也在反面,可以装 nvme 固态硬盘。毕竟 Xavier NX 的 PCIe 配置是 1×1+1×4 (Gen3)
- 增加了 CAN 接口,但没焊排针,如果需要请自行加上
- 供电口改为 19V,与 NVIDIA AGX Xavier 一致。给 Jetson Nano 准备的 5V 电源无法使用,不过 Jetson Xavier NX 开发者套件已经自带电源,无需太过担心
接下来我们详细研究了 Jetson Xavier NX 开发者套件的实际性能。从规格来看,Jetson Xavier NX 仿佛是在 AGX Xavier 基础上砍了一刀,就如同 Jetson Nano 是从 TX1 上切下来的。这一刀下去,功耗减半,体积缩小一圈,但性能仍保留了 AGX Xavier 的六七成功力。
对于 Xavier 系列,算力已不只是由 GPU 的 CUDA 核心提供,因此评估较为复杂。如果仅看 GPU 的 FP32 算力,有 845GFlops,处于比 TX2 强一些的水平。但是参考二者当前价格,即使只考虑 GPU 算力,也是Jetson Xavier NX 性价比较高。
得益于 Volta 架构,Jetson Xavier NX 有48个 Tensor 内核,提供了 6.8TFlops 的 FP16 算力。尽管 Volta 架构的 Tensor 内核不支持 INT8,但 Jetson Xavier NX 还有两个 DLA(Deep Learning Accelerator),提供 FP16 和 INT8 支持。这样总计就有 21TOPs 的 INT8 算力,这些只需要消耗 15W 功耗。如果切换到 10W 模式,也能提供 14TOPs 的算力。
这样可以有多种算力组合,要想把完全发挥性能,推荐大家使用 TensorRT。TensorRT 可以同时使用多种硬件资源,并能以混合精度来做推理。对于 IVA 类的任务,更可以通过 DeepStream 进一步优化。下面的 Demo 展示了在 Jetson Xavier NX 上同时运行 4 个任务。左上角是 4 路视频的行人检测,左下角是多人姿态估计,右上角是使用了 BERT 的语音对话机器人,右下角是 Gaze 目光追踪。而这一切都同时在一块树莓派大小的板子上运行。
这 4 个 Demo 展示出了 Jetson Xavier NX 在智慧视频分析和机器人应用上的潜力。Demo 中虽总共只有 6 路视频流,但 Jetson Xavier NX 实际能进行 16 路 H.264 编码的 1080P 视频流解码。如果使用 H.265 编码,甚至可以支持到 32 路。那么左上角的 Demo 就可以用来做人数统计,甚至在加入重识别后可以分析活动轨迹。而姿态估计的应用就更为广泛,可以用于手势识别,动作分析,开发体感应用。右侧两个技术则提供了构建对话机器人的良好范例。通过 Gaze 目光追踪,机器人可以知道用户是在跟自己说话,还是跟旁边的第三者。
NVIDIA 也在近期开源了 jetson_benchmarks 工具,用于比较多种 Jetson 硬件上的 AI 性能。下面是在 Jetson Xavier NX 的实测结果,供大家参考。这个结果比官方公布的略低,应该是散热上的问题。与 TX2 的测试结果相比,性能确实达到数倍甚至 10 倍以上。
从测试结果来看,Jetson Xavier NX 非常适合多路视频推理或多任务同时运行,而之前的 Jetson Nano 对此有压力。对于边缘计算应用,可以考虑用 Jetson Xavier NX 替代服务器。同时因为有了 CAN 口,对于机器人和工控应用也更为友好。考虑到其极低的功耗需求和极小的体积,应该很快就能看到其在机器人领域上的应用。
来源:NVIDIA英伟达中国
原创文章,作者:jinwe2020,如若转载,请注明出处:https://www.biaojianku.com/archives/38610.html