英伟达发布新一代自动驾驶芯片Orin 深度学习推理引擎TensorRT 7

2019-12-18 16:14

机器人：发布全新Isaac SDK

今年3月的GTC会议上，英伟达就着重强调了机器人业务。今天，黄仁勋在现场发布了全新版本Isaac软件开发套件（SDK），为机器人提供更新的AI感知和仿真功能。

Isaac SDK包括Isaac Robotics Engine（提供应用程序框架），Isaac GEM（预先构建的深度神经网络模型、算法、库、驱动程序和API），用于室内物流的参考应用程序以及训练机器人Isaac Sim的第一个版本（提供导航功能）。

为了加快AI机器人的开发速度，全新Isaac SDK包括各种基于摄像头的感知深度神经网络，包括：

对象检测——识别用于导航、交互或操控的对象；

自由空间分割——检测和分割外部世界，例如确定人行道在哪里，以及机器人可以在哪里行驶；

3D姿态估计——了解目标的位置和方向，从而实现诸如机械臂拾取物体的任务；

2D人体姿态估计——将姿态估计应用于人，这对于与人互动的机器人（例如配送机器人）和协作机器人（专门设计用于与人合作）非常重要。

以新推出Isaac Sim机器人为例，它可以将所生成的软件部署到在现实世界中运行的真实机器人中。通过仿真，开发人员可以在极端情况下（即困难或异常情况下）对机器人进行测试，以进一步加强对它的训练。这有望大大加快机器人的开发速度，从而实现综合数据的训练。

另外，Isaac SDK还支持多机器人仿真。这使开发人员可以将多个机器人放入仿真环境中进行测试，以便它们学会彼此相关的工作。

发布TensorRT 7，减少会话AI推理延迟

英伟达在去年的GTC China上发布了支持自动低精度推理的TensorRT 5，今天英伟达发布了TensorRT 7，内置新型深度学习编译器，支持各种类型的RNN、CNN和Transformer，相较于TRT 5只支持30种变换，TRT 7可以支持1000多种不同的计算变换和优化。

TRT 7可为开发者设计的大量RNN配置自动生成代码，逐点融合LSTM单元，甚至可跨多个时间步长进行融合，并且尽可能做自动低精度推理。

借助TRT 7，全球各地的开发者都可以实现会话式AI应用，大幅减少推理延迟。举个例子，通常情况下，一套端到端的自然语言理解流程可能由几十种模型构成，比如RNN、CNN、自编码器等等，TRT 7可对所有模型进行编译，使其在英伟达GPU上运行。基于英伟达T4的推理会话AI只需要0.3秒，而CPU的推理延迟却高达3秒。

GPU加CUDA，从火星着陆到基因测序，无所不能

如今，英伟达已经售出了15亿块GPU，在使用的每块GPU都兼容CUDA。英伟达的CUDA平台具有丰富的库、工具和应用程序。仅在去年，英伟达发布了500多个SDK和库，通过优化软件栈，英伟达提高了GPU的性能，让深度学习训练在三年内提高了4倍，深度学习推理在一年内提高了2倍。

HPC应用方面，NASA在英伟达GPU上通过FUN3D软件运行火星着陆情景模拟，产生高达150TB的数据，英伟达借助DGX-2上运行的Magnum IO GPU Direct Storage技术，可“实时”对这些数据进行可视化处理。