AiToolGo的标志

NVIDIA Blackwell GeForce RTX 50 系列:全新 AI SDK 和工具发布

深入讨论
技术性
 0
 0
 1
NVIDIA 宣布推出其全新的 GeForce RTX 50 系列 GPU 及配套的 AI SDK,面向开发者。文章详细介绍了包括 CUDA、TensorRT 和 PyTorch 在内的增强型 AI 框架,并重点介绍了优化 AI 驱动应用程序性能的新功能,尤其是在游戏和内容创作领域。
  • 主要观点
  • 独特见解
  • 实际应用
  • 关键主题
  • 核心洞察
  • 学习成果
  • 主要观点

    • 1
      全面涵盖面向开发者的全新 SDK 和工具
    • 2
      详细的技术规格和性能增强
    • 3
      专注于游戏和内容创作的实际应用
  • 独特见解

    • 1
      DLSS 4 的推出及其对帧率和图像质量的影响
    • 2
      集成 NVIDIA ACE 以创建逼真的数字角色
  • 实际应用

    • 本文为希望利用最新的 NVIDIA 技术来增强其应用程序中 AI 性能的开发者提供了可操作的见解。
  • 关键主题

    • 1
      NVIDIA GeForce RTX 50 系列
    • 2
      AI SDK 和工具
    • 3
      性能优化技术
  • 核心洞察

    • 1
      深入分析 NVIDIA 全新 Blackwell 架构
    • 2
      AI 应用的详细性能指标
    • 3
      DLSS 4 和 NVIDIA ACE 等创新功能
  • 学习成果

    • 1
      了解 GeForce RTX 50 系列 GPU 的新功能
    • 2
      能够将最新的 NVIDIA SDK 集成到应用程序中
    • 3
      掌握 AI 应用的性能优化技术知识
示例
教程
代码示例
可视化内容
基础知识
高级内容
实用技巧
最佳实践

引言

NVIDIA 近日发布了其下一代 PC GPU——GeForce RTX 50 系列,以及一套专为开发者设计的新型 AI SDK 和工具。GeForce RTX 50 系列搭载 NVIDIA Blackwell 架构、第五代 Tensor Cores 和第四代 RT Cores,在 AI 驱动的渲染技术方面实现了重大飞跃,包括神经着色器、数字人技术、几何和光照。本文将深入探讨赋能开发者充分发挥 NVIDIA Blackwell GeForce RTX 50 系列 GPU 潜力的全新及更新的 SDK。

改进的 AI 框架:CUDA、TensorRT 和 PyTorch

为确保与 GeForce RTX 50 系列的无缝兼容,NVIDIA 建议开发者更新至其 AI 框架的最新版本。CUDA Toolkit 12.8 和 NVIDIA TensorRT 10.8 现已发布,并针对 RTX 50 系列 GPU 上的 AI 性能进行了优化。支持 NVIDIA Blackwell RTX GPU 的 PyTorch 原生 Windows 版本已上传至 PyTorch GitHub 仓库,Windows 版的 PiPy 二进制文件和软件包即将推出。Linux x86_64 版的 PyTorch for NVIDIA Blackwell RTX GPU 可通过 nightly builds 访问。有关更新应用程序的详细说明,请参阅 NVIDIA Blackwell RTX GPU:CUDA 12.8、PyTorch、TensorRT 和 Llama.cpp 指南的软件迁移指南。

GeForce RTX 50 系列驱动的 AI 游戏

GeForce RTX 50 系列 GPU 结合最新的 SDK 更新,使开发者能够创造革命性的游戏体验。NVIDIA DLSS(深度学习超级采样)是一套神经渲染技术,利用 AI 提升 FPS、降低延迟并增强图像质量。DLSS 4 由 GeForce RTX 50 系列 GPU 和第五代 Tensor Cores 提供支持,引入了 DLSS 多帧生成技术,能够生成多达三帧额外帧,并与全套 DLSS 技术协同工作,与传统的暴力渲染相比,帧率最高可提升 8 倍。此外,DLSS 光线重建、DLSS 超分辨率和 DLAA 技术现已由 Transformer 模型驱动,可提高所有 GeForce RTX GPU 的图像和光照细节及稳定性。

用于神经渲染的 NVIDIA DLSS

NVIDIA DLSS 是一套神经渲染技术,利用 AI 提升 FPS、降低延迟并增强图像质量。DLSS 4 由 GeForce RTX 50 系列 GPU 和第五代 Tensor Cores 提供支持,引入了 DLSS 多帧生成技术,能够生成多达三帧额外帧,并与全套 DLSS 技术协同工作,与传统的暴力渲染相比,帧率最高可提升 8 倍。此外,DLSS 光线重建、DLSS 超分辨率和 DLAA 技术现已由 Transformer 模型驱动,可提高所有 GeForce RTX GPU 的图像和光照细节及稳定性。

用于逼真游戏角色的 NVIDIA ACE

NVIDIA ACE(Avatar Cloud Engine)是一套数字人技术,利用生成式 AI 使游戏角色和数字助手栩栩如生。ACE 现在允许您轻松地为游戏或应用程序中的数字人添加代理功能。它包括:支持更长上下文和复杂推理任务的、用于高级和自主代理工作流的新型多模态 SLM 的早期访问。Audio2Face 3D NIM 使用实时音频提供高级唇形同步和面部动画。

加速内容创作

支持 Blackwell RTX GPU 内容创作的新 SDK 和更新包括以下内容。

用于增强视频会议的 NVIDIA Maxine

NVIDIA Maxine 是一系列高性能、易于使用的 NVIDIA NIM 微服务和 SDK,用于部署 AI 功能,以增强视频会议和远程呈现的音频、视频和增强现实效果。新功能包括:Studio Voice 可以让任何麦克风听起来都像专业麦克风。“虚拟键光”可以重塑面部以使用虚拟键光的效果(即将推出)。

用于逼真图像生成的 NVIDIA Iray

NVIDIA Iray SDK 是一种直观的、基于物理的渲染技术,可为交互式和批量渲染工作流生成照片级图像。更新包括:使用新的 NVIDIA MDL SDK 1.10 改进了漫射和高光 BRDF。改进了几何体的镶嵌和置换。准确可靠地渲染焦散。一种自动启用和禁用焦散采样的新模式,可提高渲染质量或性能。支持更快的集群或网络渲染。

用于硬件加速视频处理的 NVIDIA Video Codec SDK

NVIDIA Video Codec SDK 是一套用于在 Windows 和 Linux 上执行硬件加速视频编码和解码的 API。更新包括:支持 4:2:2 H.264、HEVC 编码和解码,以利用 Blackwell 的第九代 NVENC 编码。引入 MV-HEVC 和 UHQ AV1 以提高编码质量。与上一代相比,解码器内存占用减少 2 倍,每个 NVDEC 的 H.264 解码吞吐量增加 2 倍。这些更新即将通过 FFMPEG、Microsoft DXVA 和 MFT 框架推出。

开始使用 NVIDIA Blackwell RTX GPU

准备好在遍布全球的超过一亿台 RTX PC 上试验、开发和优化新的 AI 功能了吗?立即开始在 NVIDIA RTX PC 上使用 AI。有关在您的 AI 应用程序中添加对 NVIDIA Blackwell RTX GPU 的支持以获得更高性能的更多信息,请参阅 NVIDIA Blackwell RTX GPU:CUDA 12.8、PyTorch、TensorRT 和 Llama.cpp 指南的软件迁移指南。

 原始链接:https://developer.nvidia.com/zh-cn/blog/new-ai-sdks-and-tools-released-for-nvidia-blackwell-geforce-rtx-50-series-gpus/

评论(0)

user's avatar

      相关工具