当前位置:与“NVIDIA”相关的标签
NVIDIA开源GPU动态资源分配驱动,集成Kubernetes生态,改写了GPU在K8s中的调度、隔离和复用逻辑。针对传统整卡分配模式导致的资源浪费、显存和算力绑定及设备插件限制等问题,该驱动实现了GPU资源的动态分配和复用,提升了资源利用率,解决了GPU在K8s中的三大痛点。
NVIDIA 宣布 Gemma 4 在 RTX 显卡和 Jetson 平台上的推理性能显著提升,RTX 4090 延迟降至 10ms 内、吞吐量增加五倍,Jetson AGX Xavier 达到 30 tokens/s、是之前的 three 倍。这一突破使手机级 SoC、嵌入式板卡及车载控制器等边缘设备也能运行复杂 L...
NVIDIA在“国家机器人周”期间发布物理AI新进展,聚焦机器人学习、高保真仿真和具身智能基础模型。通过整合强化学习和模仿学习,NVIDIA使模型在仿真中学到的动作策略可直接应用于真实机械臂,大幅缩短实机训练周期30%-50%,部分任务从数月压缩至数周。这些技术已在农业采摘、工厂装配、能源巡检等场景验证,显著提升机器人...
NVIDIA推出的开源模型和框架正引领机器人开发领域的变革,将仿真、机器人学习和嵌入式计算结合,加速从云端到机器人的工作流程。其仿真平台提供逼真虚拟环境,使开发者能快速迭代算法,降低风险和成本。同时,机器人学习框架利用深度学习技术,使机器人能自主决策和执行任务。这些工具显著提高了开发效率,为机器人开发带来高效解决方案。
NVIDIA与电信巨头共建AI网格,旨在优化分布式网络推理效率。随着AI应用普及,电信网络成为分布式部署新前沿。AI网格通过分布式计算资源,减少数据传输延迟,提升实时处理能力,特别适用于自动驾驶和智能城市管理。同时,其分布式架构增强系统可靠性与可扩展性,推动AI在电信领域的应用。
NVIDIA GTC 2026大会上,CEO黄仁勋的主题演讲聚焦AI未来,强调其颠覆性潜力。他展示了NVIDIA在加速计算和深度学习方面的最新突破,提升计算效率并推动AI应用普及。大会还宣布了NVIDIA与多家企业合作,推动AI在医疗、制造、自动驾驶等领域的应用,并展示了AI在实时数据分析、图像识别等方面的强大能力。
MiniMax M2.7 今日正式开源,与华为昇腾等国内外芯片厂商及推理平台合作,首日完成模型接入与推理适配,推动 AI 生态发展。M2.7 是首个 AI 深度参与迭代的模型,能自我进化构建复杂 Agent Harness,完成高复杂生产力任务,在软件工程、办公场景表现优异,成为 Hermes Agent 等智能体工具...