NVIDIARTX显卡AI推理提速5倍！RTXPC轻松在本地搞定大模型

首页 > AI资讯 > 行业动态 > NVIDIARTX显卡AI推理提速5倍！RTXPC轻松在本地搞定大模型

NVIDIARTX显卡AI推理提速5倍！RTXPC轻松在本地搞定大模型

新火种 2023-11-17

11月16日消息，正在举行的微软Iginte全球技术大会上，微软发布一系列AI相关的全新优化模型、开发工具资源，帮助开发者更深入地释放硬件性能，拓展AI场景。

尤是对于当下在AI领域占据绝对主导地位的NVIDIA来说，微软这次送上了一份大礼包，无论是面向OpenAI Chat API的TensorRT-LLM封装接口，还是RTX驱动的性能改进DirectML for Llama 2，以及其他热门大语言模型(LLM)，都可以在NVIDIA硬件上获得更好的加速和应用。

NVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型

其中，TensorRT-LLM是一款用于加速LLM推理的库，可大大提升AI推理性能，还在不断更以支持越来越多的语言模型，而且它还是开源的。

就在10月份，NVIDIA也发布了面向Windows平台的TensorRT-LLM，在配备RTX 30/40系列GPU显卡的台式机、笔记本上，只要显存不少于8GB，就可以更轻松地完成要求严苛的AI工作负载。

现在，Tensor RT-LLM for Windows可以通过全新的封装接口，与 OpenAI 广受欢迎的聊天 API 兼容，因此可以在本地直接运行各种相关应用，而不需要连接云端，有利于在 PC 上保留私人和专有数据，防范隐私泄露。

只要是针对TensorRT-LLM优化过的大语言模型，都可以与这一封装接口配合使用，包括Llama 2、Mistral、NV LLM，等等。

对于开发者来说，无需繁琐的代码重写和移植，只需修改一两行代码，就可以让AI应用在本地快速执行。

NVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型 ↑↑↑基于TensorRT-LLM的微软Visual Studio代码插件——Continue.dev编码助手

本月底还会有TensorRT-LLM v0.6.0版本更新，将会在RTX GPU上带来最多达5倍的推理性能提升，并支持更多热门的 LLM，包括全新的70亿参数Mistral、80亿参数Nemotron-3，让台式机和笔记本也能随时、快速、准确地本地运行LLM。

根据实测数据，RTX 4060显卡搭配TenroRT-LLM，推理性能可以跑到每秒319 tokens，相比其他后端的每秒61 tokens提速足足4.2倍。

RTX 4090则可以从每秒tokens加速到每秒829 tokens，提升幅度达2.8倍。

NVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型

基于强大的硬件性能、丰富的开发生态、广阔的应用场景，NVIDIA RTX正成为本地端侧AI不可或缺的得力助手，而越来越丰富的优化、模型和资源，也在加速AI功能、应用在上亿台RTX PC上的普及。

目前已经有400多个合作伙伴发布了支持RTX GPU加速的AI应用、游戏，而随着模型易用性的不断提高，相信会有越来越多的AIGC功能出现在Windows PC平台上。

NVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型

Tags:

显卡模型

免责声明: 本文所包含的观点仅代表作者个人看法，不代表新火种的观点。在新火种上获取的所有信息均不应被视为投资建议。新火种对本文可能提及或链接的任何项目不表示认可。交易和投资涉及高风险，读者在采取与本文内容相关的任何行动之前，请务必进行充分的尽职调查。最终的决策应该基于您自己的独立判断。新火种不对因依赖本文观点而产生的任何金钱损失负任何责任。

NVIDIARTX显卡AI推理提速5倍！RTXPC轻松在本地搞定大模型

TeleAI完成首个全国产化万卡万参大模型训练，并正式开源TeleChat2-115B

又创新高，阿里通义开源模型Qwen2.5进入大模型盲测全球前十

用Cursor打造大模型竞技场：最会整活的居然是它

智谱宣布：国庆期间官方模型API调用最低1折

智谱AI宣布最低1折开放所有模型

热门文章

本科学历但创造出GPT，奥特曼盛赞为“爱因斯坦级”天才，OpenAI总裁：他想要的，我们都给

港股异动丨金山云飙升44%创历史新高，小米据报已投入开发AI大模型

加速大模型应用落地，腾讯混元训练营启动合作伙伴招募

华为快充自动充电机器人曝光：尊界S800将率先支持

科大讯飞新提交“大模型”、“星辰大模型”等2件商标注册申请

豆包定价一元的野心：字节跳动打响AI突围战

海内外15位博士，每人10万，字节跳动的奖学金越来越「香」了

对标英特尔AMD！英伟达将于今年Q4推出旗下首款AIPC芯片

谷歌AI真的“无敌”了吗？苹果和三星有话要说