Hermes已开始出货自进化AI智能体,这些智能体设计用于在NVIDIA RTX驱动的PC及该公司的DGX Spark系统上本地运行。该软件利用Qwen 3.6模型,据Hermes称,可在不将数据发送至云端的情况下提供无与伦比的性能。
智能体的功能
这些智能体并非静态不变。它们被设计为随时间适应,从用户交互中学习并调整自身行为,无需手动更新。这意味着,在RTX 4090机器上运行该智能体的用户可能会在几周使用后看到智能体在任务中变得更快或更准确——这一切都在设备本地完成。
Hermes并未详述所有用例,但该公司表示,这些智能体可以处理通常需要服务器连接的复杂工作流程。Qwen 3.6模型是引擎:它们针对本地推理进行了优化,从而降低了延迟,并使敏感数据远离外部网络。
本地化的重要性
完全在本地机器上运行AI消除了对互联网连接的需求。这对于处理私人数据(如财务记录、医疗文件或专有代码)的用户来说意义重大。这也意味着无需为云计算支付订阅费用,尽管用户仍需预先支付硬件成本。
NVIDIA的RTX系列已包含用于AI工作负载的Tensor Core。DGX Spark是一款紧凑型桌面工作站,面向需要强大本地算力的开发者。通过将Hermes的智能体与这些机器配对,该公司押注于一个AI助手驻留在桌面而非数据中心的未来。
Qwen 3.6的关联
Qwen 3.6是阿里巴巴Qwen团队的一套大型语言模型。Hermes并未说明这些模型是经过微调还是直接使用。但“无与伦比的本地性能”这一说法暗示了某种定制。这些模型以在推理和编码任务上的强劲基准测试表现而闻名,这可能解释了选择它们的原因。
设备端AI领域的竞争正在升温。Apple在其Mac和iPhone上运行自有模型。Microsoft拥有Copilot+ PC。Hermes的方法不同之处在于使智能体具备自我改进能力——如果这一功能如宣传所言,那么该软件相比典型的静态应用将能保持更长的时效性。
尚不明确之处
Hermes尚未公布智能体的定价或兼容RTX GPU的列表。该公司也未说明智能体是否能在非NVIDIA硬件上运行。目前,该产品仅限NVIDIA生态系统。开发者和早期用户可通过Hermes网站试用智能体,但更广泛的可用性尚未公布。




