Hermes đã bắt đầu phát hành các tác tử AI tự tiến hóa được thiết kế để chạy cục bộ trên các PC hỗ trợ NVIDIA RTX và hệ thống DGX Spark của công ty. Phần mềm này sử dụng các mô hình Qwen 3.6 để mang lại hiệu suất mà Hermes gọi là vượt trội mà không cần gửi dữ liệu lên đám mây.
Tác tử làm gì
Các tác tử không tĩnh. Chúng được xây dựng để thích ứng theo thời gian, học hỏi từ tương tác của người dùng và điều chỉnh hành vi mà không cần cập nhật thủ công. Điều đó có nghĩa là khách hàng chạy một tác tử trên máy RTX 4090 có thể thấy tác tử trở nên nhanh hơn hoặc chính xác hơn trong một tác vụ sau vài tuần sử dụng — tất cả đều được xử lý trên chính thiết bị.
Hermes không nêu chi tiết mọi trường hợp sử dụng, nhưng công ty cho biết các tác tử có thể xử lý các quy trình phức tạp thường yêu cầu kết nối máy chủ. Các mô hình Qwen 3.6 là động cơ: chúng được tối ưu hóa cho suy luận cục bộ, giúp giảm độ trễ và giữ dữ liệu nhạy cảm khỏi các mạng bên ngoài.
Tại sao cục bộ lại quan trọng
Chạy AI hoàn toàn trên máy cục bộ loại bỏ nhu cầu về kết nối internet. Đó là điều quan trọng đối với những người làm việc với dữ liệu riêng tư — hồ sơ tài chính, tập tin y tế hoặc mã nguồn độc quyền. Nó cũng có nghĩa là không có phí đăng ký cho điện toán đám mây, mặc dù người dùng vẫn phải trả tiền cho phần cứng ban đầu.
Dòng RTX của NVIDIA đã bao gồm các nhân Tensor cho khối lượng công việc AI. DGX Spark, một máy trạm để bàn nhỏ gọn, nhắm đến các nhà phát triển cần sức mạnh cục bộ nghiêm túc. Bằng cách kết hợp các tác tử của Hermes với những máy đó, công ty đang đặt cược vào một tương lai nơi các trợ lý AI sống trên bàn làm việc của bạn, chứ không phải trong trung tâm dữ liệu.
Kết nối Qwen 3.6
Qwen 3.6 là một bộ mô hình ngôn ngữ lớn từ nhóm Qwen của Alibaba. Hermes không cho biết liệu các mô hình có được tinh chỉnh hay sử dụng nguyên bản hay không. Nhưng tuyên bố về “hiệu suất cục bộ vượt trội” gợi ý một số tùy chỉnh. Các mô hình này nổi tiếng với điểm chuẩn mạnh về các tác vụ suy luận và lập trình, điều này có thể giải thích cho sự lựa chọn.
Cạnh tranh trong không gian AI trên thiết bị đang nóng lên. Apple chạy các mô hình của riêng mình trên Mac và iPhone. Microsoft có PC Copilot+. Cách tiếp cận của Hermes khác biệt ở chỗ làm cho các tác tử tự cải thiện — một tính năng, nếu hoạt động như quảng cáo, có thể giữ cho phần mềm phù hợp lâu hơn so với một ứng dụng tĩnh thông thường.
Điều gì vẫn chưa rõ
Hermes chưa công bố giá cho các tác tử hoặc danh sách các GPU RTX tương thích. Công ty cũng chưa cho biết liệu các tác tử có hoạt động trên phần cứng không phải của NVIDIA hay không. Hiện tại, sản phẩm này gắn liền với hệ sinh thái của NVIDIA. Các nhà phát triển và người dùng sớm có thể dùng thử các tác tử qua trang web của Hermes, nhưng việc phát hành rộng rãi chưa được công bố.



