NVIDIA công bố các phương pháp mới để tùy chỉnh tác nhân AI tự trị

NVIDIA đã công bố một bộ kỹ thuật nhằm giúp các nhà phát triển điều chỉnh các tác nhân AI tự trị cho các tác vụ cụ thể, công ty cho biết. Cách tiếp cận này kết hợp kỹ thuật prompt với học tăng cường nâng cao, mang đến một con đường linh hoạt hơn để xây dựng các hệ thống chuyên biệt mà không cần bắt đầu từ đầu.

Những phương pháp mới bao gồm những gì

Các kỹ thuật tập trung vào hai lĩnh vực cốt lõi. Kỹ thuật prompt cho phép nhà phát triển hướng dẫn hành vi của tác nhân bằng cách điều chỉnh các lời nhắc đầu vào mà nó nhận được, một phương pháp có thể điều chỉnh phản hồi mà không cần huấn luyện lại mô hình. Phần thứ hai là học tăng cường nâng cao, cho phép tác nhân cải thiện thông qua thử và sai trong các môi trường mô phỏng.

NVIDIA cho biết các phương pháp này được thiết kế để hoạt động với các nền tảng AI hiện có của công ty, mặc dù công ty không nêu tên các sản phẩm cụ thể hoặc công bố lịch trình cho việc phổ biến rộng rãi hơn. Mục tiêu là cung cấp cho các kỹ sư nhiều quyền kiểm soát hơn đối với cách các tác nhân tự trị học và đưa ra quyết định, vượt ra khỏi các mô hình một kích cỡ phù hợp cho tất cả.

Tại sao tùy chỉnh lại quan trọng

Các tác nhân AI tự trị xử lý các tác vụ như điều hướng, sắp xếp dữ liệu hoặc tương tác với khách hàng. Nhưng các phiên bản có sẵn thường gặp khó khăn với các trường hợp sử dụng chuyên biệt. Bằng cách kết hợp kỹ thuật prompt với học tăng cường, các nhà phát triển có thể điều chỉnh hành vi của tác nhân cho một nhà máy, một kho hàng hoặc một môi trường y tế mà không cần xây dựng lại toàn bộ hệ thống.

Riêng kỹ thuật prompt có những giới hạn của nó, vì nó dựa vào các hướng dẫn tĩnh. Thêm học tăng cường giới thiệu khả năng thích ứng động — tác nhân học từ hành động của chính nó và điều chỉnh theo thời gian. Sự kết hợp đó có thể cắt giảm thời gian phát triển và giảm nhu cầu về các bộ dữ liệu được gắn nhãn khổng lồ.

NVIDIA chưa công bố tài liệu chi tiết hoặc mã mẫu cho các phương pháp này. Các nhà phát triển quan tâm đến việc thử nghiệm sẽ cần theo dõi các bản cập nhật từ bộ phận nghiên cứu của công ty. Các kỹ thuật này dường như nhắm vào các trường hợp sử dụng robot và mô phỏng, nhưng công ty chưa xác nhận ngành nào sẽ áp dụng các công cụ này trước tiên.

Hiện tại, thông báo này báo hiệu một nỗ lực nhằm làm cho AI tự trị trở nên dễ tiếp cận hơn với các kỹ sư không phải là chuyên gia học máy. Liệu các phương pháp này có đáp ứng được lời hứa đó hay không sẽ phụ thuộc vào mức độ dễ dàng tích hợp chúng vào các quy trình làm việc hiện có — và NVIDIA sẽ cung cấp các công cụ để thử nghiệm chúng sớm như thế nào.

Những phương pháp mới bao gồm những gì

Tại sao tùy chỉnh lại quan trọng

Related Articles