Anthropic đã cập nhật các mô hình Claude 4.6 và Opus 4.7, bổ sung các gợi ý mở rộng và sửa lỗi độ chính xác dành riêng cho nhiệm vụ sử dụng trình duyệt và máy tính. Những thay đổi này tập trung vào cách AI xử lý các thao tác như nhấp chuột, cuộn trang và điền biểu mẫu, nhằm giảm thiểu lỗi có thể làm gián đoạn quy trình tự động hóa.
Những thay đổi từ bản cập nhật
Các phiên bản mới bao gồm những điều chỉnh trong logic suy diễn cốt lõi của Claude thay vì những thay đổi kiến trúc lớn. Các gợi ý mở rộng giúp mô hình đánh giá tốt hơn khi nào nên phân tách hướng dẫn rộng thành các bước nhỏ hơn, trong khi các sửa lỗi độ chính xác giải quyết những sai sót phổ biến khi diễn giải tọa độ trang web hoặc nhãn nút. Anthropic cho biết các cải tiến này giúp mô hình trở nên đáng tin cậy hơn cho các nhiệm vụ lặp lại như nhập dữ liệu, gửi biểu mẫu và điều hướng web nhiều bước.
Tại sao khả năng sử dụng trình duyệt và máy tính lại quan trọng
Khả năng tương tác của Claude với giao diện đồ họa — không chỉ văn bản — đang là trọng tâm phát triển của Anthropic. Các doanh nghiệp và nhà phát triển sử dụng mô hình cho tự động hóa quy trình robot (RPA), kịch bản hỗ trợ khách hàng và kiểm thử phần mềm. Lỗi trong các bối cảnh này có thể lan truyền nhanh chóng: một nút bấm nhầm hoặc menu thả xuống được phân tích sai có thể làm hỏng toàn bộ chuỗi thao tác. Công ty đã liên tục cải tiến các khả năng này kể từ khi giới thiệu tính năng sử dụng máy tính vào cuối năm 2024.
Đối tượng được cập nhật
Các phiên bản 4.6 và Opus 4.7 có sẵn cho người dùng API và qua bảng điều khiển của Anthropic. Opus 4.7 là phiên bản mạnh mẽ hơn, hướng đến các nhiệm vụ phức tạp và quan trọng; 4.6 được định vị là lựa chọn nhanh và nhẹ hơn. Cả hai mô hình đều được tích hợp sẵn các gợi ý mở rộng và sửa lỗi độ chính xác mới theo mặc định, theo ghi chú phát hành của công ty.
Những thay đổi này xuất hiện khi các đối thủ như OpenAI và Google cũng đang phát triển các tính năng tương tự theo phong cách tác tử. Hiện tại, Anthropic tập trung vào việc cải thiện độ tin cậy từng bước thay vì các tính năng mới bắt mắt. Các nhà phát triển dựa vào Claude để điều khiển quy trình làm việc trên trình duyệt sẽ nhận được bản cập nhật tự động — không cần cấu hình lại lời nhắc hoặc huấn luyện lại mô hình. Các sửa lỗi đã có hiệu lực trong môi trường sản xuất.



