NVIDIA telah memperkenalkan satu set kemahiran agen baharu yang dibina berdasarkan platform Cosmos 3, yang direka untuk mempercepatkan pembangunan dalam kenderaan autonomi, robotik, dan AI penglihatan. Syarikat itu menyatakan bahawa kemahiran ini memberikan keupayaan pra-dibina kepada pembangun yang membolehkan ejen AI menangani tugas-tugas khusus dalam persekitaran dunia sebenar yang kompleks.
Apa yang Ditawarkan oleh Kemahiran Agen
Kemahiran agen merangkumi fungsi utama yang diperlukan untuk sistem autonomi – persepsi, navigasi, manipulasi objek, dan pemahaman situasi. Alih-alih membina keupayaan tersebut dari sifar, pembangun boleh menggunakan kemahiran yang telah sedia ada. NVIDIA menyatakan bahawa pendekatan ini mengurangkan masa yang diperlukan untuk melatih dan melaksanakan model AI untuk kereta, robot, dan kamera.
Kemahiran ini disesuaikan untuk tiga bidang utama. Untuk kenderaan autonomi, ia membantu dalam pengesanan lorong, penjejakan pejalan kaki, dan pembuatan keputusan di persimpangan. Bagi robotik, fokusnya adalah pada memegang objek, bergerak melalui gudang, dan menanggapi arahan manusia. Untuk AI penglihatan, kemahiran ini meningkatkan pengenalan objek dan pengesanan anormali dalam suapan video.
Cosmos 3 sebagai Asas
Di bawahnya, Cosmos 3 menyediakan tulang belakang simulasi dan latihan. Platform ini mengendalikan kepelbagaian senario dunia sebenar – pencahayaan, cuaca, dan medan yang berbeza – supaya kemahiran agen boleh diuji dan diperhalusi tanpa prototaip fizikal. NVIDIA menerangkan Cosmos 3 sebagai persekitaran kembar digital di mana berjuta-juta jam memandu atau berjalan boleh disimulasikan dalam beberapa hari.
Kerana Cosmos 3 terus belajar daripada data yang dijana, kemahiran agen dikemas kini dari semasa ke semasa. Ini bermakna robot yang menggunakan kemahiran ini mungkin meningkatkan pegangannya pada objek yang licin tanpa perubahan kod manual. Perkara yang sama berlaku untuk kereta tanpa pemandu yang menghadapi zon pembinaan jenis baru.
Bagi syarikat yang membangunkan kereta tanpa pemandu, alat baharu ini boleh memudahkan proses yang terkenal rumit. Mengajar kenderaan mengenali bas sekolah yang berhenti atau pejalan kaki dalam hujan sering memerlukan berbulan-bulan pengumpulan dan pelabelan data. Kemahiran agen NVIDIA telah dilatih terlebih dahulu untuk kes-kes tepi seperti ini, membolehkan pembangun bermula dari tahap asas yang lebih tinggi.
Kemahiran ini juga bertujuan mengurangkan keperluan untuk retrofit perkakasan yang mahal. Ia berjalan di atas cip automotif sedia ada NVIDIA dan boleh disesuaikan dengan pelbagai susunan sensor. Ini memberikan fleksibiliti kepada pengeluar kereta tanpa perlu menunggu reka bentuk semula platform sepenuhnya.
Aplikasi Robotik dan AI Penglihatan
Di sebelah robotik, kemahiran agen menargetkan robot industri dan perkhidmatan. Sebagai contoh, robot gudang boleh menggunakan kemahiran navigasi untuk melalui lorong sementara kemahiran manipulasi mengendalikan item dengan pelbagai bentuk dan saiz. NVIDIA menyatakan bahawa kemahiran ini berfungsi dengan sistem pengendalian robotik yang biasa, jadi pengintegrasian adalah mudah.
Bagi AI penglihatan, kemahiran ini membantu dalam kamera keselamatan, pengimejan perubatan, dan pemeriksaan pengeluaran. Kemahiran pengenalan objek boleh menandakan kecacatan pada garis pengeluaran atau mengenal pasti penceroboh di kawasan terlarang. Kerana ia berjalan di atas platform Cosmos 3 yang sama, kemahiran ini terus meningkat seiring dengan aliran data video yang lebih banyak.
Pengenalan ini menandakan usaha terkini NVIDIA untuk memperluas ekosistem AI-nya di luar pusat data ke dunia fizikal. Kemahiran agen kini menjadi sebahagian daripada alat pembangun syarikat tersebut. Pembangun boleh mengaksesnya melalui portal pembangun NVIDIA, dan syarikat itu merancang untuk mempamerkan kes penggunaan pada acara industri akan datang.



