Yapay Zeka Doğruluk Denetimi Modelleri, İddiaların Üçte İkisinde Fikir Ayrılığına Düşüyor, Lenz Research Bulgusu

Lenz Research tarafından yapılan yeni bir çalışma, yapay zeka modellerinin doğruluk denetimi iddialarının %67'sinde fikir ayrılığına düştüğünü ortaya koyarak otomatik doğrulama sistemlerinin güvenilirliğini sorguluyor. Önceden duyurulmadan yayımlanan bulgular, gelişmiş yapay zeka araçlarının bile gerçeği belirleme görevinde sık sık birbiriyle çeliştiğini gösteriyor. Araştırmanın arkasındaki ekip, özellikle finans piyasaları gibi hızlı hareket eden alanlarda karar alma süreçlerinde farklı kaynakların ve insan denetiminin gerekliliğini vurguluyor.

Fikir ayrılığının boyutu

%67'lik oran dikkat çekicidir. Bu, her üç doğruluk denetimi iddiasından ikisinin farklı yapay zeka modellerinde çelişkili sonuçlar verdiği anlamına geliyor. Lenz Research hangi modellerin test edildiğini veya iddiaların niteliğini belirtmedi, ancak çıkarım açık: Hiçbir yapay zeka sistemi tek başına gerçeği kurgudan ayırt etme konusunda güvenilir değildir. Anlaşmazlık oranı, modellerin nasıl eğitildiği, kullandıkları veriler ve temel mantıkları arasındaki temel farklılıklara işaret ediyor.

Dedikoduların saniyeler içinde fiyatları etkileyebildiği dalgalı piyasalarda riskler yüksektir. Bir yapay zeka doğruluk denetleyicisine güvenen bir yatırımcı, başka bir modelin reddedeceği bir etiket üzerinden harekete geçebilir. Çalışmanın yazarları, farklı kaynakların ve insan yargısının kritik olduğu bir bağlam olarak özellikle "dalgalı piyasalardan" bahsediyor. Otomatik araçlar büyük hacimleri işleyebilir, ancak sürece bir insan dahil olmadıkça kendi çelişkilerini çözemezler.

Çalışmanın önerileri

Lenz Research'in tavsiyesi nettir: Tek bir yapay zeka kaynağına güvenmeyin. Bunun yerine, çıktıları çapraz kontrol edin, insan denetçileri devreye sokun ve otomatik doğruluk denetimlerini birçok girdiden yalnızca biri olarak ele alın. Bu, teknolojiyi terk etme çağrısı değil, aşırı güvene karşı bir uyarıdır. Çalışma, anlaşmazlık sorununa bir çözüm sunmuyor, ancak insanların sürece dahil edilmesi gerektiğine dair güçlü bir argüman ortaya koyuyor.

Bulgular, yapay zekanın tüm hızına rağmen tutarlılık konusunda hâlâ zorlandığını gösteren büyüyen kanıt yığınına katkıda bulunuyor. Lenz Research, modellerin neden fikir ayrılığına düştüğüne veya bunların nasıl uyumlu hale getirileceğine dair daha derin bir analiz yapmayı planlayıp planlamadığını belirtmedi. Şimdilik mesaj basit: Makineler anlaşamadığında, karar insana aittir.

Fikir ayrılığının boyutu

Çalışmanın önerileri

İlgili Haberler