Az Anthropic visszavonta a Claude rejtett teljesítményvédelmi intézkedéseit a közösség felháborodása miatt, amely a 'Fable 5' incidenshez kapcsolódott. A vállalat ezentúl látható védőkorlátokat alkalmaz a rejtett teljesítménykorlátozások helyett. A kedden bejelentett változás megnöveli a hamis pozitív tartalomjelzések számát a platformon.
A Fable 5 kiváltja a felhasználók felháborodását
A múlt heti 'Fable 5' incidens során a Claude egyértelmű magyarázat nélkül korlátozta a válaszokat, ami frusztrálta a felhasználókat és a fejlesztőket. A közösség tagjai elárasztották a közösségi médiát és a fórumokat az átláthatóság hiánya miatti panaszokkal. Azzal érveltek, hogy a rejtett teljesítménykorlátok lehetetlenné tették annak megértését, hogy miért blokkoltak legitim lekérdezéseket. A visszhang akkor erősödött fel, amikor a felhasználók rájöttek, hogy nem tudják módosítani a beállításokat a korlátozások megkerülésére.
Láthatatlan falaktól a látható határokig
Korábban a Claude rejtett teljesítményvédelmi intézkedéseket használt, amelyek a felhasználók számára láthatatlanul működtek. Most az Anthropic látható védőkorlátokkal váltja fel ezeket, amelyek azonnal értesítik a felhasználókat, ha egy tartalom jelzést vált ki. A vállalat megerősítette, hogy a változtatás közvetlenül a közösség egyértelműség iránti igényére válaszol. A felhasználók konkrét okokat fognak látni arra, hogy miért lettek megjelölve az üzenetek, például 'érzékeny tartalom észlelve' vagy 'kontextuális határok túllépve', az általános hibák helyett.
Kompromisszum: Több hamis pozitív jelzés várható
Az Anthropic elismeri, hogy a látható védőkorlátok több hamis pozitív tartalomjelzést fognak eredményezni. Ez azt jelenti, hogy ártalmatlan üzenetek – például történelmi események vagy akadémiai témák megvitatása – gyakrabban blokkolódhatnak, mint a rejtett rendszer alatt. A vállalat kijelentette, hogy ez a növekedés az átláthatóság elkerülhetetlen következménye, bár nem számszerűsítette a várható emelkedést. A mérnökök a védőkorlátok pontosságát helyezik előtérbe, de figyelmeztették a felhasználókat, hogy az átmenet során gyakoribb megszakításokra számíthatnak.
Mit fognak tapasztalni a felhasználók
A látható védőkorlátok azonnal bevezetésre kerülnek az összes Claude felületen. A felhasználók mostantól egyértelmű felugró értesítéseket fognak látni, amelyek elmagyarázzák, hogy miért váltott ki jelzést a bevitelük, beleértve a konkrét irányelvi hivatkozásokat is. Míg egyesek üdvözölték az átláthatóságot, mások azonnal kisebb frusztrációkat jelentettek a legitim üzenetek megjelölésével kapcsolatban. A vállalat nem kötelezte el magát a hamis pozitív jelzések csökkentésére, de közölte, hogy felhasználói visszajelzéseket gyűjt a rendszer finomításához.
Az Anthropic mérnöki csapata figyelemmel kíséri a korai bevezetési adatokat, ahogy a felhasználók először találkoznak az új látható jelzésekkel.




