Loading market data...

Të metat e sigurisë në Claude AI të Anthropic zbulojnë çështje të thella besimi

Të metat e sigurisë në Claude AI të Anthropic zbulojnë çështje të thella besimi

Dobësitë e zbuluara

Detajet e të metave specifike nuk janë bërë publike. Ajo që dihet është se studiuesit u fokusuan në mënyrën se si Claude trajton të dhënat sensitive dhe merr vendime. Puna e tyre tregon për dobësi që mund të dëmtojnë besueshmërinë e modelit në aplikime kritike.

Gjetjet janë të rëndësishme sepse Claude tregtohet si një asistent i sigurt dhe i dobishëm. Nëse arkitektura e tij ka probleme themelore besimi, kjo mund të ndikojë në gjithçka, nga chatbot-et e shërbimit ndaj klientit deri te detyrat