Firma Tether udostępniła medyczny model AI o nazwie QVAC MedPsy, który działa w całości na smartfonie i przewyższa większy model Google MedGemma-27B w rzeczywistych scenariuszach. Według firmy model zużywa trzy razy mniej zasobów obliczeniowych i jest 16 razy mniejszy od pokonanego odpowiednika Google.
Wydajność a rozmiar
Testy porównawcze pokazują, że QVAC MedPsy osiąga wyższe wyniki niż MedGemma-27B w zadaniach symulujących rzeczywiste zastosowania kliniczne. Podczas gdy model Google wymaga znacznego przetwarzania serwerowego, model Tether mieści się na urządzeniu mobilnym. Zysk wydajności wynika z kompaktowej architektury modelu – jest on 16 razy mniejszy pod względem liczby parametrów – a mimo to zapewnia lepsze rezultaty.
Ta różnica w rozmiarze bezpośrednio przekłada się na potrzeby obliczeniowe. QVAC MedPsy zużywa około jednej trzeciej mocy obliczeniowej MedGemma-27B, co umożliwia wnioskowanie na urządzeniu bez dostępu do internetu.
Dlaczego wydajność ma znaczenie dla medycznej AI
Uruchamianie AI na smartfonach otwiera możliwości zastosowań w odległych klinikach i środowiskach o ograniczonych zasobach, gdzie stabilne połączenie serwerowe nie jest gwarantowane. Model mieszczący się na urządzeniu może analizować dane pacjenta lokalnie, redukując opóźnienia i ryzyko naruszenia prywatności. Tether nie ujawnił konkretnych planów wdrożenia, ale wyniki modelu sugerują, że mógłby obsługiwać badania przesiewowe w zakresie psychiatrii lub psychologii – „Psy” w nazwie QVAC MedPsy prawdopodobnie odnosi się do psychologii lub psychiatrii.
Środowisko medyczne było dotąd ostrożne wobec AI opartej wyłącznie na chmurze ze względu na wrażliwość danych. Model działający na urządzeniu, który w dodatku przewyższa dużych konkurentów, może przyspieszyć adopcję w szpitalach i mobilnych aplikacjach zdrowotnych.
Technologia stojąca za modelem
Tether, znany przede wszystkim ze swojego stablecoina USDT, od pewnego czasu rozwija się w obszarze AI. QVAC MedPsy to jeden z jego pierwszych modeli medycznych. Firma nie opublikowała szczegółowej architektury sieci, ale zdolność modelu do działania na smartfonie przy jednoczesnym pokonaniu znacznie większego modelu wskazuje na agresywną optymalizację w zakresie trenowania lub kwantyzacji.
Google MedGemma-27B jest natomiast zaprojektowany do pracy w chmurze lub na wysokiej klasy sprzęcie. Podejście Tether odwraca to założenie, pokazując, że mniejszy model może być silniejszy w zadaniach specyficznych dla danej dziedziny.
Nie ogłoszono jeszcze daty premiery ani partnerstwa. Na razie wyniki testów stanowią dowód, że medyczna AI nie zawsze potrzebuje dużego sprzętu, aby osiągać wielkie rezultaty.




