Firma Anyscale udostępniła nowe narzędzie zaprojektowane w celu usprawnienia fazy potreningowej dla dużych modeli językowych, automatyzując takie zadania jak wybór metodyki, planowanie wykorzystania GPU i generowanie konfiguracji. Firma twierdzi, że narzędzie ma uprościć to, co stało się złożoną i zasobożerną częścią wdrażania modeli LLM w środowisku produkcyjnym.
Co automatyzuje narzędzie
Narzędzie koncentruje się na procesie dostrajania, który zazwyczaj wymaga od inżynierów ręcznego wyboru między podejściami takimi jak pełne dostrajanie, LoRA czy QLoRA, a następnie określenia odpowiedniej konfiguracji GPU i hiperparametrów. System Anyscale przejmuje te decyzje, generując konfigurację dopasowaną do modelu i ograniczeń sprzętowych użytkownika. Firma twierdzi, że może to skrócić czas poświęcony na metodę prób i błędów oraz zmniejszyć ryzyko błędnych konfiguracji.
Dlaczego faza potreningowa jest teraz ważna
W miarę jak organizacje przechodzą od eksperymentowania z modelami LLM do ich faktycznego wdrażania, dostrajanie stało się wąskim gardłem. Gotowe modele często wymagają dostosowania do konkretnych dziedzin lub zadań, ale proces ten wymaga specjalistycznej wiedzy i często prowadzi do marnowania cykli GPU. Narzędzie Anyscale rozwiązuje ten problem, traktując fazę potreningową jako zautomatyzowany potok, a nie serię ręcznych kroków.
Planowanie GPU wbudowane w narzędzie
Kluczową częścią narzędzia jest możliwość planowania wykorzystania GPU. Szacuje ono wymaganą pamięć i moc obliczeniową dla danego modelu i metody dostrajania, a następnie sugeruje odpowiednią liczbę i typ GPU. Może to pomóc zespołom uniknąć nadmiernego provisionowania lub braku pamięci w trakcie zadania. Anyscale pozycjonuje to jako praktyczne rozwiązanie dla zespołów, które potrzebują dostrajać modele bez angażowania całego zespołu inżynierów ML.
Dostępność wydania
Narzędzie jest już dostępne jako część platformy Anyscale. Użytkownicy mogą je przetestować na infrastrukturze firmy. Nie jest jasne, jak narzędzie poradzi sobie z bardzo dużymi modelami lub nietypowymi konfiguracjami sprzętowymi, a Anyscale nie opublikowało jeszcze porównawczych benchmarków względem ręcznych procesów dostrajania. Firma zapowiada, że będzie aktualizować narzędzie na podstawie opinii użytkowników.




