Anyscale은 대형 언어 모델의 사후 훈련 단계를 간소화하기 위해 방법론 선택, GPU 계획 수립, 구성 생성 등의 작업을 자동화하는 새로운 도구를 출시했습니다. 이 회사는 실제 환경에서 LLM을 배포하는 데 있어 복잡하고 자원 소모가 큰 부분을 단순화하려 한다고 밝혔습니다.
도구가 자동화하는 기능
이 도구는 전체 파인튜닝, LoRA, QLoRA와 같은 접근 방식을 수동으로 선택하고 적절한 GPU 설정 및 하이퍼파라미터를 결정해야 하는 파인튜닝 과정에 집중합니다. Anyscale의 시스템은 이러한 결정을 대신하여 모델과 사용자의 하드웨어 제약 조건에 맞는 구성을 생성합니다. 회사는 이를 통해 시도착오 시간을 줄이고 잘못 구성된 실행의 위험을 낮출 수 있다고 주장합니다.
사후 훈련이 중요한 이유
조직들이 LLM 실험에서 실제 배포로 전환함에 따라 파인튜닝은 병목 현상이 되었습니다. 상용 모델은 특정 도메인이나 작업을 위해 조정이 필요하지만, 이 과정은 전문 지식을 요구하며 종종 GPU 사이클의 낭비로 이어집니다. Anyscale의 도구는 사후 훈련을 일련의 수동 단계가 아닌 자동화된 파이프라인으로 처리함으로써 이를 해결합니다.
내장된 GPU 계획 수립
이 도구의 주요 기능은 GPU 사용 계획 수립 능력입니다. 주어진 모델과 파인튜닝 방법에 필요한 메모리와 컴퓨팅 자원을 예측한 후 적절한 수와 유형의 GPU를 제안합니다. 이를 통해 팀은 과도한 자원 할당이나 작업 중 메모리 부족을 방지할 수 있습니다. Anyscale은 이 도구를 기계 학습 엔지니어 전문 팀 없이도 모델을 파인튜닝해야 하는 팀을 위한 실용적인 솔루션으로 제시하고 있습니다.
출시 현황
이 도구는 현재 Anyscale 플랫폼의 일부로 제공되며, 사용자는 회사 인프라에서 테스트할 수 있습니다. 도구가 매우 큰 모델이나 특수한 하드웨어 설정을 어떻게 처리할지에 대해서는 아직 불분명하며, Anyscale은 수동 파인튜닝 워크플로우와의 벤치마크 비교를 아직 공개하지 않았습니다. 회사는 사용자 피드백을 바탕으로 도구를 지속적으로 업데이트할 계획이라고 밝혔습니다.




