Anyscale, LLM 파인튜닝을 위한 자동화된 사후 훈련 도구 출시

Anyscale은 대형 언어 모델의 사후 훈련 단계를 간소화하기 위해 방법론 선택, GPU 계획 수립, 구성 생성 등의 작업을 자동화하는 새로운 도구를 출시했습니다. 이 회사는 실제 환경에서 LLM을 배포하는 데 있어 복잡하고 자원 소모가 큰 부분을 단순화하려 한다고 밝혔습니다.

도구가 자동화하는 기능

이 도구는 전체 파인튜닝, LoRA, QLoRA와 같은 접근 방식을 수동으로 선택하고 적절한 GPU 설정 및 하이퍼파라미터를 결정해야 하는 파인튜닝 과정에 집중합니다. Anyscale의 시스템은 이러한 결정을 대신하여 모델과 사용자의 하드웨어 제약 조건에 맞는 구성을 생성합니다. 회사는 이를 통해 시도착오 시간을 줄이고 잘못 구성된 실행의 위험을 낮출 수 있다고 주장합니다.

사후 훈련이 중요한 이유

조직들이 LLM 실험에서 실제 배포로 전환함에 따라 파인튜닝은 병목 현상이 되었습니다. 상용 모델은 특정 도메인이나 작업을 위해 조정이 필요하지만, 이 과정은 전문 지식을 요구하며 종종 GPU 사이클의 낭비로 이어집니다. Anyscale의 도구는 사후 훈련을 일련의 수동 단계가 아닌 자동화된 파이프라인으로 처리함으로써 이를 해결합니다.

내장된 GPU 계획 수립

이 도구의 주요 기능은 GPU 사용 계획 수립 능력입니다. 주어진 모델과 파인튜닝 방법에 필요한 메모리와 컴퓨팅 자원을 예측한 후 적절한 수와 유형의 GPU를 제안합니다. 이를 통해 팀은 과도한 자원 할당이나 작업 중 메모리 부족을 방지할 수 있습니다. Anyscale은 이 도구를 기계 학습 엔지니어 전문 팀 없이도 모델을 파인튜닝해야 하는 팀을 위한 실용적인 솔루션으로 제시하고 있습니다.

출시 현황

이 도구는 현재 Anyscale 플랫폼의 일부로 제공되며, 사용자는 회사 인프라에서 테스트할 수 있습니다. 도구가 매우 큰 모델이나 특수한 하드웨어 설정을 어떻게 처리할지에 대해서는 아직 불분명하며, Anyscale은 수동 파인튜닝 워크플로우와의 벤치마크 비교를 아직 공개하지 않았습니다. 회사는 사용자 피드백을 바탕으로 도구를 지속적으로 업데이트할 계획이라고 밝혔습니다.

도구가 자동화하는 기능

사후 훈련이 중요한 이유

내장된 GPU 계획 수립

출시 현황

Related Articles