애플이 오픈소스 AI 모델인 ‘오픈ELM’을 허깅페이스에 24일 공개했다.
오픈ELM은 ‘오픈소스 효율 언어모델(Open-source Efficient Language Models)’이라는 뜻으로, 사전 학습 및 명령어 튜닝 여부에 따라 8개로 나누어져 있다. 파라미터 수는 각각 2억 7,000만 개, 4억 5,000만 개, 11억 개, 30억 개로 분류돼있다. 경량화된 모델인 오픈 ELM은 특히 이메일 초안 생성같은 텍스트 관련 작업을 수행하기 적합할 모델이라고 업계는 평가하고 있다.
애플은 오픈ELM 관련 공식 논문을 통해 “모델 가중치와 추론 코드만 제공하고 비공개 데이터 세트에 대한 사전 학습만 제공하던 이전 사례와 달리, 오픈ELM은 학습 로그, 다중 체크포인트, 사전 학습 구성을 포함해 공개 데이터 세트에서 언어 모델을 학습하고 평가하기 위한 전체 프레임워크가 포함되어 있다”라며 “애플 기기에서 추론 및 미세 조정을 위해 모델을 MLX 라이브러리로 변환하는 코드도 함께 제공된다. 이를 통해 오픈 리서치 커뮤니티에 힘을 실어주고 향후 오픈 리서치를 위한 기반을 마련하고자 한다”라고 밝혔다.
애플은 깃허브, 위키피디아, 레딧, 아카이브(ArXiv) 등의 데이터을 활용해 오픈ELM을 학습시켰다고 밝혔다. 오픈ELM 라이선스는 ‘애플 샘플 코드 라이선스’하에 배포됐다. 해당 라이선스에 따르면, 상업적 용도로 오픈ELM을 사용하거나 수정할 수 있으나 향후 재배포 과정에서는 라이선스에서 제시한 문구와 면책 조항을 함께 명시해야 한다. 또한 모델 결과가 유해하거나 편향된 결과를 생성할 수 있다며 결과에 대한 안정성을 애플이 보장하지 않는다고 설명했다.
IT 언론사 벤처비트는 24일 보도를 통해 “경쟁사인 구글, 삼성, 마이크로소프트와 마찬가지로 오픈ELM 공개는 애플이 온디바이스 AI 애플리케이션에 투자하고 있다는 것을 시사한다”라고 분석했다. 실제로 애플은 논문을 통해 오픈ELM을 맥북 프로와 우분투 기반 워크스테이션 같은 사용자 기기에서 테스트했다고 밝혔다.
벤처비트는 또한 “비밀주의로 악명 높고 폐쇄성이 강한 애플이 오픈소스 AI 모델을 공개하는 것은 놀라운 행보”라고 평가했다.
jihyun_lee@idg.co.kr