구글, 소형 언어모델 AI ‘젬마’ 개방… “라마2 보다 낫다”

End-Puff Banner

출처: 블록미디어

‘제미나이’와 같은 기술로 구축한 초경량 오픈 모델
“모든 조직서 책임감 있는 상업적 사용·배포 가능”
“타 오픈 모델과 비교했을 때 최고 수준의 성능”

젬마는 구글의 최신 거대 언어모델(LLM) ‘제미나이’와 동일한 연구 기술로 구축된 초경량의 오픈 모델 제품군이다. 라틴어로 ‘보석’을 뜻하는 젬마는 구글 딥마인드를 비롯한 구글 내 여러 팀에서 개발했다.

구글은 21일(미국 현지시간) “젬마는 개발자나 기업 규모에 관계없이 모든 조직에서 책임감 있는 상업적 사용 및 배포가 가능하다”며 “이용자는 젬마 모델을 각자의 데이터셋에 맞게 미세조정하는 변형까지 추가로 만들 수 있다”고 밝혔다.

젬마는 모델 크기에 따라 ‘젬마 2B(20억개 매개변수)’와 ‘젬마 7B(70억개 매개변수)’로 출시된다. 구글은 “최첨단 AI 모델인 제미나이와 기술 및 인프라 기반을 함께 공유하는 만큼, 젬마 또한 타 오픈 모델과 비교했을 때 최고 수준의 성능을 보여주고 있다”고 전했다.

구글이 공개한 ‘젬마 기술 보고서’에 따르면 ‘젬마 7B’은 구글 자체 벤치마크 결과에서 평균 64.3점을 기록하며, 메타의 오픈소스 LLM ‘라마-2’를 압도했다. 지난해 7월 메타가 공개한 ‘라마-2’의 매개변수 70억개 모델은 45.3점, 130억개 모델은 54.8점을 기록했다.

구글은 “엔비디아와 협력해 엔비디아 GPU(그래픽처리장치)에 맞게 젬마 모델을 최적화해 업계 최고의 성능과 최첨단 기술을 포함한 통합 기능을 보장한다”고 설명했다.

이용자는 노트북, 데스크톱 컴퓨터, 모바일 또는 구글 클라우드 버텍스 AI, 구글 쿠버네티스 엔진(GKE) 등 다양한 환경에서 ‘젬마’를 실행할 수 있다. 또한 오픈 모델인 만큼 외부 개발자 툴에서도 손쉽게 이용 가능하다. 허깅페이스, 맥스텍스트, 엔비디아 네모와 같은 인기 도구와 더불어 코랩과 캐글에서도 이용할 수 있다.

구글은 자사 AI 원칙을 최우선으로 두고 젬마를 설계했다고 설명했다. 구글은 “자동화된 기법으로 안전성과 신뢰성을 높였으며, 광범위한 미세조정과 RLHF(인간 피드백을 통한 강화 학습) 기법 등으로 책임감 있는 모델을 만들었다”며 “구글은 모두가 보다 안전한 AI 애플리케이션 개발을 할수 있도록 ‘책임감 있는 생성형 AI 툴킷’ 지침 도구도 함께 제공한다”고 전했다.

한편 구글은 기존 ‘구글 워크스페이스를 위한 듀엣 AI’ 명칭을 ‘구글 워크스페이스용 제미나이’로 변경했다고 밝혔다. 구글 클라우드의 모든 데이터 정보 보호, 기밀 유지 및 보안 정책을 준수한다. 구글은 “대화를 광고 목적이나 생성형 머신러닝 기술을 개선하는 데 사용하지 않는다. 타인이 대화 내용을 확인할 수도 없다”고 전했다.

◎공감언론 뉴시스 odong85@newsis.com

원문보러가기(클릭)

Latest articles

Related articles