엔비디아, 새로운 오픈소스 AI 모델이 벤치마크에서 GPT-4o를 능가하다

출처: 토큰포스트

엔비디아(Nvidia)가 10월 15일, 최신 인공지능(AI) 모델을 조용히 출시했다. 이 모델은 GPT-4o와 Claude-3 같은 최첨단 AI 시스템보다 성능이 뛰어나다고 알려졌다.

18일(현지시간) 코인텔레그래프에 따르면, 이 새로운 모델은 ‘Llama-3.1-Nemotron-70B-Instruct’로 불리며, lmarena.AI의 Chatbot Arena에서 ‘최고 모델’로 평가받고 있다. 이 모델은 메타(Meta)의 Llama-3.1-70B-Instruct 모델을 기반으로 한 개조 버전이다. ‘Nemotron’이라는 이름은 엔비디아의 기여를 나타내며, 엔비디아는 Meta의 오픈소스 모델을 더욱 발전시켜 성능을 향상시켰다.

엔비디아는 특별히 선별된 데이터 세트와 고급 튜닝 방법, 자사의 최첨단 AI 하드웨어를 사용해 Meta의 원본 모델을 보다 ‘도움이 되는’ AI 시스템으로 발전시켰다. 이는 OpenAI의 ChatGPT나 Anthropic의 Claude-3보다도 높은 성능을 자랑하는 AI 모델이 될 가능성이 크다.

AI 모델 성능을 평가하는 벤치마킹에서는 여러 AI 모델에게 동일한 질문이나 문제를 제시하고 결과의 유용성을 비교한다. Nemotron의 경우, 엔비디아는 이 모델이 GPT-4o와 Claude-3 같은 기존 최첨단 모델보다 넓은 범위에서 더 나은 성능을 보였다고 주장하고 있다.

Nemotron이 AI 평가 리더보드 상단에 표시되지 않았지만, 엔비디아의 주장이 사실이라면 이 모델은 그 테스트에서 85점을 기록하며 사실상 최고의 성능을 입증했다고 볼 수 있다.

원문보러가기(클릭)

엔비디아, 새로운 오픈소스 AI 모델이 벤치마크에서 GPT-4o를 능가하다

솔라나(SOL), 기술적 반등 신호에 ETF·기업 수요까지 호재 겹쳐

이더리움, TVL 1위에도 위기감…bApp이 생태계 구원할까?

파이 네트워크, 불명확한 로드맵 논란 속 4% 반등

이더리움, 프로토콜 중심서 제품 중심으로 전환 가속