두나무 머신러닝팀, BIRD-SQL 글로벌 리더보드 1위

출처: 블록미디어

두나무 머신러닝팀은 주식과 디지털 자산 시장에서 활용되는 AI 모델을 연구·개발하고 있다. 현재 AI 모델링 및 튜닝, 모델 평가 매트릭 설정 등 다양한 데이터를 발굴해 두나무의 여러 서비스에 활용 중이다.

텍스트-SQL 변환 모델은 사람의 언어를 데이터 관리 프로그래밍 언어인 SQL로 변환하는 AI 모델로, 생성형 AI의 등장 이후 관심받고 있는 연구 분야다. 두나무 머신러닝팀이 이번에 개발한 텍스트-SQL 모델은 사용자가 자연어로 질문을 입력하면 SQL 변환이 필요한 데이터를 빠르고 정확하게 추출, 챗GPT의 성능을 강화한다.

AI 모델 성능 측정 벤치마크인 BIRD-SQL(A Big Bench for Large-Scale Database Grounded Text-to-SQLs)의 글로벌 리더보드에서 정확도 점수 65.4%, 효율성 점수 71.3%를 각각 받으며 모두 1위에 올랐다. GPT-4의 정확도(54.8%)와 효율성(60.7%)을 각각 10% 이상 상회하는 수치다.

2위 모델과도 정확도 항목에서 4.7%, 효율성에서 3.6%의 높은 성능 격차를 기록했다. 처음 1위에 오른 1월 14일 이후 현재까지도 계속 선두를 지키고 있다.

이번 연구를 통해 증권플러스에서 제공하는 인공지능 대화형 서비스 ‘우디’의 자연어를 통한 종목 스크리닝 성능을 크게 향상할 수 있을 것으로 기대된다.

이동준 두나무 머신러닝팀장은 “챗GPT로 촉발된 생성형 AI 기술 개발이 활발해지면서 두나무는 더 정교하게 자연어를 이해하고 누구나 쉽게 기술을 활용할 수 있도록 연구하고 있다”라며 “명령어에 따라 성능이 크게 달라지는 거대언어모델(LLM)의 한계점을 개선하는 데 초점을 맞춰 두나무의 다양한 서비스 향상에 이바지하도록 노력하겠다”라고 말했다.

원문보러가기(클릭)

Latest articles

Related articles