<이미지출저 : 네이버 하이퍼클로버 X 화면>
네이버, '국대 AI' 1차 탈락...중국 알리바바 기술 베껴 '독자성' 인정 못 받아
하이퍼클로바X, 알리바바 '큐웬' 비전 인코더·가중치 그대로 차용...코사인 유사도 99.51%
박예현 기자
|
2026.01.17
국내 AI 대표주자로 꼽혔던 네이버가 정부의 '독자 AI 파운데이션 모델' 프로젝트 1차 평가에서 탈락하는 이변이 발생했다. 성능 평가에서는 상위권에 들었지만, 중국 알리바바의 AI 모델 '큐웬(Qwen)'의 핵심 기술을 그대로 가져다 쓴 것이 문제가 됐다. 정부는 "가중치를 그대로 갖다 쓴 것은 독자 AI로 인정할 수 없다"며 탈락 사유를 밝혔다.
핵심 포인트
- 네이버클라우드·NC AI, 독자 AI 프로젝트 1차 평가 동반 탈락
- 네이버 '하이퍼클로바X', 알리바바 '큐웬' 비전 인코더 그대로 차용
- 코사인 유사도 99.51%·피어슨 상관계수 98.98%로 사실상 동일
- LG AI연구원·SKT·업스테이지 3개 팀만 2차 진출
"가중치 그대로 갖다 써"...성능 우수해도 '독자성' 탈락
과학기술정보통신부는 15일 '독자 AI 파운데이션 모델' 프로젝트 1차 단계평가 결과를 발표했다. 5개 정예팀 중 네이버클라우드와 NC AI가 탈락하고, LG AI연구원·SK텔레콤·업스테이지 3개 컨소시엄이 2차 단계에 진출했다. 당초 1개 팀만 탈락할 예정이었으나 2개 팀이 동반 탈락하는 이변이 벌어졌다.
두 팀의 탈락 사유는 달랐다. NC AI는 벤치마크·전문가·사용자 평가에서 종합 점수 미달로 탈락했다. 반면 네이버클라우드는 성능 평가에서 상위 4개 팀에 포함될 정도로 우수한 점수를 받았지만, '독자성 기준 부적합' 판정을 받았다.
"오픈소스 모델을 썼다 하더라도 스스로 확보한 데이터로 가중치를 채워나간 것이 검증됐어야 하는데, 가중치를 그대로 갖다 쓴 부분에 대해 기술적 측면에서 문제가 지적됐다."
— 류제명, 과학기술정보통신부 2차관
유사도 99.51%..."사실상 복사 수준"
문제가 된 것은 네이버클라우드가 제출한 '하이퍼클로바X 시드 32B 싱크' 모델이다. 이 모델은 중국 알리바바의 오픈소스 모델 '큐웬(Qwen) 2.5'의 비전 인코더와 가중치를 활용한 것으로 드러났다. 비전 인코더는 이미지·영상 같은 시각 정보를 AI 모델이 이해할 수 있는 형태로 변환하는 핵심 부품이다.
하이퍼클로바X vs 큐웬 2.5 유사도 분석
99.51%
코사인 유사도
98.98%
피어슨 상관계수
※ 피어슨 상관계수는 실제 데이터값 분포의 일치 정도를 측정하는 지표로, 98% 이상은 사실상 동일한 수준
업계 분석에 따르면 비전 인코더뿐 아니라 오디오 인코더도 파인튜닝(미세조정) 과정 없이 그대로 사용한 것으로 나타났다. 인코더는 수천만 개 이상의 파라미터로 구성된 트랜스포머 기반 신경망 블록으로, AI 모델의 핵심 구성요소 중 하나다.
네이버 "전략적 선택"...정부 "독자 AI 조건 부합 안 돼"
네이버클라우드는 알리바바 기술을 사용한 사실을 인정하면서도 "전략적 선택"이었다고 해명했다. 네이버 측은 "파운데이션 모델의 핵심인 '뇌' 부분은 100% 자체 기술로 개발했다"며 "비전 인코더는 글로벌 기술 생태계와의 호환성 및 전체 시스템의 효율적 최적화를 고려해 검증된 외부 인코더를 전략적으로 채택했다"고 설명했다.
"AI 기술 개발은 이미 검증된 글로벌 빅테크라는 '거인의 어깨' 위에서 우리만의 고유한 가치를 한 스푼 더해 발전해 나가는 과정이다."
— 네이버클라우드 관계자
그러나 정부의 판단은 달랐다. 과기정통부는 기술적·정책적·윤리적 3가지 관점에서 독자성을 평가한 결과, 네이버클라우드 모델이 기준을 충족하지 못한다고 결론지었다. 특히 "완전한 우리 기술로 AI 모델을 개발하거나 라이선스 제약 없는 오픈소스를 활용해 스스로 개발·고도화할 수 있어야 하며, 오픈소스 활용으로 인한 외부의 통제·간섭으로부터 자유로울 수 있어야 한다"고 강조했다.
| 관점 |
정부 기준 |
| 기술적 |
아키텍처 설계부터 데이터 확보·가공, 독자적 학습 알고리즘 적용 등 전 과정 자체 수행 |
| 정책적 |
외부 통제·간섭으로부터 자유로운 자주권 및 통제권 확보 |
| 윤리적 |
라이선스 정책 준수, 레퍼런스 고지 등 투명성 확보 |
LG AI연구원 전 부문 1위...글로벌 톱10 유일한 한국 AI
이번 평가에서 LG AI연구원의 'K-엑사원'이 벤치마크·전문가·사용자 평가 전 부문에서 최고점을 기록하며 압도적 1위를 차지했다. 13개 주요 벤치마크 평균 점수에서 72.03점을 기록해 알리바바 큐웬3 235B(69.37점) 대비 104%, 오픈AI GPT-OSS 120B(69.79점) 대비 103% 성능을 달성했다.
| 기업 |
벤치마크(40) |
전문가(35) |
사용자(25) |
결과 |
| LG AI연구원 |
33.6 |
31.6 |
25.0 |
2차 진출 |
| SK텔레콤 |
- |
- |
- |
2차 진출 |
| 업스테이지 |
- |
- |
- |
2차 진출 |
| 네이버클라우드 |
상위 4위 |
- |
- |
독자성 탈락 |
| NC AI |
최저점 |
- |
- |
성능 탈락 |
특히 K-엑사원은 글로벌 AI 성능 평가 기관 '아티피셜 어낼리시스'의 인텔리전스 지수에서 오픈 웨이트 모델 기준 세계 7위, 국내 1위에 올랐다. 현재 글로벌 오픈 웨이트 모델 톱10은 중국 6개, 미국 3개 모델로 구성돼 있으며, K-엑사원이 유일하게 한국 AI로 이름을 올렸다.
네이버·NC "재도전 없다"...카카오도 불참 선언
정부는 탈락 기업에게도 기회를 주기 위해 상반기 중 1개 정예팀을 추가 선정해 4개 팀 경쟁 체제를 구축할 계획이다. 그러나 네이버클라우드와 NC AI 모두 재도전 의사가 없다고 밝혔다. 카카오도 15일 "재도전을 고려하지 않기로 했다"고 선언했다.
독자 AI 프로젝트 향후 일정
2026년 상반기
1개 정예팀 추가 선정 → 4개 팀 경쟁 체제 구축
2026년 6월
2차 평가 → 3개 팀 선발
2026년 12월
최종 평가 → 2개 팀 선정, 'K-AI 기업' 명칭 부여
업계에서는 재차 탈락할 경우 감수해야 할 브랜드 이미지 훼손 리스크가 부담으로 작용한 것으로 분석한다. 반면 KT와 카카오가 추가 공모에 참여할 가능성도 거론된다. KT는 이미 11.5B와 2.3B 등 다양한 규모의 소버린(주권형) AI 모델을 갖추고 있어 유력 후보로 꼽힌다.
전문가 "중국산 의존 시 국가기밀 유출 우려"
이번 논란은 단순한 기술 선택을 넘어 국가 AI 전략에서 '독자성'의 기준을 어디까지로 볼 것인지에 대한 본질적 질문을 던지고 있다. 한 KAIST 교수는 "다른 모델의 가중치를 가져왔다는 점 자체가 논란의 핵심"이라며 "네이버 모델이 큐웬 대비 성능을 압도적으로 뛰어넘는다면 독자 기술로 볼 여지가 있지만, 유사도가 이 정도라면 차용 논란에서 자유롭기 어렵다"고 지적했다.
외산 AI 의존 시 우려되는 문제점
- 기술 주권 상실 및 외부 통제·간섭 가능성
- 국가기밀·민감 데이터 유출 위험
- 라이선스 종속으로 인한 비용·정책 리스크
- 안보·경제적 측면의 글로벌 AI 의존도 심화
과기정통부는 "이번 프로젝트는 한국이 글로벌 AI 경쟁에서 독자적 기술로 당당히 맞서기 위한 역사적 도전"이라며 "정부는 독자 AI 파운데이션 모델을 반드시 확보해 지속 가능하고 건강한 AI 생태계를 구축하겠다"고 강조했다. 국내 AI 기술 생태계에서 '독자성'과 '성능' 사이의 균형이 중요한 화두로 떠올랐다.
"프롬 스크래치는 가중치를 제로나 랜덤 상태에서 시작하는 것이 전제다. LLM만 자체 개발했다고 해서 문제가 없다는 주장은 설득력이 떨어진다."
— 업계 고위 관계자
박예현 기자
ⓒ 2025 깨알소식. All rights reserved.