일론 머스크 '그록' 야심작 등장에 "사용자들 "제미나이 > 그록 > GPT > 클로드"

<이미지 : 독자들의 이해를 돕기 위한 AI생성>
■ 핵심 포인트
- AI 4대 천왕 제미나이·클로드·GPT·그록 춘추전국시대 돌입
- 구글 제미나이 2.5 무료 개방...코딩·데이터 분석 강점
- 클로드 4.5, 한국어 친화적·맥락 이해 최고 평가
- GPT, 월 6억 사용자 유지하지만 경쟁사에 기술력 밀려
- 일론 머스크 그록 3, 이미지 생성 'Think Mode'로 차별화
- 유료 구독자 평가 "제미나이 1위...클로드 코딩 강자 추락"
생성형 AI 시장이 '춘추전국시대'로 접어들었다. 구글의 제미나이, 앤트로픽의 클로드, 오픈AI의 챗GPT, 일론 머스크의 그록이 각축전을 벌이는 가운데, 한때 절대 강자였던 챗GPT의 왕좌가 흔들리고 있다. 특히 유료 구독자들 사이에서 "제미나이가 1황"이라는 평가가 나오며 판도가 급변하고 있다.
제미나이 2.5 무료 개방..."코딩·분석 최강자 등극"
구글이 최근 발표한 '제미나이 2.5 프로 익스페리멘탈'이 AI 시장의 판도를 바꾸고 있다. 제미나이는 강력한 추론 성능을 기반으로 웹 앱과 코드 에이전트 구축에서 뛰어난 능력을 보이며, 일반 코딩, 수학 및 과학 벤치마크에서 최고 점수를 기록했다.
무엇보다 제미나이 2.5를 무료로 개방한 것이 큰 파장을 일으켰다. 기존 유료 플랜인 '제미나이 어드밴스드' 사용자 대상으로만 제공되던 서비스가 일반에게 풀리면서 접근성이 대폭 높아졌다. 제미나이의 웹 트래픽은 3월 기준 하루 평균 1090만 방문을 기록해 전월 대비 7.4% 증가했다.
유료 구독자들의 평가는 더욱 압도적이다. 한 사용자는 "전부 유료 구독하는 입장에서 현재 시점 제미나이 > 그록 > GPT > 클로드"라며 "클로드는 한때 코딩 강자였는데 요즘은 제미나이, 그록에 밀린다"고 평가했다. 특히 웹소설 작가들 사이에서는 "제미나이가 1황"이라는 말까지 나오고 있다.
클로드 4.5, "맥락 이해 최고...한국어 친화적"
앤트로픽의 클로드 4.5 소넷이 "말귀를 가장 잘 알아듣는 AI"로 평가받으며 선전하고 있다. IT 실무자 225명을 대상으로 한 설문조사에서 클로드는 "요청한 내용을 잘 이해한다"(4.6점), "맥락을 기억하고 일관성 있는 결과를 만든다"(4.4점)는 평가를 받으며 최고점을 기록했다.
특히 한국어 친화성이 뛰어나다는 평가다. 앤트로픽이 실시한 자체 테스트에서 클로드 4는 영어가 아닌 언어로 대화하기 테스트에서 두각을 나타냈으며, 많은 사용자들이 "챗GPT보다 클로드가 조금 더 한국어 친화적"이라고 평가한다.
클로드의 웹 트래픽은 3월 기준 하루 330만 방문을 기록했다. 다만 일반 사용자 시장에서는 상대적으로 낮은 인지도로 고전하고 있다. 앤트로픽은 직원 약 500명으로 3000명이 넘는 오픈AI나 대기업 구글에 비해 인력이 부족해 B2B 중심 전략을 펼치고 있다.
GPT-4.5 출시했지만..."코딩·학술 벤치마크 뒤처져"
한때 AI 시장의 절대 강자였던 오픈AI의 챗GPT가 경쟁사들의 맹추격에 고전하고 있다. 챗GPT는 여전히 월간 활성 사용자 약 6억명, 주간 사용자 4억명을 기록하며 시장 점유율 1위를 유지하고 있지만, 기술력 면에서는 뒤처지고 있다는 평가다.
오픈AI는 기존 GPT-4o 모델을 업그레이드해 텍스트뿐만 아니라 이미지도 생성할 수 있도록 했으며, 차세대 프론티어 모델 'GPT-4.5'(코드명 오리온)을 역대 최대 규모로 출시했다. 그러나 심플QA 벤치마크에서 정확도는 높았지만, 코딩(SWE-벤치, SWE-랜서) 및 학술(AIME, GPQA) 벤치마크에서는 딥시크, 클로드 4.5 소넷 등에 미치지 못했다.
사용자들의 평가도 냉정하다. "챗GPT는 맥락을 기억하는 능력(3.8점)이 특히 아쉽다"며 "같은 채팅창 안에서도 앞서 나누던 대화 내용을 잊어버리는 느낌"이라는 불만이 나온다. 다만 '오퍼레이터'와 '딥 리서치' 등 에이전트 기반 기능을 선보이며 반격을 시도하고 있다.
일론 머스크 '그록 3', Think Mode로 승부수
일론 머스크가 이끄는 xAI의 그록(Grok)이 출시 몇 달 만에 강력한 도전자로 떠올랐다. 그록은 하루 평균 1650만 방문을 기록하며 중국 AI 딥시크와 같은 수준의 트래픽을 달성했다.
그록 3의 가장 큰 특징은 수학, 과학, 코딩 관련 벤치마크에서 높은 성능을 보이며, 단계별 추론 과정을 보여주는 'Think Mode'다. 또한 AI 이미지 생성 기능이 강력해 사용자들로부터 호평을 받고 있다.
한 사용자는 "제미나이와 그록 둘에게 동일한 질문하고 비교하면서 제안서 작성하고 있다"며 "그록 많이 쓰다 보니 장단점이 있지만 요즘 제미나이가 제일 좋은 것 같다"고 평가했다. 그록은 특히 실시간 정보 반영과 X(구 트위터) 연동을 통한 최신 데이터 활용에서 강점을 보이고 있다.또한, 이미지 샘플카드를 선보여, 보다 유저들의 편리함과 친근화된 이미지 생성 컨텐츠를 개선하였다. 이에 그록도 점차 진화된 모습으로 변화에 발맞춰가고 있다.
AI 4대 천왕 비교표
| 구분 |
제미나이 2.5 |
클로드 4.5 |
GPT-4.5 |
그록 3 |
| 개발사 |
구글 |
앤트로픽 |
오픈AI |
xAI(일론 머스크) |
| 최대 강점 |
코딩, 데이터 분석 구글 서비스 연동 |
맥락 이해 한국어 친화적 |
범용성 사용자 수 1위 |
Think Mode 이미지 생성 |
| 일평균 방문 |
1090만 |
330만 |
월 6억 사용자 |
1650만 |
| 컨텍스트 창 |
100만 토큰 |
20만 토큰 |
12.8만 토큰 |
12.8만 토큰 |
| 요청 이해도 |
⭐⭐⭐⭐ (4.0) |
⭐⭐⭐⭐⭐ (4.6) |
⭐⭐⭐⭐ (4.1) |
⭐⭐⭐⭐ (4.2) |
| 맥락 기억 |
⭐⭐⭐⭐ (4.0) |
⭐⭐⭐⭐⭐ (4.4) |
⭐⭐⭐ (3.8) |
⭐⭐⭐⭐ (4.0) |
가격 (월) |
무료 / $20 (어드밴스드) |
무료 / $20 (프로) |
무료 / $20 (플러스) |
X 프리미엄 포함 |
| 추천 용도 |
개발, 데이터 분석 문서 작업 |
문서 작성 번역, 한국어 |
범용 대화 일반 업무 |
수학, 과학 이미지 생성 |
사용자 평가 "각자 장단점...목적별 선택 중요"
IT 실무자들의 평가를 종합하면 각 AI가 뚜렷한 장단점을 가지고 있어 목적에 따라 선택해야 한다는 의견이 지배적이다.
제미나이는 "긴 요청/응답에도 문제없이 답을 준다"(4.3점)는 평가와 함께 이미지 분석 기능이 뛰어나 기획자들에게 인기가 높다. 다만 "이슈가 되는 사안은 답변 안한다"며 "정치 답변, 철학 문제는 그냥 그런 대답은 못한다고 하고 넘어가는 경우도 있다"는 한계도 지적됐다.
클로드는 코딩과 문서화 등 실무 영역에서 성능이 입증되면서 전문 사용자층 사이에서 깊이 자리잡고 있다. 다만 "클로드 4.5 소넷 Thinking은 그록 3나 제미나이에 비해 비등하거나 소폭 우위"라는 평가도 있어 평가가 엇갈린다.
챗GPT는 "여전히 가장 많은 사용자를 보유하고 있지만 기술력 면에서는 경쟁사에 밀린다"는 평가다. 다만 "기억 기능 전면 개편"과 "오퍼레이터 등 에이전트 기능 강화"로 반격을 준비 중이다.
■ 전문가 제언
▶ 코딩·데이터 분석: 제미나이 2.5 프로 추천. 100만 토큰의 방대한 컨텍스트 창으로 긴 내용을 한 번에 처리 가능.
▶ 문서 작성·번역: 클로드 4.5 소넷 추천. 맥락 이해와 한국어 친화성이 뛰어나 장문 작성에 최적.
▶ 범용 대화·일반 업무: 챗GPT-4.5 추천. 가장 많은 사용자 커뮤니티와 플러그인 생태계 보유.
▶ 수학·과학·이미지 생성: 그록 3 추천. Think Mode로 단계별 추론 과정을 확인하며 이미지 생성 강점.
AI 전문가들은 "각 AI가 고유한 강점을 가지고 있어 하나만 사용하기보다 목적에 따라 여러 AI를 병행 사용하는 것이 효율적"이라고 조언한다.
AI 시장의 경쟁은 앞으로 더욱 치열해질 전망이다. 각 기업들이 무료 서비스 확대, 성능 개선, 차별화 기능 추가 등으로 사용자 확보에 사활을 걸고 있어 소비자들의 선택지는 더욱 넓어질 것으로 보인다.
깨알소식 박예현 기자
깨알소식은 핵심만 쏙쏙 전하는 뉴스입니다.
Copyright © 깨알소식. All rights reserved. 무단 전재 및 재배포 금지.