×
뎁스노트
인공지능
구글 AI, Gemini (제미나이)의 놀라움과 뻘짓 멀티모달 능력이 이 정도까지? 그런데 이게 조작?

 

 

구글 AI의 놀라움과 헛발질

 

구글이 새로운 AI를 선보였다.

 

지난 12월 6일 구글이 새로운 생성형 AI인 Gemini 를 선보였습니다. 어떤 언론에서는 ‘제미니’라고 부르기도 하고, 어떤 기사에선 ‘제미나이’로 호칭하기도 하더군요. 원어 발음이 ‘제미나이’가 맞으니 앞으론 ‘제미나이’로 불려지지 않을까 합니다.

구글에서 절치부심, 새로운 생성형 AI인 Gemini 를 발표했다. '제미니'가 아니라 '제미나이'로 읽어야 한다. 사실 뭔가 북한의 사투리가 생각하는 듯한 구수한 느낌이다. (출처 구글)

 

이세돌과의 세기적 대결을 통해 AI가 인간을 넘어설 수도 있음을 강렬하게 보여줬던 알파고의 아버지 딥마인드의 데미스 허사비스가 오랫만에 등장해서, AI의 전통적인 강자 구글이 이제야 드디어 ChatGPT-4를 넘어서는 AI를  출시했다고 밝혔죠. 

오픈AI의 샘 알트먼이 등장하기 전에, AI 분야의 얼굴 마담은 딥마인드의 데미스 허사비스 였다. ChatGPT 때문에 마음 고생을 하셨는지 안색이 썩 좋지는 않다. (출처 구글)

 

Gemini 의 핵심 성능

 

구글에서 주장한 Gemini의 핵심 성능을 대략 다음과 같이 정리할 수 있을 겁니다. 

 

  • Gemini 울트라 버젼의 성능이 학술벤치마크 32개 중, 30개에서 GPT-4를 능가했다
  • MMLU (대규모 다중 작업 언어 이해) 테스트에서 90%의 정확도를 보여 인간 전문가를 넘어섰다 (참고로, 오픈AI의 GPT-4는 86.4% 이고, 인간 전문가는 89.8% 점수를 받았다고 한다)
  • 강력한 멀티모달 (Multi Modal) AI로 역사상 가장 뛰어난 추론 능력을 가졌다.
  • 울트라 / 프로 / 나노 이렇게 3가지 버젼으로 출시되며 성능과 용도에 따라서 구분된다.
  • 울트라는 내년 초 출시되며, 프로는 바드에 바로 적용된다. 나노는 모바일 기기에 특화되어 적용될 예정이다.
  • 구글 검색 뿐 아니라 구글 클라우드의 수많은 서비스에 탑재될 예정이다. 
 

Gemini 의 데모 영상

 

이런 특징에 대한 설명보다 사람들이 가장 놀란 것은 Gemini의 멀티모달 추론 능력을 보여주는 6분짜리 데모 동영상 때문이었습니다. AI가 주어진 상황을 얼마나 잘 파악하고 소통해 나가는 지를 보여준 영상이었는데, 정말 깜짝 놀라게 됩니다.  딱 6분 밖에 되지 않으니 꼭 한번 보시길 추천합니다.

 

 

오리가 물에 떠 있어요

 

데모 영상의 몇 가지 사례를 소개합니다. 

Gemini는 손으로 그린 오리 그림을 파악해 냅니다. 오리 옆에 물결을 그리니, 오리가 물에 떠 있는 상황이라고 말을 하네요. 오리를 파란색으로 칠을 합니다. 그랬더니 Gemini가 오리에겐 일반적이지 않은 색이라고 하면서도 그럼에도 파란색 오리가 있을 거라고 합니다. 파란색 고무 오리를 보여주니, Gemini는 깜짝 놀라며 (혹은 놀라는 척 하며) 파란색 오리가 나타났다고 말합니다. 

포스트잇에 오리를 그린다. 물결을 그린다. 그걸 보고 Gemini가 "새가 물 위에서 수영을 하고 있네요" 라고 대답한다. (출처 구글)

오리에 파란색을 칠한다. Gemini는 "보통 오리는 그런 색이 아닌데, 파란색도 있는 것 같다" 고 설명한다. 나심 니콜라스 탈레브의 탁월한 책인 <블랙 스완>의 검은 백조를 유추하는 듯한 말이다.  (출처 구글)

파란색 고무 오리를 보여주니 Gemini가 깜짝 놀라며 (놀라는 척 하며) "저런, 파란 오리가 등장했군요" 라고 말한다. 이후로도 파란 고무 오리에 대한 추론과 이야기를 이어간다. (출처 구글)

 

해변의 음악

 

또 다른 사례입니다. 기타, 앰프, 북 등의 그림을 그리니 거기에 맞춰 악기 소리를 들려주네요. 여기에 야자수 그림을 하나 덧붙이니 해변 분위기로 음악을 바꾸는 센스를 발휘합니다.

야자나무 그림을 보여주니 알아서 비치 음악을 들려준다. 이 정도면 대단한 센스다. 여성분들이 무척이나 좋아하겠다. (출처 구글)

 

조작 이슈가 터지다

 

그런데, 영상이 공개된 며칠 후에 이 데모가 조작되었을 지도 모른다는 의혹이 쏟아졌습니다. 결국 구글은 12월 8일에 이런 의혹에 대해 어느 정도 인정한다고 밝혔습니다. 실제보다 응답 속도를 높였다고 했고, 일부 음성과 영상에 반응하지 않은 부분들에 대해 영상을 편집했다는 점도 인정했습니다. 결국 구글은 공식 설명을 통해 ‘이 비디오가 실제 멀티모달 테스트 결과를 바탕으로 Gemini와의 상호 작용의 가능성을 보여주려는 의도’였다며 사과의 입장을 밝혔습니다.

 

구글이 조급하긴 조급한가 보다. 조금 더 준비하고 발표할 수도 있었겠지만, 오픈AI에게 이렇게 뒤쳐진 채  올해를 넘기고 싶진 않았을 것이다.

 

이러자 실제 Gemini의 성능이 아직은 ChatGPT-4에 미지치 못하고 여러 결과들도 구글의 주장일 뿐이지 않냐는 지적이 나오고 있습니다. 예전에 ‘바드’의 공개 때의 실수를 재현하는 꼴이라는 비아냥도 흘러나옵니다. 그래서 구글의 Gemini가 소개된 지 일주일 정도 흐른 지금, Gemini는 ChatGPT에 판정패했다는 정도의 분위기인 듯 합니다. OpenAI의 공세에 맞서기 위한 섣부른 공개가 구글에 또 다른 독이 되는 것 같습니다.

 

치열한 AI 경쟁, 브레이크는 없는가? 

 

하지만 이번 구글의 Gemini의 발표로 생성형 AI의 경쟁이 얼마나 치열하게 벌어지고 있는지를 여실히 보여줍니다. 세계 최대의 IT기업마저도 AI 경쟁에서 뒤쳐지지 않기 위해 모든 역량을 쏟아 붓고 있다는 초조함이 느껴지네요. AI 경쟁, 과연 그 끝은 어떻게 될까요? AI의 급진적인 진화가 어떻게 세상을 변화시키게 될까요? 우리는 AI 시대에 어떻게 살아가야 할까요? 많은 질문이 꼬리를 물게 됩니다.

AI가 몰고올 세상은 어떤 세상일까? 정말 예측하기 쉽지 않다.

 

또 흥미로운 테크 소식 전하겠습니다.

 

AI 리뷰어

촌장 드림

댓글 0