#생성형AI | 뎁스노트

촌장· 2년전

가장 인간적인 인간

매주 수요일, 안철준 촌장의 <수요레터>입니다 👀 매주 수요일, 안철준 촌장의 <수요레터> 발행됩니다 👀 웹에서 보기공유하기공유하기 가장 인간적인 인간 앨런 튜링의 사고 실험 미국의 인공지능학회에서는 튜링 테스트 란 행사를 매년 열어 왔습니다. 영국의 천재 수학자 앨런 튜링의 이름에서 따온 이 행사는 '인간같은 기계(컴퓨터)'가 가능한 지를 검증하는 행사입니다. 앨런 튜링은 생각을 복잡한 내용으로 규정하지 말고 어떤 상황에서 기계가 인간처럼 행동하고 말한다면 ‘기계도 생각할 수 있다고 판단’하자는 주장했죠. 베네딕트 컴버배치가 주연한 <이미테이션 게임>은 천재 수학자 앨런 튜링의 일대기를 다룹니다. 앨런 튜링은 애플의 베어문 사과 이미지의 모티브를 제공했다고도 알려져 있습니다. (출처) 누가 인간으로 보여? 시험 방법은 이렇습니다. 서로를 가린 채, 심사위원단은 인간 연합군과 컴퓨터 프로그램과 5분간 대화를 나눕니다. 상대를 전혀 모르는 상태에서 순수하게 단말기 상의 대화만을 가지고 누가 인간인지 누가 컴퓨터인지 밝혀내는 경기입니다. 최고점수를 받은 인간에게는 '가장 인간적인 인간' 이란 상을, 최고점수를 받은 컴퓨터에겐 '가장 인간적인 컴퓨터'란 상을 주게 됩니다. (출처 : DALL-E / 안철준) 기계를 통해 인간의 특징을 밝혀내다 '튜링 테스트'에 흥미를 가진 브라이언 크리스찬은 인간 연합군의 일원으로 2009년 튜링 테스트에 참가하게 됩니다. 테스트를 준비하는 6개월 동안 인공지능 컴퓨터에 대해 심도 있는 관찰을 했고, 더불어 무엇이 가장 인간적인 특성인지에 대해 깊은 성찰을 할 수 있는 기회를 가지게 됩니다. 그 과정에서 찾아낸 '가장 인간다운' 특징에 대한 이야기가 <가장 인간다운 인간> 이란 책입니다. "기계가 어떤 유형의 인간 행동을 모방할 수 있는가? 라는 과학적 물음은 우리가 인간으로서 실제로 어떻게 살고 있는가를 되돌아보게 만드는 기회를 제공한다." <가장 인간적인 인간> 중에서 불완전함이야말로 인간의 특징 수많은 사례와 실제 '튜링 테스트'의 기록들을 살펴본 브라이언 크리스찬은 이외의 데이터를 발견하고 놀랍니다. 통상적으로 인간적인 능력이라고 볼 수 있는 합리적이고 이성적인 판단과 논리는 인간다움의 특징이 아닐 수 있다는 거죠. 데이터를 통해 확인한 인간다움의 특징은 아래와 같습니다. 해결되지 않은 인생 예상치 못한 균열 즉흥성 서로의 진짜를 알아가는 능력 압축되지 않는 개별적 낯설음 무방비 상태 어떤가요? 얘기를 들어보니 정말 그렇지 않나요? 삶이라는 과정 속에서 일어나는 불완전함과 낯설음이야말로 인간다움의 고유한 특징들이 아닐까요? (출처 Motion Array) 챗GPT도 튜링 테스트에서 탈락 <가장 인간적인 인간>은 2013년에 출간된 책입니다. 벌써 10년도 전에 나온 책이죠. 만약 지금 최근의 LLM 모델 기반의 AI가 튜링 테스트에 도전한다면 어떻게 될까요? 바로 그런 실험이 최근에 있었습니다. 조지아대학교 연구진이 챗GPT를 이용해서 튜링 테스트를 진행했는데, 챗GPT가 튜링 테스트를 통과하지 못했다고 발표했습니다. 좀 실망스러우신가요? 사실 요즘 생성형AI의 성능을 생각하면 좀 의외이기도 합니다. 충분히 통과할 것 같은데 말이죠. 그런데 통과하지 못한 이유가 답변을 못해서가 아니라 오히려 사람보다 너무 뛰어난 정답을 내놓는 바람에 AI 라는 게 탄로 났다는 설명입니다. 챗GPT의 대답에 인간미가 없었던 거죠. 브라이언 크리스찬의 인간다움에 대한 통찰이 10년이 지나 AI의 놀라운 도약 상황에서도 의미하는 바가 있다고 생각되네요. 챗GPT가 아직도 튜링 테스트를 통과하지 못하고 있습니다. 대답을 못해서가 아니라 너무 정확하게 대답해서 인간미가 없어 AI로 탈로났다고 합니다. (출처 : DALL-E / 안철준) 인간이기 때문에 불안한 것 오늘은 어제와 같지 않습니다. 우리의 감정과 생각은 늘 변하기 마련이고, 뜻밖의 사건들과 새로움으로 혼란스러워합니다. 늘 같은 일상이라 느끼지만, 그 속에 미세한 변화는 있게 마련입니다. 똑같은 상황은 없고, 그래서 우리는 늘 선택의 기로에서 두려워합니다. 이런 상황들이 인간을 가장 인간답게 만드는 요소라고 볼 수 있지 않을까요? 인간이기 때문에 불안한 겁니다. 흔들리지 않는 냉철한 이성을 가진 사람을 우리는 '인간적’이라 하지 않고 ‘로봇’ 같다고 하죠. "직업 가수인 그녀는 흔들림 없이 노래하기를 원한다. 그러나 인간의 관점에서 볼 때는 공연 때마다 미세하게 감지되는 그 날만의 독특함에 세심한 주의를 기울이는 것, 자신이 터득한 기술에 균열이 생기면서 자신을 빠져들게 만드는 뜻밖의 순간들, 그래서 사물을 새롭게 보고 느끼게 되는 순간들이야말로 우리가 살아 있음을 알리는 신호라 하겠다. 그리고 이것이야말로 우리가 인간으로 남을 수 있는 방법일 것이다." <가장 인간적인 인간> 중에서 그 순간에서 느낄 수 있는 작은 떨림과 흔들거림이 살아 있음을 느끼게 하는 신호일 것입니다. 이런 것들이야 말로 우리가 AI와 다르게 존재하는 가장 중요한 이유이기도 하겠죠. (출처 Motion Array) 가장 인간적인 인간 결국, 브라이언 크리스찬은 2009년도 '튜링 테스트'에서 '가장 인간적인 인간'상을 받게 됩니다. 인간과 닮은 AI와 함께 살아가야 하는 우리들은 어쩌면 AI를 통해 우리 자신에 대해서 더 많은 것들을 배우게 됩니다. 결국 혼돈과 불안 같은 요소야 말로 인간만이 가질 수 있는 고유한 특성이고, 이런 특징들을 부끄러워 하지 않는 것, 자신을 더욱 더 사랑하는 것, 새로운 것을 받아들이려 하는 노력들이 우리를 좀 더 인간답게 만들 수 있다는 사실이 우리를 각성 시킵니다. 브라이언 크리스찬은 기계의 특징을 통해 인간적인 면모를 발견해 내는 독특하고 흥미로운 글을 쓰고 있습니다. <알고리즘, 인생을 계산하다>란 책도 매우 흥미롭습니다. (출처) "인간미가 없어." 사실입니다. 챗GPT에는 인간미가 없습니다. 너무 인간적이지 않도록 훈련되었기 때문일 수도 있지만, 어쩌면 그렇기 때문에 AI시대에 우리가 인간답게 되어야 하는 이유를 찾아낼 수 있기를 바랍니다. 촌장 드림 🤖 놓치면 안되는 중요한 AI 뉴스 이족보행 로봇이 최초로 현장에 투입되다 이족보행 휴머노이드 로봇이 최초로 물류창고에서 상자 운반 업무를 맡았습니다. 이 로봇은 사람처럼 걸으며 작업을 수행할 수 있어 물류 산업에 큰 변화를 가져올 전망입니다. 이러한 기술 발전은 노동력 부족 문제를 해결하고 작업 효율성을 높일 것으로 기대됩니다. (기사보기) AI는 절대 인간을 대체할 수 없어, 테트 창 사람과디지털포럼 기조 연설 테드 창은 예술이 무수한 선택의 결과라며 AI가 인간의 예술을 대체할 수 없다고 주장했습니다. 그는 예술 창작 과정에서 인간의 독창성과 감성이 중요하다고 강조했습니다. 또한 AI가 예술의 도구로 사용될 수는 있지만, 인간의 예술적 창의성을 대체하지는 못한다고 설명했습니다. (기사보기) 유튜브와 음반사 손잡다. 음악AI 서비스 준비 유튜브가 AI 음악 생성 도구 개발을 위해 음반사들과 데이터 구매를 논의하고 있습니다. 주요 음반사들로부터 저작권 소송을 당한 AI 스타트업들의 사례를 고려하여, 유튜브는 합법적인 라이선스 확보를 목표로 하고 있습니다. 이에 따라 새로운 AI 음악 생성 도구 출시가 기대됩니다. (기사보기) 저커버그, 폐쇄형 AI 기업들에게 쓴소리 마크 저커버그는 폐쇄형 AI 기업들이 자신들이 신을 창조하는 것처럼 착각하고 있다고 비판했습니다. 그는 한 회사가 모든 것을 제공할 수 없으며, 오픈 소스 모델처럼 많은 사람들이 함께 참여하는 것이 중요하다고 강조했습니다. 또한 메타의 AI 디바이스 개발 계획을 언급하며, 다양한 스마트 장치를 준비 중이라고 밝혔습니다. (기사보기)

#AI #생성형AI #튜링테스트 #가장인간적인인간 #챗GPT

271

촌장· 2년전

너무 똑똑한데, 너무 멍청해 - AI 패러독스

매주 수요일, 안철준 촌장의 <수요레터>입니다 👀 너무 똑똑한데, 너무 멍청해! AI의 패러독스 생성형AI는 변호사 시험에 합격할 정도로 똑똑해졌습니다. 그런데 아주 상식적인 질문에는 엉뚱한 대답을 하기도 하죠. 어떤 측면에서는 너무 똑똑한데, 또 다른 측면에서는 어린 아이의 판단에도 미치지 못합니다. 대체 왜 그런걸까요? AI 기업들의 얘기처럼 매개변수가 충분히 더 커지고 학습이 더 많이 이루어지면 문제가 해결 될 수 있는 걸까요? 아니면 생성형AI의 LLM (거대 언어 모델)이 인간의 지능을 모방하는데 근본적인 한계가 있는 걸까요? 워싱턴 대학교의 최예진 교수는 2023년 타임지 선정 인공지능 100대 인물에 포함된 유일한 한국인입니다. 작년엔 AI의 근본적인 문제점을 예리하게 지적한 TED 영상이 큰 반향을 일으키기도 했습니다. 지난 수요일이었죠. 제3회 한겨레신문가가 주최한 <사람과 디지털포럼>에 최예진 교수가 기조연설자로 나왔습니다. ‘엄청나게 똑똑한 AI이지만, 충격적일 정도로 멍청한 AI” 에 대한 이야기를 들려주었습니다. 직접 참석한 소감을 정리해 드립니다. 먼저 AI의 멍청한 실수부터 한번 살펴볼까요? 출처 : 한겨레 신문사 AI의 멍청한 실수 ⓵ 5개의 옷을 말리는데 5시간이 걸린다면, 그럼 30개의 옷을 햇볕에서 말리는 데 얼마나 시간이 걸리겠냐는 질문을 ChatGPT-4에게 해보았습니다. 상식적인 질문이죠. 태양 아래에서는 10벌이고, 20벌이건 상관없이 말리는 데 걸리는 시간은 다 똑같습니다. 정답은 5시간이죠. 그런데 ChatGPT는 30시간이라고 대답합니다. 나름 수학적으로 논리를 펴가면서요. 출처 : 최예진 교수 기조연설 발표자료 AI의 멍청한 실수 ⓶ 테이블에서 플랭크를 하고 있는 우주인을 그려줘 라고 DALL-E 에게 요청했습니다. 그림에서 보는 것처럼 달리는 그럴싸한 4개의 그림을 뚝딱 만들어 냈습니다. 진짜처럼 너무 잘 그린 그림들이죠. 사람은 이렇게 못합니다. 그런데, 만들어진 그림 중에서 어떤 게 정확하게 그린거야? 라고 물어 봅니다. 그런데 이런 상식적인 질문에 오히려 AI는 잘 답변하지 못합니다. 우리 사람에겐 너무 쉬운 일인데 말이죠. 네 개의 그림 중에서 정상적인 플랭크를 하는 그림은 딱 하나 있고, 이건 사실 어린 아이도 너무 쉽게 맞출 수 있습니다. 출처 : 최예진 교수 기조연설 발표자료 출처 : 최예진 교수 기조연설 발표자료 AI 패러독스 변호사 시험에도 합격할 정도로 똑똑한 AI 이지만, 앞서의 이런 지극히 상식적인 상황과 질문들에 정확한 대답을 하지 못하는 일이 AI 세계에는 비일비재합니다. 좀 더 나은 모델이 있고, 좀 못한 모델이 있는 것도 사실이지만, 근본적으로 생성형AI는 사람에겐 너무 어려운 일은 잘해내지만, 반대로 사람에게 너무 쉬운 판단의 문제를 어려워합니다. 이런 역설적인 상황을 AI 패러독스라고 부릅니다. 무엇이 중한디? 최교수는 생성형 AI와 관련해 가장 시급한 과제로 ‘환각(Hallucination)’ 현상과 더불어 윤리·도덕 문제를 지적했습니다. 그는 “인공지능 모델들은 지금 실제 현실과 가상 현실을 명확하게 구분을 못 하고 또한 사실과 거짓을 혼동하고 있다”며 “이는 결국 인공지능이 주입식으로만 질 낮은 데이터까지 습득해 명확한 사실을 제대로 공부하지 못했기 때문”이라고 말했습니다. “우리 시험공부 때 벼락치기 많이 했잖아요? 그런데 그건 급한 시험 준비엔 도움이 좀 되겠지만, 실제로 깊은 공부가 안된다는 걸 알고 있잖아요. 그런데 지금 거대언어모델(LLM)들은 대규모 데이터를 쏟아붓는 ‘주입식 교육’으로 학습하고 있다고 보면 되는 거죠” LLM의 근본적인 문제 엄청난 데이터를 학습해서 성능을 높혀가는 LLM 기반의 생성형AI들에는 근본적인 문제가 있다는 것을 알아야 합니다. 사실 LLM은 너무 비효율적인 방식입니다. 실제 하나의 질문에 대답할 때 소모되는 에너지가 구글의 검색 방식에 비해서 10배는 더 발생시킵니다. “무엇보다 중요한 핵심은 사람은 AI 학습 방법처럼 이렇게 세상을 이해하지 않는다는 점입니다. 언어와 지식은 동일하지 않습니다. 그래서 기존의 LLM 방식이 아닌 새롭고 효율적이면서 가벼운 접근 방식이 필요한 시점이 되었습니다.” 인간을 위한 AI “결국은 인공지능은 인간을 위해서 만들어야 한다고 생각한다.” 고 최교수는 말했습니다. 그동안 인공지능 기술 발전이 더뎠을 때는 인공지능 윤리나 도덕 같은 문제가 사실 그렇게 큰 문제는 아니었습니다. 하지만 이젠 충분히 인류에게 엄청난 영향을 미칠 수 있고 앞으로 그 파급력을 더 커질 것입니다. 그래서 처음부터 인간의 가치와 상식 같은 것들을 인공지능에게 잘 가르쳐야 하는 것이 정말로 중요합니다. 미리 준비하지 않으면 나중에 정말 후회할 상황이 벌어질 수도 있을 것이라 최교수는 강조합니다. 이번 포럼에는 최예진 교수 이외에도 이 시대 최고의 SF작가 중 한명인 테드 창, 인지과학자 아베바 비르하네 교수, 베스트셀러 ‘클루지’의 저자로도 유명한 게리 마커스 교수도 연설자로 나왔습니다. 인간에게 유익한 AI 개발을 위한 다양한 방법들이 제시되었습니다. 몇몇 거대기업과 엔지니어들에게만 AI의 발전을 맡겨두기엔 너무 중요하고 심각한 문제가 되었다는 생각이 듭니다. 다양한 분야의 사람들이 모여 진지한 함의와 고민을 시작해야할 시간이 되었고, 그런 의미에서 이번 컨퍼런스의 의미가 있었다고 생각됩니다. 촌장 드림 🤖 놓치면 안되는 중요한 AI 뉴스 런웨이가 오픈AI의 소라에 대적할 비디오 생성 AI를 선보였다 런웨이가 새로운 동영상 생성 AI 모델 '젠-3 알파'를 발표했습니다. 이 모델은 텍스트, 이미지 또는 비디오를 입력으로 사용하여 10초 길이의 고품질 동영상을 90초 안에 생성할 수 있으며, 감정 표현과 카메라 움직임 등을 세밀하게 제어할 수 있습니다. 런웨이는 이번 주말 유료 사용자에게 먼저 공개하며, 이후 무료 사용자에게도 서비스를 확대할 계획입니다. (기사보기) 애플이 오픈소스를? 온디바이스 AI용 모델 오픈소스로 출시 애플이 온디바이스 인공지능(AI) 앱 구축을 위해 사용할 수 있는 대형 언어 모델(LLM)과 데이터셋을 오픈 소스로 공개했습니다. 새로운 코어 ML 모델 20종과 데이터셋 4종은 메모리와 전력 소모를 최소화하여 최적화되었으며, 네트워크 연결 없이 안전하게 사용자의 장치에서 실행됩니다. 전문가들은 애플의 이번 조치가 클라우드에서 엣지 디바이스로 컴퓨팅 파워를 옮기는 추세와 일치한다고 평가합니다.. (기사보기) 메타의 굴복 : 유럽에서 사용자 데이터를 AI 학습용 사용 중단 메타는 유럽 사용자 데이터 사용을 통한 AI 훈련 계획을 규제 압력으로 인해 중단했습니다. 이 조치는 유럽 연합과 영국에서의 데이터 보호 규정에 따른 것입니다. 메타는 이러한 결정이 사용자 프라이버시를 보호하기 위한 것이라고 밝혔습니다. (기사보기) Apple Intelligence : 애플의 WWDC2024 정리 애플은 WWDC 2024에서 다양한 새로운 기능과 업데이트를 발표했습니다. iOS 18 을 비롯한 여러 OS의 업데이트 내용들이 선보인 가운데, 애플의 새로운 AI 기술인 Apple Intelligence에 대한 발표가 있었습니다. 그 밖의 다양한 내용을 정리한 기사입니다. (기사보기)

#AI #오픈AI #생성형AI #LLM

299

촌장· 2년전

GPT-4o, 영화 'her'가 현실이 되다

GPT-4o, 영화 'her'가 현실이 되다 오픈AI가 또 한번 세상을 떠들썩 하게 만들었습니다. 새로운 멀티모달 AI 모델인 GPT-4o를 발표한 건데요. (o는 Omni의 약자를 의미하고, ‘모든’, '전부’를 의미하는 단어입니다) 발표가 있은지 이틀이 지났지만 여전히 관련된 기사와 글, 영상으로 온통 뜨겁네요. 이번 수요레터에서는 GPT-4o의 핵심적인 특징들을 살펴보겠습니다. AI와 진짜 대화한다 영화 의 인공지능 사만다가 현실이 되었습니다. 예전 GPT 모델들이 음성 지원에 3초에서 5초 사이의 시간이 걸렸던 것에 비해서 0.23초 안에 대답이 가능해 졌습니다. 보통 사람의 응답시간이 대략 0.3초 내외라고 했을 때 응답속도 측면에서는 사람과 대화하는 것과 차이를 느낄 수 없다는 거죠. 텍스트, 시각정보, 오디오 등 모든 데이터를 end to end 학습을 통해서 한번에 처리가 되기 때문에 이런 빠른 응답이 가능하다고 오픈AI는 설명하고 있네요. 무엇보다 GPT-4o의 목소리에는 마치 감정이 들어가 있는 것처럼 보입니다. 사람과 농담을 주고 받고, 웃고, 위로합니다. 데모 영상을 통해서는 AI라고 느끼지 못하겠더라구요. SF영화가 이렇게나 빨리 현실이 될 지는 상상도 못했습니다. 영화 의 주인공 테오도르가 사만다에게 느꼈던 사랑의 감정, 가능할 수도 있을까요? 아이폰에 ChatGPT 애플은 AI의 개발에 뒤쳐져 있습니다. 최근에 AI에 최적화된 M4 칩이 적용된 아이패드 프로를 발표하기도 했고, 애플카를 접으면서 관련된 자원을 AI에 쏟아부으며 최선을 다하지만 솔직히 AI는 후발입니다. 하지만 이번에 오픈AI의 발표를 통해 애플과 오픈AI의 협력이 의미심장한 시너지 효과를 낼 수 있게 되었습니다. ChatGPT의 데스크탑 앱을 출시했는데, 맥 버젼만 선보였습니다. 윈도우 버젼은 연말에나 가능다하고 얘기합니다. MS와 오픈AI의 그간의 관계를 생각해 보면 참 의아한 일이 아닐 수 없네요. 이번 데모 영상에서 보여준 기기들은 온통 애플 것들이었습니다. 그리고 최근 블롬버그의 소식에 의하면 6월에 발표할 애플의 WWDC에서 얘기될 iOS18에서 ChatGPT가 시리2.0에 통합될 수도 있다고 합니다. 전세게 약 22억대의 활성기기를 보유한 애플의 생태계에 올라탄다면 오픈AI가 정말로 게임체인저가 될 수도 있겠다는 생각이 듭니다. AI에 뒤늦은 애플의 입장에서도 나쁘지 않죠. 무료 버젼에서도 가능 ChatGPT-4가 유료 버젼에서만 가능했던 것에 비해서 GPT-4o는 무료버젼에서도 가능해질 전망입니다. 다만 제약이 좀 있죠. 플러스 유료 사용자들에겐 5배 더 많은 사용이 가능하다고 하네요. 일단 사용해 보면 유료를 쓰지 않을 수 없다고 판단하는 모양인데, 이틀동안 GPT-4o를 사용해보니 정말 많은 사람들이 지갑을 열지 않을까 생각해 봅니다. 아직은 한국어가 약간은 어색하지만 그래도 충분히 대화를 나눌 수 있는 수준입니다. 운전하면서 이젠 절대 심심하지 않을 겁니다. API 사용성 확대 GPT-4o는 생태계 확대를 위한 API 사용성을 대폭적으로 확대했습니다. 기존 GPT-4 Turbo 대비 2배 빠르고 5배나 제한 없이 사용 가능한데, 가격은 절반입니다. 이 정도면 팀킬 아닌가 싶기도 한데, 문자와 영상 정보에 대한 AI 모델 개발에 대한 생태계를 선점하겠다는 포석이겠죠. 최근 메타의 LLaMA3가 오픈 LLM 모델로 좋은 성능과 개방성을 보여주고 있는 점을 경계하는 것 같네요. 그래서 무엇이 가능할까? 이번 GPT-4o는 다양한 응용 방법들을 보여주는 영상들을 여러 편 공개했습니다. 꼭 한번 보시길 추천합니다. 그 중에서 특히 인상 깊었던 몇 가지 데모를 소개합니다. 실시간 번역 이젠 GPT-4o만 있으면 실시간 번역이 가능해 집니다. 굉장히 자연스럽고 또 빠릅니다. 당연히 한국어도 가능하죠. 언어 장벽은 정말로 무너져 내렸습니다. https://youtu.be/WzUnEfiIqP4?si=-u_Xrvcg_drrEcbI 노래를 불러줘 감자(Potatoes)에 대한 노래를 불러달라고 GPT-4o에게 요청하는데, GPT-4o는 노래를 만들어 부릅니다. (세상에 AI가 노래를 부르다니요. 그런데 꽤나 자연스럽네요) 노래의 톤과 분위기를 바꿀 수도 있습니다. 좀 더 부드럽게, 좀 더 속삭이 듯이 불러줘라고 추가적으로 요청하면 변화된 느낌과 감정으로 노래를 바꿔 부릅니다. https://youtu.be/2Djt1WWch20?si=gfbRFm2SPbUFXCkJ 수학문제 교사 아이패드만 있으면 대화를 통해서 삼각함수를 GPT-4o에게 배울 수 있습니다. 실수에 대한 피드백과 문제를 맞췄을 때 적절한 응원까지. 정말 이런 교사가 없네요. 교육산업에 종사하는 분들은 이 영상을 보며 어떤 생각을 가지게 될 지 궁금해 졌습니다. https://youtu.be/_nSmkyDNulk?si=UR5_gGffT4m-q2tW 할 얘기는 넘쳐나는 이번 오픈AI의 발표였습니다. 하지만 이게 다가 아닙니다. 비디오 AI 생성 서비스인 소라(SORA)도 곧 출시될 예정이고, GPT-5도 준비 중입니다. 검색엔진도 발표가 있을 것이고, 샘 알트만이 얘기한 새로운 모델인 큐스타도 기다리고 있습니다. 오픈AI가 도데체 세상을 얼마나 또 놀래킬 건지 모르겠네요. 구글도 새로운 AI 전략을 이번 구글 I/O에서 발표했습니다. 자신들이 가진 거대한 플랫폼 생태계에 AI를 녹여내어 패권을 이어가려는 전략을 보여줍니다. 조만간 구글의 AI 발표에 관련되어서도 정리해서 소개해 드리겠습니다. AI 소식에 정신없는 촌장 드림

#오픈AI #GPT-4o #생성형AI

244

촌장· 2년전

구글 AI의 반격 - 구글 I/O 2024 인사이트

구글 I/O 2024 인사이트 지난 주 구글 I/O 2024 발표가 있었습니다. 구글은 세계 최대의 IT 기업 중 하나이죠. 무엇보다 2017년 트랜스포머 아키텍쳐를 발표해서 자연어 학습의 혁신을 주도했던 AI의 맏형이었습니다. 그런 구글의 향후 AI의 전략을 확인할 수 있었던 자리가 바로 이번 구글 I/O 2024 였습니다. 이번 발표에서 몇 가지 중요한 포인트를 정리해 드립니다. Gemini가 구글 생태계의 핵심 이번 발표에서 Gemini에 대한 아주 새로운 업데이트는 없었습니다. 하지만 구글이 제일 잘하는 분야에서 구글다운 전략을 선보였죠. 알다시피 구글이 가진 IT 생태계의 영향력은 압도적입니다. 안드로이드, Gmail을 포함한 구글 워크스페이스, 구글 포토와 수많은 애플리케이션들, 그리고 무엇보다 구글 검색을 가지고 있죠. 이 모든 서비스에 Gemini를 적극적으로 도입하겠다는 확실한 메시지가 이번 발표의 핵심이었습니다. 구글 검색의 대대적인 변화 구글이 2023년도에 검색과 및 관련 서비스로 벌어들인 매출이 175억 달러가 넘습니다. 이는 구글 전체 매출의 56.9%를 차지할 만큼 구글의 핵심 캐시카우라고 할 수 있죠. 압도적인 시장 점유율로 오랫동안 인터넷 세상을 이끌어 왔는데, 이제 구글 검색이 가장 큰 변화를 맞이하게 되었습니다. AI 오버뷰(Overviews) 기능으로 검색의 핵심적인 부분만 정리해 보여주었고, 써클 투 서치(Circle to Search)라는 기능으로 화면에 원을 그리는 것만으로도 사고 싶은 새 신발을 검색할 수도 있게 되었습니다. 그냥 흥얼거리는 것만으로 원하는 노래를 찾을 수도 있죠. 마이크로소프트나 오픈AI도 검색시장에도 자신들의 존재감을 보이려 하고 있습니다. 이미 마이크로소프트는 Copilot을 통해서 먼저 앞서 나가고 있고, 오픈AI도 조만간 검색과 관련된 새로운 기능들을 선보일 예정입니다. 검색 시장에서 앞으로 불꽃튀는 경쟁이 벌어질 것으로 예상됩니다. 실시간 대화 (Project Astra) 오픈AI의 GPT-4o가 멀티모달의 대화형 AI의 혁신을 보여줬는데, 구글도 프로젝트 아스트라(Project Astra)라고 하는 범용 에이전트를 선보였습니다. 전날 GPT-4o가 발표되면서 좀 김이 새기는 했지만, Gemini가 화면의 사물과 상황을 인식하고 목소리를 통해 사람과 소통하는 모습을 데모로 보여줬습니다. 영상과 이미지의 생성 분야에서도 비오(Veo) 그리고 이마젠3 (Imagen3)로 큰 진전을 이뤘다고 발표했습니다. 여러모로 오픈AI와 경쟁을 피할 수 없을 것 같네요. 안드로이드도 Gemini로 통합 전 세계에는 수십억 개의 안드로이드 기반의 엔드포인드 디바이스들이 있습니다. 안드로이드에 Gemini가 통합됩니다. 이번에 선보인 오픈AI의 GPT-4o처럼 음성으로 언제 어디서나 사용자와 소통하는 AI 비서역할을 할 수 있게 됩니다. 또 더욱 강력한 포인트 중에 하나는 온디바이스에도 Gemini를 사용할 수 있다는 점입니다. 클라우스 서비스와 온디바이스가 함께 제공하는 AI 서비스는 사용자 경험과 서비스의 품질 측면에서도 확실히 우위에 있을 것 같네요. 구글포토의 검색의 혁신 Ask Photos 스마트폰 세상에서는 자신의 역사가 앨범에 담겨 있습니다. 매일 60억개의 사진과 동영상에 구글 포토에 업로드되고 있다고 구글은 얘기합니다. 하지만 그렇기 때문에 수많은 사진과 영상 속에서 자신이 원하는 그 장면을 찾는다는 건 너무 번거롭고 어려운 일이기도 합니다. Gemini가 바로 이런 고민을 해결해 줄 수 있을 것 같네요. 단순한 검색을 넘어서서 복잡한 질문에 대해서도 Gemini는 대답할 수 있게 된다고 하는데요. 데모에서 “루시아의 수영 실력이 어떻게 발전했는지 보여줘” 같은 질문이 그런 거죠. 구글 포토를 검색해서 수영 실력이 성장하는 핵심적인 사진들과 영상들을 찾아서 정리해 줍니다. 올 여름에 출시된다고 하니 많은 기대가 됩니다. AI에 대한 책임감 오픈AI가 사내의 ‘AI 안전팀’을 전격적으로 해체했다는 기사가 났습니다. 인류에게 공헌하는 AI 개발을 위한 최소한의 가이드라인조차도 치열한 경쟁 때문에 뒷전으로 밀린 셈인데요. 반면 구글은 이번 구글 I/O 2024 발표에서 좀 더 책임감있는 AI 개발 전략을 소개했습니다. AI 기반 레드팀 (Red Teaming)이란 기술을 개발해서 모델의 문제점들을 스스로 파악해 내는 방법을 모색하고 있고, 신스ID (SynthID)라는 워터마킹 도구를 통해 AI로 만들어진 텍스트와 동영상을 식별할 수 있게 한다는 전략을 발표했습니다. AI의 발전이 가속화되면서 자연스럽게 AI 개발 윤리와 가이드에 대한 논의도 뜨거워질 것으로 예상합니다. AI 시대를 위한 인프라 : 트릴리움 (Trillium) AI 개발은 인프라 사업이라고 봐도 무방합니다. 엄청난 자원과 자본이 투자되어야 하는 산업이죠. 지난 6년동안 머신러닝 컴퓨팅의 수요는 백만 배나 증가했고, 매년 10배씩 증가하고 있다고 합니다. 구글은 TPU(Tensor Processing Unit)이라고 하는 자체 애플리케이션 특화 ASIC을 개발하여 인공지능 모델의 학습과 추론을 가속화하는 인프라 구축을 진행해 왔습니다. 이번에 6세대 TPU인 트릴리움 (Trillium)을 발표하면서 이전 칩셋보다 상당히 개선된 성능을 보여줬습니다. CPU, GPU를 포함한 슈퍼컴퓨팅 아키텍처를 지속적으로 발전시키는 것이 AI 경쟁과 생태계에 매우 중요한 요소가 되어가고 있습니다. 지금까지 구글 I/O 2024에 대한 내용들 정리해 봤습니다. AI 경쟁에서 구글도 강력한 존재감으로 혁신을 만들어갈 것으로 보입니다. 그리고수요레터가 발행되는 시점에서는 마이크로소프트의 빌드 2024가 진행되고 있습니다. 이미 Copilot+PC 라는 AI 특화된 PC를 소개했고, 또 Copilot에 대한 또다른 업데이트를 발표할 것으로 기대되고 있어요. 여기에 대한 내용들도 정리해서 다음 수요레터 소개해 드리겠습니다. 촌장 드림

#제미나이 #구글 #생성형AI

242