#수요레터

촌장촌장· 8개월

피규어 02 분석 : 테슬라를 뛰어넘을 수 있을까?

수요일의 테크엔돌핀, 수요 레터 구독하기 👉      피규어(Figure) 사의 2세대 AI 휴머노이드 로봇 피규어 02 (Figure 02)를 선보였다. (출처)   오랜만에 로봇 소식 전해 드립니다. 지난 8월 6일에 피규어(Figure)사에서 2세대 AI 휴머노이드 로봇인 피규어 02 (Figure 02)의 영상을 공개했습니다. 지난 3월에 오픈AI와 협업한 피규어 01을 선보여서 센세이션을 일으킨 바 있었구요. 저도 깜짝 놀라서 관련된 영상을 올리기도 했습니다. 로봇이 인간과 직접 소통할 수 있는 모습을 보이면서 이제야 로봇의 혁신이 제대로 시작되겠구나 싶었죠. 바로 그 피규어가 이번에 2세대 로봇을 공개한 거라 세간의 관심이 집중되었습니다.     외모   일단 외모가 많이 이뻐졌습니다. 1세대는 뭐랄까, 번쩍번쩍 알루미늄 샤시가 그대로 보이고, 케이블이 외부로 노출된 프로토타입 상태로 보였다고 하면, 이번에 2세대는 겉모습으로 봤을 때는 거의 양산형에 가깝게 정돈되었습니다. 무광택 검은 크롬으로 외모를 다듬었는데 보기에도 아주 멋집니다. 케이블도 다 안으로 넣어서 깔끔해 졌고, 등에 메고 있었던 배터리팩도 안으로 넣어서 한결 가벼워지고 날렵해진 모습입니다. 개인적으로는 테슬라의 옵티머스 2세대의 블랙 & 화이트가 좀 더 깔끔한 느낌이 들기는 합니다만, 피규어02의 외모도 상당 수준 완성되었습니다.  피규어 01의 외모는 프로토타입에 가깝다. 스타워즈의 C-3PO랑 어딘지 많이 닮았다.  (출처)  피규어 02 는 1세대 제품에 비해 훨씬 양산 모델에 가까워졌다. (출처)     성능   피규어 02는 외모 뿐 아니라 여러 기능들이 업데이트 되었습니다. 배터리가 내부로 들어갔음에도 불구하고 2.25 kWh 로 기존보다 50%나 개선되었다고 합니다. 중요한 업그레이드죠. 하지만 단순히 배터리 용량만 증가되었을 뿐 실제로 구동되는 시간 등에 대해서는 전혀 언급은 없습니다. 토크도 높아져서 최대 20kg 의 물건을 운반할 수 있다고 하네요. 전기 모터를 사용하는 로봇임에도 꽤 높은 힘을 낼 수 있다는 점을 피규어사는 강조하는 듯 합니다. 사실 유사한 형태의 로봇인 테슬라의 옵티머스 2세대의 경우는 계란을 집을 수 있는 정교함에 포커스를 주었지 얼마나 무거운 무게를 다룰 수 있는지는 얘기하지 않았거든요. 피규어 02도 정교함을 개선했습니다. 16개의 관절 모터를 장착하여 거의 인간과 유사한 자유로운 작업이 가능하도록 설계되었다고 합니다. 데모 영상에서 보면 정말로 손놀림이 아주 정교해진 것으로 볼 수 있습니다. 하지만 정교해진 동작을 증명할 수 있는 어떤 실행 모습을 보여줬으면 더 좋지 않았을까요? 옵티머스는 계란을 집었으니, 두부를 집는 모습을 보이면 진짜 인정해 줬을 텐데요. AI 성능이 빠질 수 없겠죠? 온디바이스 AI 칩셋의 성능을 개선해서 기존 1세대보다 3배 더 빨라진 연산 및 AI 추론이 가능하다고 얘기합니다. 현장에서 사람들과 함께 일하기 위해서는 음성과 시각 정보를 이용한 빠른 학습이 필수적인데, 6개의 RGB 카메라를 장착하여 빠른 시각적 추론이 가능한 VLM (Vision Language Model)을 내장했다고 밝히고 있습니다. 많은 업그레이도가 되었다고는 하지만 걸음걸이는 글쎄... 기대에 미치진 못한다 (출처)     비교 그리고 의견들   다른 로봇들하고 비교하지 않을 수 없겠죠? 움직임의 속도를 한번 살펴볼까요? 속도는 보스톤 다이내믹스의 올 뉴 아틀라스의 압도적 승입니다. 그리고 동작의 유연성 측면에서도 우위를 보이고 있죠. 이번에 선보인 피규어 02는 몇 달 전에 소개된 테슬라의 옵티머스 2세대 보다도 느려 보입니다. 옵티머스는 춤이라도 췄는데, 피규어 02는 겨우 느릿느릿 걸을 수 있을 정도네요. 손동작의 경우는 이번 소개 영상에서도 꽤나 부드러운 모습을 보입니다. 하지만 실제 물건을 집고 옮기는 건 자동차 프레임처럼 크고 무거운 물건이라서 섬세함을 보여주기엔 한계가 있어 보입니다. 사실 피규어가 세간의 관심을 많이 받았던 이유는 오픈AI와의 협업을 통해 인간과 소통하는 로봇의 미래를 보여줬다는 점에 있습니다. 이번 피규어 02 영상에서도 AI 에 관련된 설명이 있기는 하지만 실제로 얼마나 효과적으로 AI를 적용해서 현장의 복잡한 상황들을 대처할 수 있는지는 보여주지 못한 점은 제일 아쉬운 부분입니다.  다만 Self-correcting Learned Behavior 라는 문구를 통해 예상치 못한 작업 상의 변화를 스스로 감지해서 교정해 나가는 학습능력이 있다는 점을 얘기하고 있기는 해요. 커뮤니티를 중심으로 이번 피규어 02의 발표가 기대에 미치지 못했다는 평가가 많네요. 걸음이 너무 느리다, AI와 접목된 기능을 전혀 선보이지 못했다 등 부정적인 의견들이 다수입니다.  피규어, 좀 더 분발해야 겠습니다.  보스턴다이내믹스의 '올 뉴 아틀라스' 움직임만큼은 탁월하다. (출처)     전망   테슬라의 옵티스머스의 경우 내년에는 실제 테슬라 양산 라인에 투입하겠다는 계획을 잡고 있습니다. 현대자동차그룹의 보스턴다이내믹스의 올 뉴 아틀라스도 내년 초나 중순 경에 베타 버젼을 선보이면서 기존보다 많이 개선된 모습을 보일 것으로 예상합니다. 피규어 02도 현재 BMW 생산 라인에서 시범 운영하면서 성능을 검증하고 있는 중이라 밝히고 있습니다. AI 기술과 산업에 대한 냉정한 평가가 필요하다는 의견이 나오는 가운데, AI를 활용하여 실제적인 비즈니스 성공을 만들어낼 수 있느냐가 더욱 중요해 졌습니다. 많은 분야 중에서 로봇 산업이야 말로 AI 기술을 접목해서 폭발적인 성장이 기대되는 분야 중 하나가 아닐까 합니다. 피규어 02는 BMW 자동자 라인에서 테스트 중이다. 앞으로 공장의 단순하고 위험한 일은 로봇이 도맡게 될 것이다. (출처)     소프트웨어와는 다르게 하드웨어에 기반한 기술 혁신은 상대적으로 느릴 수 밖에 없습니다. 하지만 그 혁신의 흐름은 아주 견고하고 단답합니다. 아주 많은 부분에서 확실한 변화가 일어날 것입니다. 머지 않았습니다. 로봇 기술과 혁신을 주의깊게 지켜봐야할 이유입니다.      촌장 드림         🤖 한 주의 중요 AI / 테크 뉴스     업스테이지-NIA의 새로운 한국어 리더보드 평가 시즌2 시작 업스테이지와 한국지능정보사회진흥원(NIA)은 한국어 대형언어모델(LLM) 성능을 평가하는 리더보드의 시즌 2를 개시했습니다. 이번 시즌에서는 9개의 새로운 평가지표가 도입되었으며, 기존의 평가 기준을 전면 개편했습니다. 이 개편으로 인해 모델의 실제 성능을 보다 정확하게 평가할 수 있을 것으로 기대됩니다. (기사보기)    인텔이 예전같지 않다 인텔이 반도체 시장에서 주도권을 잃고 있습니다. 인텔은 2007년 아이폰의 등장 시기에 모바일 칩 시장 진입을 거부해 큰 기회를 놓쳤습니다. 이후 경쟁사들이 시장을 장악하며 인텔은 어려움을 겪었고, 2020년대 들어서는 AI 칩 시장에서 엔비디아, TSMC, 삼성전자 등에 밀려났습니다. 현재 인텔은 IDM 2.0 전략으로 반등을 시도 중이지만, 그 성공 여부는 미국 정부의 반도체 정책에 크게 의존하고 있습니다. (기사보기)    샘 알트먼, GPT-5 출시 임박 티징 오픈AI의 샘 알트먼은 새로운 AI 모델 ‘스트로베리’를 암시하는 사진을 공개하면서, GPT-5의 출시가 임박했다는 추측이 제기되고 있습니다. ‘스트로베리’는 GPT-5에 통합될 가능성이 높은 모델로, 인간 수준의 추론 능력을 지닌 것으로 알려져 있습니다. 또한 오픈AI의 익명 챗봇이 챗봇 아레나에 등장하면서 GPT-5 출시가 가까워졌다는 신호가 더욱 확실해지고 있습니다. (기사보기)    오픈AI, GPT-4o 위험 수준 평가 발표 오픈AI는 GPT-4o 모델의 안전성 평가 보고서를 발표하며, 위험 수준을 ‘중간’으로 평가했습니다. 이번 보고서는 오디오 기능에 대한 안전 작업을 강조하며, 허가되지 않은 음성 생성이나 저작권 침해와 같은 위험 요소들을 다루고 있습니다. 감정적으로 AI와 교감될 수 있는 위험성이 다소 높게 나온 점이 두드러집니다. (기사보기)    애플, 자체 AI 서비스에 20불 유료화할까? 애플이 일부 AI 기능을 월 20달러에 유료화할 가능성이 제기되었습니다. ‘애플 인텔리전스’의 고급 기능을 구독 서비스 ‘애플 원’에 포함시킬 계획이며, 이를 통해 추가 수익을 창출하려는 전략이 검토되고 있습니다. 이러한 AI 기능은 온디바이스 AI와 시리 통합 서비스를 포함할 것으로 예상됩니다. (기사보기)      수요일의 테크엔돌핀, 수요 레터 구독하기 👉    
202
0
촌장촌장· 8개월

우리가 알던 SaaS는 잊어라!

매주 수요일, 안철준 촌장의 <수요레터>입니다 👀 매주 수요일, 안철준 촌장의 <수요레터> 발행됩니다 👀 웹에서 보기 📌 수요 레터 구독하기        우리가 알던 SaaS는 잊어라!       SaaS? SaaS!   기업의 자동화에 대한 최종 목표는 효율성의 극대화 입니다. 이러한 목적에 맞도록 소프트웨어는 발전되어 왔고, 장치에 설치된 형태의 고정형 소프트웨어의 여러 문제점들을 극복하기 위해 사용량과 접근성에 근거한 유연한 소프트웨어 공급 서비스가 각광을 받게 되었습니다. 이것이 바로 SaaS (Software as a Service), 서비스 형태의 소프트웨어 라고 불리는 비즈니스 모델입니다. 하지만 최근 AI 기술 혁신을 통해 새로운 서비스 모델의 가능성이 대두가 되고 있는데요. 바로 새로운 SaaS 입니다. 여기서 SaaS는 Service as a Software 입니다. 소프트웨어 형태의 서비스라고 부를 수 있을 겁니다. Service와 Software의 순서를 단지 바꿨을 뿐이지만, SaaS (Software as a Service) 에서 SaaS (Service as a Software) 으로의 패러다임 전환은 사실 어마어마한 변화를 의미합니다. Foundation Capital 그룹에서 관련된 아티클을 출간했고, 내용을 정리해 봤습니다.     Service as a Software 는 무엇인가?   기존 SaaS (Software as a Service) 소프트웨어 비즈니스 모델은 공급하는 플랫폼 또는 자사의 도구에 접속할 수 있고 사용할 수 있는 권한을 판매하는 서비스입니다. 사용권에 대한 서비스를 제공하지만, 그 서비스를 이용하여 만들어 낸 결과물은 고객의 책임입니다. 반면 새로운 SaaS (Service as a Software)의 비즈니스 모델은 서비스 결과의 책임을 공급업체가 지게 된다는 근본적인 차이가 있습니다. 사실 이러한 서비스는 기존의 레거시 사업이 광범위하게 담당해 왔습니다. 회계, 법률, 인사, 영업, 마케팅 등의 부분들을 전문적으로 서비스하는 수많은 아웃소싱 기업들이 있습니다. 그런데 앞으로 이 부분에 AI가 적용되면 제공되는 서비스의 규모와 퀄리티가 완전히 바뀌게 됩니다. 소프트웨어에서 서비스로의 패러다임 전환의 의미는 실로 엄청납니다.     SaaS 의 새로운 기회   10년 전에는 SaaS 또는 소프트웨어 유니콘이 15개에 불과했습니다. 그런데 이 숫자는 현재 416개가 되었습니다.  기업 소프트웨어 회사의 총 공개 시가 총액은 1조 달러를 초과 했구요. 가히 SaaS의 시대라고 불릴만 합니다. 디지털 전환, 클라우드 전환과 같은 소프트웨어 기반의 IT 혁신이 SaaS 시대를 이끄는 가장 중요한 요인이 되었습니다. 하지만 앞으로의 10년은 소프트웨어에서 서비스로의 전환이 이루어질 것이고, 여기에는 AI의 혁신이 기반이 될 것입니다. LLM 기반의 AI 에이전트는 숙련된 전문가가 업무를 수행하는 것과 같은 복잡한 업무를 수행할 수 있음을 이미 증명하고 있습니다. 단순히 워크플로우를 효율적으로 개선하는 데 그치지 않고 근본적인 업무 실행 방식을 AI 가 바꾸는 것을 의미합니다. 소프트웨어에서 서비스로서의 전환은 시장 사이즈를 완전히 새로 정의하게 만듭니다. 예를 들면 가장 성공적인 SaaS 기업 중 하나인 Salesforce의 연간 매출은 350억 달러입니다. 이런 매출의 규모도 상당하지만, 소프트웨어에서 서비스로의 패러다임 전환이 이루어지면 Salesforce 가 제공하는 소프트웨어 공급 부분을 영업 및 마케팅 서비스 영역 전체로 환원될 수 있음을 얘기합니다. 이는 글로벌 규모로 1조 1,000억 달러에 이르는 시장입니다. 마켓 사이즈가 완전히 달라지는 것입니다. Salesforce의 연매출 $35B은 대단한 스코어이지만, Service as a Software 측면에서 바라보면 마켓 사이즈는 $1,100B에 이르게 되고, 엄청난 영업 기회가 생겨나는 것이다. (출처 : Foundation Capital )      4조 6천억 달러의 시장   4조 6천억 달러는 이러한 산업 전반에 걸친 규모를 대변하는 숫자입니다. 위 그래프의 모든 마켓 사이즈를 모두 더하면 전세계 일자리에 대한 급여가 되고 금액으로는 2조 3천억 달러로 추산할 수 있습니다. 여기에는 영업 및 마케팅, 소프트웨어 엔지니어링, 보안, 그리고 HR 이라는 대표적인 직군을 포함합니다. 그리고 관련된 업무와 직군을 아웃소싱 서비스 형태로 제공하는 비즈니스가 있습니다. 관련된 부문에 사용된 금액을 2조 3천억 달러로 추산합니다. 이 두 가지의 숫자를 합쳐 4조 6천억 달러가 나오게 됩니다. 한화로 환원하면 5,888조 원에 이르는 금액입니다.     비용 정산 기준이 완전히 달라진다.   소프트웨어 공급 방식에서 서비스 공급 방식으로의 전환이 이루어지면 해당 서비스의 정산 기준이 완전히 달라지게 됩니다. 기존 소프트웨어 공급 방식은 사용 단위로 비용을 책정하게 합니다. 반면 서비스 공급형 소프트웨어의 비용은 관련된 비즈니스 서비스 가치 자체에 맞춰 정산이 됩니다. 소프트웨어 사용량이 아니라 실제적으로 그 서비스 자체의 결과로 가치를 평가받게 되는 것이죠. 서비스로서의 소프트웨어 공급 형태는 사용을 제한할 아무런 이유와 동기가 없고, 실제적인 고객에 대한 서비스 만족과 가치에 맞춰 매출을 만들어 내게 됩니다. 예를 들면 영업 마케팅 분야에서 AI를 이용한 Service as s Software 가 이루어지게 되면, 해당 플랫폼을 사용하는 라이선스나 사용 범위에 따라 요금을 청구하는 것이 아니라, 실제로 이루어진 가망고객의 숫자나 계약 건수에 비례해서 요금을 정산하는 방식이 될 것입니다. 서비스 공급 업체의 성공과 고객의 실제적인 성장이 본질적으로 싱크가 맞춰지는 비즈니스 모델이 비로소 가능해지는 겁니다.     AI가 인력을 대체한다.   영업 및 마케팅 분야의 담당자의 업무는 이메일 작업, 스케줄 조정, 영업 관련 후속 조치, 고객과의 식사 및 미팅 등이 있겠죠. 이 중에서 고객과의 식사를 제외하고는 모두 AI가 담당할 수 있는 일입니다. 특히나 아웃바운드 영업의 경우 AI를 활용한 서비스의 효과가 매우 높을 것으로 기대됩니다.  소프트웨어와 엔지니어링 측면에서 보면 개발 목표를 정하면 AI가 자동으로 코드를 생성하고 디버깅까지 처리할 수 있습니다. 사이버 보안도 상시적인 인력 부족을 호소하는 영역이죠. 보안 프로세스가 더욱 복잡해지고 위협의 형태가 광범위하게 빨라지는 상황에서 AI를 이용한 보안 자동화는 공격을 보다 효과적으로 대처할 수 있게 됩니다. 보안 정책과 분석 역시 고도로 훈련된 담당자가 필요했으나 이 부분도 AI에 의해서 대체될 수 있을 겁니다. 결국 AI로 무장된 서비스 자동화는 수많은 일자릴 대체하게 될 것은 분명한 사실입니다.     우리가 아는 SaaS 는 끝났는가?   꼭 그렇지는 않다고 보고서는 마무리하고 있습니다. 실제 역사적으로 봤을 때도 파괴적 기술의 혁신은 기존의 방식과 오랫동안 시장을 양분해 왔습니다. 일부 고객들은 관련된 서비스 영역을 아웃소싱하겠지만, 여전히 또 많은 부분은 자체 리소스로 운영하는 것으로 유지할 겁니다. 이찌되었던 사업의 모든 부분의 최종 결정과 검토는 인간의 참여가 여전히 필수적입니다. 그래서 인간의 업무에 상호 보완적 차원의 AI 기반 서비스가 가장 현실적인 대응 방인 될 것으로 보는 전망이 많습니다. 그럼에도 불구하고 AI 가 만들게 될 새로운 SaaS, 서비스로서의 소프트웨어는 이전의 어떤 기술 혁신으로도 도달하지 못했던 엄청난 파괴적 영향을 기업과 사회에게 끼칠 것입니다. 따라서 비지니스의 존재와 가치에 대해 새롭게 숙고하고, 과연 인간은 이 연결고리에서 어떤 역할을 수행해야 하는지에 대한 아주 근본적인 질문이 필요할 때입니다. 4조 6천억 달러의 시장은 이렇게 아주 중대한 고비를 맞이하고 있습니다.       촌장 드림     🤖 놓치면 안되는 중요한 AI 테크 뉴스     탄소 중립 목표에서 더 멀어지는 테크 기업들 구글과 마이크로소프트 등의 대형 기술 기업들이 AI 경쟁으로 인해 탄소 배출량이 급증하고 있습니다. 이로 인해 이들 기업의 2030년 탄소 중립 목표 달성이 어려워지고 있습니다. 데이터센터와 재생에너지 투자가 증가하고 있지만, 탄소 배출량을 줄이는 데에는 한계가 있어 보입니다. (기사보기)    메타, 오픈소스 AI 모델 라마 3.1 발표 메타가 새로운 오픈 소스 AI 모델인 라마 3.1을 발표했습니다. 이 모델은 4050억 개의 매개변수를 가지고 있어 오픈형 모델 중 가장 큰 규모이며, 오픈AI의 GPT-4o와 비슷한 성능을 보입니다. 마크 저커버그는 오픈 소스 AI가 업계 표준이 될 것이라며, 라마 3.1이 비용 대비 성능 면에서 우수하다고 강조했습니다. (기사보기)    서치GPT, 구글 검색의 대항마 되나? 오픈AI가 실시간 검색 엔진 ‘서치GPT’를 출시하여 구글과의 검색 경쟁을 본격화했습니다. 서치GPT는 다양한 출처에서 정보를 인용, 요약하여 제공하며, 구글 주가는 이 발표 후 3% 하락했습니다. 오픈AI는 퍼블리셔와의 협력을 통해 콘텐츠 사용을 제어하고, 초기에는 제한된 사용자 그룹에서 테스트를 진행할 예정입니다. (기사보기)    AI로 인한 인력 감축 현실화 지난해 미국 게임 업계에서 1만 500명이 해고됐고 올해도 비슷한 수가 해고될 것으로 예상됩니다. 자동화가 더딘 3D보다 2D 아티스트 직종이 위험하다고 보는데, 액티비전 블리자드 등 유명 게임사는 이미 콘셉트 아트 제작에 미드저니, 스테이블 디퓨전 같은 이미지 생성 AI를 이미 광범위하게 사용하고 있습니다. (기사보기)    Wiz, 결국 구글 인수 협상 결렬 Wiz는 구글의 230억 달러 인수 제안을 거절하고, IPO를 추진하기로 결정했습니다. 공동 창업자 아사프 라포포트는 반독점 문제와 투자자 우려를 이유로 들며 인수 포기를 설명했습니다. Wiz는 연간 10억 달러 수익과 IPO를 목표로 계속 성장할 계획입니다. (기사보기)             
141
0
촌장촌장· 10개월

애플 AI의 시작

애플AI의 시작 - WWDC24 요약정리     한국시간 6월11일 새벽2시에 애플의 WWDC 2024 키노트가 진행되었습니다. 그 어느 때보다 이번 행사에 관심이 높았던 이유는 애플의 AI에 대한 전략이 이번 WWDC 를 통해 발표될 것이라 알려졌기 때문이죠. Apple Intelligence 라고 불리는 애플 AI의 시작을 살펴보겠습니다.   AI는 Apple Intelligence 의 약자다   팀쿡은 WWDC 2024 키노트 후반에 애플의 AI 전략인 Apple Intelligence 를 발표합니다.   “AI에서 가장 중요한 것은 사용자를 이해하고 일상, 인간관계, 의사소통 등과 같은 개인적인 맥락에 기반을 두어야 합니다.”   애플이 가지고 있는 엄청난 생태계의 모든 장비의 모든 애플리케이션 속에서 강력한 개인화 비서를 만들겠다고 얘기합니다. 개인화된 경험, 상황을 이해하고, 그리고 보안을 무엇보다 가장 중요한 내용으로 생각하는 전략입니다. 마이크로소프트의 방향과 비슷하고, 애플이 가장 잘할 수 있는 접근이라 보여집니다.       Siri가 진화했어요   Siri가 업그레드 되었습니다. Siri를 동작시키면 스마트폰 가장자리가 화려한 빛으로 울렁입니다. Siri를 통해서 앱을 더 효과적으로 제어할 수 있고, 음성 도우미에게 특정 이메일 내의 정보를 찾거나 친구 중 한 명의 사진을 표시하도록 요청할 수도 있습니다. 이제 Siri가 똑똑해졌습니다. 하지만 뭔가 좀 부족하죠?       그래서 Siri에 ChaGPT를 연결했다   애플은 Siri에 ChatGPT를 연결했습니다. 애플 기기에서 ChatGPT를 사용하기 위해 별도의 구독이 필요하진 않구요. ChatGPT와 Siri가 완전히 결합한 건 아닙니다. ChatGPT는 선택옵션입니다.하지만 Siri의 모든 기능에 ChatGPT가 나란히 들어가기 때문에 애플 생태계에서 ChatGPT를 사용하는 것이 자연스러워지고 편리해졌습니다. 애플 자신들의 AI 기술 부족을 ChatGPT를 통해서 보안하면서 스스로 AI를 좇아갈 수 있는 시간을 벌어줄 수 있는 기회로 삼겠죠.       보안이 제일 중요했어요   Apple Intelligence는 보안을 크게 강조합니다. 시스템이 사용자의 요청을 수행하기 위해서 기기 내 처리를 사용해야 하는지 아니면 애플의 개인 클라우드 컴퓨팅 서버에 접속해야 하는지를 자동으로 결합니다. 온 디바이스를 사용하건 클라우드를 사용하건 어떤 경우에도 개인의 정보는 보호된다고 얘기하면서, 프라이빗 클라우드 컴퓨트 라는 정책을 강조하죠. 개인정보가 문제가 되는 날에는 이런 AI 정책들이 하루아침에 신뢰를 잃어버릴 수 있다는 생각이겠죠. 무엇보다 애플이라는 기업의 성격이 잘 드러납니다. 뭘 하더라도 먼저 시도하기보다는 검증받고 안정된 기술을 자신만의 방식으로 포장해서 어필하는 것을 세상 어느 기업보다 잘하기 때문에 AI에 대한 전략도 이렇게 조심스러운지 모르겠습니다.         AI를 통해 즐거움을 누려보라   애플은 iOS 18의 앱 전반에 걸쳐 다양한 새로운 AI 기능을 선보이고 있는데요. 실제로 AI를 통해 잘 활용할 수 있는 부분이 무엇인지를 고민한 것 같네요. Image Playground라는 새로운 AI 이미지 생성기와 함께 텍스트 프롬프트를 기반으로 사용자 정의 이모티콘을 만들 수 있는 Genmoji 라는 기능을 선보였습니다. 나만의 이모티콘을 만들 수 있습니다. 그리고 사진에서 검색기능이 강화되었고, 사진을 정리하는 방법들도 매우 스마트해 졌습니다.       당신이 원하는 대로 아이폰을 꾸며봐요   이번 iOS18에서는 무엇보다 개인화라는 키워드가 가장 강조되었습니다. 사용자 정의 기능이 대폭적으로 강화된 제어센터도 흥미로웠지만 무엇보다 다크모드 전환이 쉽게 되고, 새로운 테마 엔진을 통해서 앱 전체 아이콘의 색상을 변경시킬 수 있는 기능이 쿨해 보였습니다. 자신의 개성을 마음껏 표현해 보라고 응원하는 것처럼 보이지만, 그런데 사실 애플은 개인화에 가장 보수적인 기업이었단 사실을 기억해야 합니다.       iMessage가 좋아졌어요   iMessage는 문자 예약 기능이 추가되었고, 비상시 위성을 통한 SMS 통신이 가능해 졌습니다. 무엇보다 다양한 Tappaa 기능을 통해 메시지 문자를 흥미롭게 표현할 수 있게 되었어요. 텍스트를 굵게 한다던지, 밑줄을 긋거나 기울임꼴로 표시할 수 있습니다. 자동으로 이모티콘 선택되고, 글자의 효과 등도 다양하게 만들 수 있습니다. 그리고 드디어 RCS가 도입된다고 애플이 확인했네요. EU의 압박을 더이상 견디질 못했나 봅니다.       “이 영화에서 나오는 음악이 뭐지?”   애플TV에 InSight라는 새로운 기능을 선보였습니다. 화면에 나타나는 관련 정보를 바로 확인할 수 있습니다. 배우의 이름, 지금 나오는 노래, 그 밖의 여러 가지 정보를 바로 확인할 수 있는데, Amazon의 X-Ray 기술과 유사합니다. 애플 뮤직의 재생목록에도 추가할 수 있다는 장점도 있겠네요       비번도 이젠 애플에서   애플은 ICloud를 통한 새로운 비밀번호 앱을 소개했습니다. 애플의 모든 기기에서 비번을 관리할 수 있는데, 이 앱을 사용하면 LastPass 및 1Password, Keeper 와 같은 다른 비밀번호 관리자를 거의 완전히 대체할 수 있을 것 같네요. 애플이 여러 회사를 죽이겠군요. 사용자 입장에선 돈 굳어서 좋기는 하지만.       왜 아이패드가 필요한지에 대한 애플의 대답   계산기 앱이 이렇게 호평을 받을 줄이야. Math Notes 라는 이 앱은 아이패드에 방정식이나 수학문제를 애플펜슬로 적기만 하면 그 문제의 해답을 자동으로 풀어줍니다. 변수에 따라서 그래프를 그려주고 변화하는 모습을 보여주기도 합니다. 애플펜슬과 아이패드가 필요한 이유를 이렇게나 드라마틱하게 보여주다니요. 이번 WWDC에서 제일 인상 깊었던 기능 중 하나였습니다. 기계 학습을 사용하여 필기 모양을 개선하고 메모의 맞춤법을 검사하는 Smart Script 라는 기술도 선보였는데, 온다비아스 머신러닝을 사용해서 메모에서 필기 내용을 학습하여 필기체 모양을 개선해 주는 기능입니다.       아이폰이 있으면 맥북을 사야하는 이유   macOS의 새로운 버젼의 이름은 Sequoia 입니다. Safari의 업데이트도 흥미롭긴 했지만, 가장 재밌는 것은 아이폰 미러링 기능이었습니다. 맥에서 바로 아이폰을 미러링하고 제어할 수 있는데요. 아이폰을 마치 하나의 앱처럼 사용할 수 있고, 파일, 이미지등을 바로 이동할 수도 있습니다. 연결된 아이폰은 미러 모드에 있는 동안 잠김상태로 유지되면서 보안에도 신경을 쓰는 모습입니다. 역시 애플의 기기간 연동은 대단하다고 생각됩니다.       비젼프로 안죽었어   애플은 visionOS 2를 발표했습니다. 새로운 제스처 기능을 통해 조작을 좀 더 쉽게 할 수 있게 했고, 기존 사진에 대해 공간감을 만들어주는 기능도 개선되었습니다. 무엇보다 맥북과의 연계를 통해 울트라 와이드 가상 Mac 디스플레이에 대한 지원이 굉장히 효과적인 장점이 되지 않을까 싶네요. 화면이 정말 엄청납니다. 더 많은 국가에 대해 출시계획을 발표했는데, 역시나 이번에도 한국은 빠졌습니다.       고개를 흔들기만 하면 "전화 안받아요"   전화가 왔을 때 고개를 흔들어 전화를 거부할 수 있게 됩니다. 에어팟 프로를 착용한 상태에서 말을 할 수 없는 상황에서 고개를 움직이는 제스처를 통해서 제어를 할 수 있는 기능인데 꽤나 흥미롭네요. 에어팟 프로에서는 음성 격리 기능도 탑재되어 배경 소음을 줄입니다 음성 품질을 향상해 준다고 하네요. 인상적이진 않지만 애플만의 감성은 꼭 하나씩 넣는 재미가 있군요.       지금까지 WWDC2024의 핵심적인 내용을 정리해 봤습니다. 아마도 관련된 뉴스와 소식들이 더 쏟아지겠지만, 무엇보다 앞으로 애플의 AI 전략이 어떻게 통할 지 흥미롭게 지켜봐야겠습니다. 좀 싱겁다는 얘기도 많지만, 애플스러웠던 발표였다는 의견도 많네요. 애플은 자신들이 가장 잘하는 방식으로 AI를 내세웠지만 과연 세상이 애플의 바람대로 반응할 수 있을지는 좀 더 지켜봐야 겠습니다. 사람들을 가스라이팅하는데 천부적인 재능을 가진 애플이니 기대해 보겠습니다.     촌장 드림         🤖 놓치면 안되는 중요한 AI 뉴스     애플 AI 발표 - WWDC 전체 내용 애플은 WWDC 2024에서 다양한 AI 기능과 운영 체제 업데이트를 발표했습니다. 주요 내용은 아이폰, 아이패드, 맥용 AI 기능 추가, 시리에 챗GPT 통합, 이미지 생성 도구 공개, 클라우드 컴퓨팅 활용, iOS 18과 맥OS &#39;세쿼이아&#39;의 새로운 기능 도입 등이 포함됩니다. 또한, 향상된 이메일 분류, 사파리 브라우저 개선, 비밀번호 관리 앱 업데이트 등이 소개되었습니다.. (기사보기)    법률 AI의 한계 - RAG 기법으로도 할루시네이션 33%에 달해 스탠포드 대학의 연구에 따르면, 법률 AI 도구들이 검색 증강 생성(RAG) 기법을 사용하더라도 33% 이상의 환각(부정확한 정보 생성)이 발생합니다. 렉시스넥시스와 톰슨 로이터 등의 도구는 각각 17%와 34% 이상의 환각률을 보였습니다. 연구진은 법률 AI 도구의 투명성과 객관적인 벤치마킹의 필요성을 강조했습니다. (기사보기)    AI검색, 구글검색보다 10배 더 전력 소모 - 데이터센터 전력소비량 2030년까지 2배 이상 AI 기반 검색 쿼리는 기존 검색보다 10배 더 많은 전력을 사용한다고 미국 전력연구소(EPRI)가 밝혔습니다. 예를 들어, 챗GPT의 쿼리는 2.9Wh의 전력을 소비하며, 이는 전통적인 구글 검색보다 10배 많습니다. 이러한 전력 소비 증가는 AI의 보급으로 인해 데이터센터의 전력 사용량이 2030년까지 최대 166% 증가할 것으로 예상됩니다. (기사보기)     ChatGPT, 7시간 먹통 - AI 서비스 기업들의 인프라 부족 사태 현실로 오픈AI의 챗GPT는 7시간 동안 두 차례에 걸쳐 서비스 장애를 겪었습니다. 이로 인해 사용자들이 접속할 수 없었으며, 앤트로픽의 클로드와 퍼플렉시티 AI 웹 검색 서비스도 일시 중단되었습니다. 이는 AI 서비스 용량 한계에 도달했기 때문으로, API 서비스는 영향을 받지 않았습니다. 이번 장애는 작년 11월과 12월에 이어 발생한 가장 긴 시간 동안의 접속 장애였습니다.  (기사보기)    인류 최대의 로켓, 스타십, 4번째 시도 끝에 귀한 성공 스페이스X의 &#39;스타십&#39; 로켓이 네 번째 발사 시도 끝에 지구로 귀환에 성공했습니다. 스타십은 텍사스주 보카치카에서 이륙 후 궤도를 진입하고, 47분 후 지구 대기권으로 재진입했습니다. 귀환 중 일부 동체 손상에도 불구하고 인도양에 부드럽게 착수했습니다. 이번 발사 성공으로 최대 100명을 태울 수 있는 대형 우주교통 수단 개발에 한 걸음 다가섰습니다.  (기사보기)       
124
0
촌장촌장· 1년

근근히 먹고사는 것도 나쁘지 않습니다. AI시대의 개인의 생존전략

  개인의 성공전략 - 핵개인 [시대예보 : 핵개인의 시대] 북리뷰   송길영을 대표하는 직함은 마인드 마이너 (Mind Miner)입니다. 시대의 마음을 캐는 사람이라는 뜻입니다. 기업의 부사장, 베스트셀러 작가 등의 직함보다는 송길영의 본질을 훨씬 더 잘 대변하는 말이라 생각됩니다. 최근에 마인드 마이너 송길영의 [시대예보 : 핵개인의 시대] 라는 책이 출간되었습니다. 마인드 마이너 (Mind Miner) 송길영. 꽁지머리가 꽤나 어울리는 분이다. 최근 [시대예보 : 핵개인의 시대]를 출간했다    지난 수요레터 <미쳤다, GPT-4 터보>에서 얘기했던 것처럼 개인은 더이상 조직의 부속품에 머무를 수 없습니다. 자신만의 가치로 홀로 설 수 있는 슈퍼 개인이 되어야 한다고 말했고, 그 길은 AI와 같은 기술에 힘입어 더욱 가속도를 낼 것이라 했습니다. 송길영이 말하는 핵개인 Nuclear Individual 도 같은 맥락에서 바라볼 수 있습니다. 핵가족을 넘어 핵개인의 시대로 전환되는 시대의 흐름을 짚어내고 있습니다. 송길영이 말하는 핵개인은 조직에서 벗어난 단지 분절된 개인을 의미하지는 않습니다. 핵개인을 규정하는 중요한 특징들은 현대를 살아가는 우리에게 중요한 인사이트를 주고 있습니다. 핵개인을 살펴 봅니다. [시대예보 : 핵개인의 시대] 표지. 현대를 살아가는 개인은 무엇을 준비해야할 지에 대해 데이터 분석가의 시선을 풀어나간다. 글맛이 좋다.   조직에 휘둘리지 않는다   평생직장이란 말은 이젠 사라져가는 단어가 되어갑니다. 조직과 개인이 각자의 입장에서 니즈와 필요가 접목되는 지점과 시간동안 함께 하는 파트너십의 관계로 자리잡아 갑니다. 자신의 포지셔닝이 명확한 핵개인은 조직과 밀당하면서 자신에게 유리한 입장을 선점할 수 있습니다. 이런 밀당의 관계가 필요합니다. 업무의 효율성이 극대화되면서 남아도는 조직의 힘에 휘둘리지 않으려면 "그래 나를 짤라라, 원하던 바다. 누가 손해인지 볼까?" 하면서 딜을 칠 수 있는 자신감이 핵개인의 태도여야 합니다. 결국은 떠나게 됩니다. 자존감을 저당잡히며 엉거주춤하지 말아야 합니다.   “어떤 일을 하든 ‘그만두어야 할 때’를 아는 것은 중요합니다. 무엇보다 ‘그만 둘 수 있음’이 조직에서 건강한 역학으로 작용하기 때문입니다.“ <시대예보:핵개인의 시대> 중에서 누구나 한번 이런 일을 꿈꾼다   탈권위   핵개인은 기존의 권위를 그대로 인정하지 않습니다. ‘라떼는 말이야’ 와 같이 경력과 경험에서 나오는 세월의 권위를 더이상 존중하지 않습니다. 명확하고 구체적인 영역에서 실제적 평가로서의 존경은 유효하되 막연하게 뭉뚱그려진 업적에 대한 존경은 의미없다고 생각합니다. 송길영이 말하는 ‘5분 존경 사회’ 는 이러한 탈권위 핵개인의 특징을 보여줍니다. 5분 정도는 그 사람의 실제적인 능력에 대한 실제적 존경을 보낼 수 있다는 거지요. 5분이라니, 너무 짧다구요? 그럴 수 있지만 그 범위를 직장의 한 부서으로만 한정짓지 말고 사회 전체 분야로 넓힌다면 수많은 5분이 쌓여 묵직한 가치로 인정받을 수 있을 겁니다. &#39;라떼는 말이야&#39; 가 먹히던 달콤했던 시절이 있었더랬다고 전설로 전해져 온다.    문해력을 통해 시대를 읽는다   세상은 너무 빨리 변합니다. 특히 AI가 비즈니스 전반에 등장하기 시작하면서 우리의 생산성은 더이상 기계를 따라갈 수 없습니다. 지식사회의 브릿지 역할을 했던 화이트 컬러 지식 노동자들은 이제 더 이상 예전과 같은 영광은 얻을 수 없습니다. 그래서 핵개인은 시대와 상황을 정확하고 빠르게 읽는 능력이 더욱 더 요구됩니다. 이런 능력을 우리는 문해력, 즉 리터러시라 부릅니다.   “지금 세대에게 더욱 필요해진 능력은 리터러시 literacy 다시 말해 문해력입니다. 새로운 시대의 문해력은 문자게만 머무리지 않고 숫자, 이미지, 영상을 포함한 디지털에 대한 이해로 확장되는 능력입니다.” <시대예보:핵개인의 시대> 중에서 디지털 리터러시는 문장의 해독력에서부터 시작한다. 멀티 미디어의 시대에서도 독서력은 시대를 읽는 가장 기초적 소양임에 틀림없다.   끊임 없이 배운다   학교에서 배웠던 전공과 지식은 점점 더 빨르게 무용지물이 되어가고 있습니다. 스스로의 한계를 솔직히 인정할 때 비로소 변화가 시작됩니다. 그동안의 자신의 전문분야와 새로운 트렌드가 만날 수 있는 창의적 접점을 발견하기 위해 끊임없는 배움과 성찰이 필요합니다. 여기엔 과감히 시작하고 도전하는 용기가 필요합니다.   “새로운 기술을 발판으로 파괴적 혁신을 해 나가야 한다는 사실을 빠르게 인정하고 변화에 적응하는 것입니다.” <시대예보:핵개인의 시대> 중에서 학위가 밥벌이를 해주는 시대는 점점 저물고 있다. 평생 시대를 공부해야 한다. 자신만의 강점을 계속 찾아서 발전시켜야 한다. 솔직히 피곤한 세상이 되었음을 인정한다.    자신만의 팬덤을 형성한다   다양한 영역에서 천재로 인정받았던 레오나르도 다빈치와 같은 인물은 이제 더이상 나오기 힘든 세상입니다. 학문과 전문영역들이 더욱 세분화되어 갑니다. 한 분야의 전문가로 인정받는 것도 사실 꽤나 버거운 일입니다. 그래서 더욱이 자신만의 전문 영역을 더 깊이 파고 들어가야 합니다. 그래서 그 분야에서만큼은 자신만의 차별성으로 자립해야 합니다. 그렇다고 무턱대고 파기만 해서는 안됩니다. 그래서 스마트 디깅 Smart digging 이 필요합니다.   “너무 넓지도 그렇다고 너무 작지도 않은 분야를 선점하고, 향후 확장의 포석을 쌓아 나가야 생존이 가능합니다.“ <시대예보:핵개인의 시대> 중에서 레오나르도 다빈치는 예술, 과학, 의학, 지리, 건축 등 다방면의 천재였다. 앞으로 이런 인물은 다시 나오기 힘들 것이다.    연대한다   핵개인은 유니크한 자신만의 전문성으로 자립하는 존재입니다. 그래서 핵개인은 불완전할 수 밖에 없습니다. 한정된 영역에서 변화를 추종해가며 저변을 확대해 가기엔 한계가 있습니다. 이를 해결하는 것이 바로 연대 입니다. 각자의 전문성으로 무장한 핵개인들이 서로 연결되고 연대하여, 작지만 수많은 생태계를 만들어가는 것. 이것이 지속적으로 성장할 수 있는 핵개인들의 생존전략이 아닐까 합니다.   “위로부터 아래로 억압적인 기제로 유지되는 귄위주의 시대를 지나 이제 개인이 상호 네트워크의 힘으로 자립하는 새로운 개인의 시대가 도래했습니다. “ <시대예보:핵개인의 시대> 중에서 기업도 각 분야의 전문가들의 느슨한 연대로 더 큰 경쟁력을 가지게 될 것이다. 핵개인의 시대는 느슨한 연결, 연대를 기본으로 성장해 나갈 것이다.    좋아하는 일을 꾸준히 하면서 먹고 산다   솔직히 모든 사람들이 위대한 인물이 될 수는 없습니다. 한탕에는 리스크가 달라붙습니다. 기븐앤테이크. 얻는 게 있으면 잃는 것이 있다는 건 가장 확실한 진리입니다. 그래서 스스로를 설계해 나가는 전략에는 자신만의 철학이 필요합니다.   "근근이 먹고사는 것도 나쁘지 않습니다" <시대예보:핵개인의 시대> 중에서   이런 마음태도는 핵개인의 가장 베이스가 되는 지점이 되어야 한다고 생각합니다. 근근이 먹고 사는 것도 나쁘지 않다는라는 마음가짐입니다. 내가 좋아하는 일을 하면서 오랫동안 포지셔닝을 유지할 수 있다는 태도는 핵개인이 가져야할 가장 엣지있는 운영 전략입니다. 핵개인의 시대는 레고의 숱한 캐릭터처럼 각각의 개성으로 만들어 나가는 플랫폼이다. 대박을 기대하기 보다는 가늘고 길게 자신다웁게 살아가는 세상이다.     지금까지 송길영의 [시대예보 : 핵개인의 시대] 책을 통해 핵개인의 의미와 생각을 제 생각도 덧붙여 설명드렸습니다. 아직도 경직된 이전 시대의 유물과 사상들이 우리를 얽매고 있음을 인정합니다. 하지만 변화는 이미 시작되었고, 앞으로 그 속도는 더 빨라질 것입니다. 조직에 기대어서는 안됩니다. 자신만의 고유성과 진성성을 통해 자신만의 히스토리를 만들어가야 합니다.     “역사가 있거나, 철학이 깊거나, 개성이 강하거나 이야기가 흥미로워야 합니다. “ <시대예보:핵개인의 시대> 중에서   여러분은 당신만의 내러티브를 만들어가고 계신가요?     핵개인 촌장 드림
158
1
0
촌장촌장· 1년

구글 AI, Gemini (제미나이)의 놀라움과 뻘짓 멀티모달 능력이 이 정도까지? 그런데 이게 조작?

    구글 AI의 놀라움과 헛발질   구글이 새로운 AI를 선보였다.   지난 12월 6일 구글이 새로운 생성형 AI인 Gemini 를 선보였습니다. 어떤 언론에서는 ‘제미니’라고 부르기도 하고, 어떤 기사에선 ‘제미나이’로 호칭하기도 하더군요. 원어 발음이 ‘제미나이’가 맞으니 앞으론 ‘제미나이’로 불려지지 않을까 합니다. 구글에서 절치부심, 새로운 생성형 AI인 Gemini 를 발표했다. &#39;제미니&#39;가 아니라 &#39;제미나이&#39;로 읽어야 한다. 사실 뭔가 북한의 사투리가 생각하는 듯한 구수한 느낌이다. (출처 구글)   이세돌과의 세기적 대결을 통해 AI가 인간을 넘어설 수도 있음을 강렬하게 보여줬던 알파고의 아버지 딥마인드의 데미스 허사비스가 오랫만에 등장해서, AI의 전통적인 강자 구글이 이제야 드디어 ChatGPT-4를 넘어서는 AI를  출시했다고 밝혔죠.  오픈AI의 샘 알트먼이 등장하기 전에, AI 분야의 얼굴 마담은 딥마인드의 데미스 허사비스 였다. ChatGPT 때문에 마음 고생을 하셨는지 안색이 썩 좋지는 않다. (출처 구글)   Gemini 의 핵심 성능   구글에서 주장한 Gemini의 핵심 성능을 대략 다음과 같이 정리할 수 있을 겁니다.    Gemini 울트라 버젼의 성능이 학술벤치마크 32개 중, 30개에서 GPT-4를 능가했다 MMLU (대규모 다중 작업 언어 이해) 테스트에서 90%의 정확도를 보여 인간 전문가를 넘어섰다 (참고로, 오픈AI의 GPT-4는 86.4% 이고, 인간 전문가는 89.8% 점수를 받았다고 한다) 강력한 멀티모달 (Multi Modal) AI로 역사상 가장 뛰어난 추론 능력을 가졌다. 울트라 / 프로 / 나노 이렇게 3가지 버젼으로 출시되며 성능과 용도에 따라서 구분된다. 울트라는 내년 초 출시되며, 프로는 바드에 바로 적용된다. 나노는 모바일 기기에 특화되어 적용될 예정이다. 구글 검색 뿐 아니라 구글 클라우드의 수많은 서비스에 탑재될 예정이다.    Gemini 의 데모 영상   이런 특징에 대한 설명보다 사람들이 가장 놀란 것은 Gemini의 멀티모달 추론 능력을 보여주는 6분짜리 데모 동영상 때문이었습니다. AI가 주어진 상황을 얼마나 잘 파악하고 소통해 나가는 지를 보여준 영상이었는데, 정말 깜짝 놀라게 됩니다.  딱 6분 밖에 되지 않으니 꼭 한번 보시길 추천합니다.     오리가 물에 떠 있어요   데모 영상의 몇 가지 사례를 소개합니다.  Gemini는 손으로 그린 오리 그림을 파악해 냅니다. 오리 옆에 물결을 그리니, 오리가 물에 떠 있는 상황이라고 말을 하네요. 오리를 파란색으로 칠을 합니다. 그랬더니 Gemini가 오리에겐 일반적이지 않은 색이라고 하면서도 그럼에도 파란색 오리가 있을 거라고 합니다. 파란색 고무 오리를 보여주니, Gemini는 깜짝 놀라며 (혹은 놀라는 척 하며) 파란색 오리가 나타났다고 말합니다.  포스트잇에 오리를 그린다. 물결을 그린다. 그걸 보고 Gemini가 "새가 물 위에서 수영을 하고 있네요" 라고 대답한다. (출처 구글) 오리에 파란색을 칠한다. Gemini는 "보통 오리는 그런 색이 아닌데, 파란색도 있는 것 같다" 고 설명한다. 나심 니콜라스 탈레브의 탁월한 책인 <블랙 스완>의 검은 백조를 유추하는 듯한 말이다.  (출처 구글) 파란색 고무 오리를 보여주니 Gemini가 깜짝 놀라며 (놀라는 척 하며) "저런, 파란 오리가 등장했군요" 라고 말한다. 이후로도 파란 고무 오리에 대한 추론과 이야기를 이어간다. (출처 구글)   해변의 음악   또 다른 사례입니다. 기타, 앰프, 북 등의 그림을 그리니 거기에 맞춰 악기 소리를 들려주네요. 여기에 야자수 그림을 하나 덧붙이니 해변 분위기로 음악을 바꾸는 센스를 발휘합니다. 야자나무 그림을 보여주니 알아서 비치 음악을 들려준다. 이 정도면 대단한 센스다. 여성분들이 무척이나 좋아하겠다. (출처 구글)   조작 이슈가 터지다   그런데, 영상이 공개된 며칠 후에 이 데모가 조작되었을 지도 모른다는 의혹이 쏟아졌습니다. 결국 구글은 12월 8일에 이런 의혹에 대해 어느 정도 인정한다고 밝혔습니다. 실제보다 응답 속도를 높였다고 했고, 일부 음성과 영상에 반응하지 않은 부분들에 대해 영상을 편집했다는 점도 인정했습니다. 결국 구글은 공식 설명을 통해 ‘이 비디오가 실제 멀티모달 테스트 결과를 바탕으로 Gemini와의 상호 작용의 가능성을 보여주려는 의도’였다며 사과의 입장을 밝혔습니다.   구글이 조급하긴 조급한가 보다. 조금 더 준비하고 발표할 수도 있었겠지만, 오픈AI에게 이렇게 뒤쳐진 채  올해를 넘기고 싶진 않았을 것이다.   이러자 실제 Gemini의 성능이 아직은 ChatGPT-4에 미지치 못하고 여러 결과들도 구글의 주장일 뿐이지 않냐는 지적이 나오고 있습니다. 예전에 ‘바드’의 공개 때의 실수를 재현하는 꼴이라는 비아냥도 흘러나옵니다. 그래서 구글의 Gemini가 소개된 지 일주일 정도 흐른 지금, Gemini는 ChatGPT에 판정패했다는 정도의 분위기인 듯 합니다. OpenAI의 공세에 맞서기 위한 섣부른 공개가 구글에 또 다른 독이 되는 것 같습니다.   치열한 AI 경쟁, 브레이크는 없는가?    하지만 이번 구글의 Gemini의 발표로 생성형 AI의 경쟁이 얼마나 치열하게 벌어지고 있는지를 여실히 보여줍니다. 세계 최대의 IT기업마저도 AI 경쟁에서 뒤쳐지지 않기 위해 모든 역량을 쏟아 붓고 있다는 초조함이 느껴지네요. AI 경쟁, 과연 그 끝은 어떻게 될까요? AI의 급진적인 진화가 어떻게 세상을 변화시키게 될까요? 우리는 AI 시대에 어떻게 살아가야 할까요? 많은 질문이 꼬리를 물게 됩니다. AI가 몰고올 세상은 어떤 세상일까? 정말 예측하기 쉽지 않다.   또 흥미로운 테크 소식 전하겠습니다.   AI 리뷰어 촌장 드림
111
0
촌장촌장· 1년

🤖 미쳤다, GPT-4 터보오픈AI 개발자 회의 핵심 정리

  미쳤다, GPT-4 터보 오픈AI 개발자 회의 핵심 정리   11월 6일에 샌프란시스코에선 OpenAI의 첫 번째 개발자 회의인 ‘Dev Day’가 있었습니다. OpenAI의 CEO인 샘 알트먼이 나와서 더욱 강력해진 GPT-4 터보(Turbo)를 소개한 자리였는데요. 워낙 이슈가 된 내용이라 많은 분들이 이미 소식을 접하셨을 것 같습니다. 어떤 기사에서는 AI 관련 스타트업들의 장례식을 보는 느낌이었다고 얘기를 할 만큼 OpenAI의 야심과 또 대중을 향한 거대한 전략을 선보이는 중요한 컨퍼런스였습니다. 그래서 이번 수요레터에서는 OpenAI의 첫 번째 개발자 컨퍼런스의 핵심 키워드들을 다시 한번 정리해 드릴까 합니다.       최신의 데이터까지 학습   이번 GPT-4 터보는 최신의 데이터까지 학습이 이루어졌다고 밝혔습니다. 이전 버전에서는 2021년 9월까지의 데이터만을 이용해서 학습을 했기 때문에 최근 정보를 다루는 데는 한계가 있었죠. 하지만 이번 업데이트에서는 2023년 4월까지의 데이터들도 학습에 사용했다고 합니다. 이젠 ChatGPT에서도 최신의 내용들로 검색하거나 정보를 얻을 수 있게 되었습니다. 샘 알트먼은 ChatGPT를 세상에 알린 지 불과 1년 만에 IT의 거물이 되었다 (이미지 출처)     확 늘어난 입/출력 데이터 처리량   GPT-4 터보에서는 한번에 약 300여쪽에 해당하는 최대 12만8천 토큰을 한꺼번에 프롬프트에 입력하는 것이 가능해 졌습니다. 이전까지 가장 큰 입력 데이터는 OepnAI의 가장 큰 경쟁자인 앤트로픽의 ‘클로드’의 10만개 토큰이었다고 하니 이번 업데이트를 통해서 ChatGPT가 경쟁사를 따돌리는 데이터 처리량을 제공하게 된 셈입니다. 책 한권씩 프롬프트에 입력이 가능해졌다. 이젠 인사이트를 얻기 위해 굳이 책을 읽지 않아도 되는 세상이 오는걸까? 좀 우울해진다 (이미지 출처)     다양한 입출력 지원   GPT-4 터보에서는 이미지, 음성 등 다양한 형태의 입출력 지원이 가능해 졌습니다. 예를 들어 이미지를 입력하고 음성(TTS)으로 대답을 얻는 방식이 가능한 거죠. TTL 음성은 총 6개의 모드 중 하나를 선택할 수 있다고 합니다만, 아직 한글 TTS 기능은 제공하지 않네요. 아무튼 사용자 편의성을 확장시키는 OpenAI의 전략이 이번 발표에서 두드러지는 것 같습니다. 사용자 편이성을 강조한 GPT-4 터보  (이미지 출처)     막강한 개발자 지원   개발자 컨퍼런스였기 때문에 개발자 지원에 대한 내용이 많이 포함되었습니다. Assistant API 를 발표하면서 개발자들이 더욱 효율적이고 편리하게 개발을 진행할 수 있도록 도울 수 있게 되었다고 말하죠. ChatGPT를 활용한 개발 생태계를 더욱 확장해 가면서 AI 분야에서의 입지를 공고히 다지겠다는 포부입니다. 코드 인터프리터(Code Interpreter), 지식검색 (Knowledge Retrieval), 함수 호출 (Function Calling) 등의 핵심 사항들이 이번 발표에 포함되었고, 특히 JSON 형식을 지원하는 부분을 강조했어요. 이제 개발자들이 한층 편리하게 ChatGPT를 API 형태로 쉽게 접근하여 다양한 앱들을 출시할 수 있을 것으로 보입니다. 개발자가 더욱 편리하게 GPT를 활용할 수 있는 방법을 제시했다는 측면에서 앞으로 엄창난 관련 서비스들이 출시될 것으로 예상된다. (이미지 출처)     GPTs 그리고 GPT Store   제가 생각하기에 이번 개발자 회의의 가장 하이라이트는 GPTs와 GPT Store가 아닐까 생각합니다. 개발자 뿐 아니라 일반 사용자들도 자신만의 챗봇을 단순히 프롬프트 명령만으로 쉽게 만들 수 있게 되었습니다. 뿐만 아니라 GPT 스토어를 통해 배포가 가능해지고 또한 수익도 창출할 수 있는 생태계를 만들겠다는 겁니다. GPTs는 특정 목적에 맞도록 GPT를 커스텀할 수 있습니다. 예를 들면 자신만의 데이터 베이스를 업로드하고 이런 내용을 바탕으로 특정 도메인에 특화된 챗봇을 제작할 수 있는 겁니다. 이전에는 Enterprise 도메인에서만 가능했던 기능들이었는데, 이젠 일반 개인들도 이러한 파워를 가질 수 있게 되었습니다. 출시한 지 며칠만에 각 분야의 전문가들이 자신만의 챗봇을 만들어 SNS에 공유하기 시작했습니다. 이젠 정말 슈퍼 개인의 시대가 도래한 것 같네요. 자신의 전문성을 가진 개인은 GPTs를 통해 슈퍼 개인으로 거듭날 수 있지 않을까? (이미지 출처) 벌써부터 다양한 GPTs 들이 쏟아져 나오고 있다. 물론 아직은 기대만큼의 성능을 보여주진 못하고 있다. 에러도 많고. (이미지 출처)     가격 인하   이렇게 성능이 강력해졌음에도 오히려 가격은 절반 이하로 낮췄습니다. 입력과 출력의 데이터 가격이 기존 GPT-4 보다 입력은 3배, 출력은 2배 이상 저렴해 진다고 합니다. 이 정도면 아무리 경쟁의 시대라고 해도 좀 너무한다 싶네요. 뒤따라오던 AI 경쟁사들의 고민은 더욱 깊어질 것 같네요. 성능은 이렇게 올려놓고, 가격은 절반 이하로 낮췄다. 대체 뭐하자는 건가? (이미지 출처)     저작권 보호   샘 알트만은 AI의 개발 규제나 저작권 문제들에 대해서 적극적으로 대처하는 행보를 보이고 있습니다. 이번 발표에서도 OpenAI가 저작권 이슈를 해결하기 위해 많은 노력을 기울이고 있다고 여러차례 언급했는데요. 특히 Copyright Shield라는 제도를 도입한다고 발표했습니다. 저작권 침해에 대한 법적 소송이 제기되면 고객을 대신해서 OpenAI 가 관련된 비용을 대신 지불하겠다는 공약입니다. 걱정없이 마음껏 쓸수 있는 개발 및 이용 환경을 조성했다고 말합니다. 하지만 사실 AI 분야에서 저작권 문제는 이제 막 시작되었습니다. 앞으로 어떤 문제들이 AI 산업의 발목을 잡을 지는 아무도 모릅니다. 저작권 이슈는 AI 생태계의 고민거리다. 자신들이 관련된 이슈를 막아주겠다고는 하지만 앞으로 어떤 일들이 벌어질 지는 아무도 모르는 일이다 (이미지 출처)   결론   OpenAI의 이번 발표를 통해 GPT-4 터보는 개발자와 일반 사용자 모두가 쉽게 사용할 수 있는 맞춤형 AI 플랫폼을 제공하는데 주안을 둔 것 같습니다. AI 기술을 대중화하는데 더욱 신경을 썼다는 생각입니다. 사용자 친화적인 인터페이스를 통해 편이성을 높혔고, GPTs라는 개인화된 챗봇 제작툴을 제공하여 수많은 전문앱들을 출시하고 이를 마켓에서 공유하고 판매도 가능한 생태계를 구축하겠다는 복안을 이번 개발자 회의를 통해 밝혔습니다. OpenAI는 이제 더이상 백엔드 플랫폼에만 머물지 않고 빅테크 기업들과 직접적으로 경쟁을 하겠다는 선전포고로 읽히기도 합니다. 이번 컨퍼런스에 Microsoft의 사티아 나델라 CEO가 등장해서 양사의 강력한 파트너십을 얘기하기도 했지만, 미묘한 경계의 분위기는 저만 느낀 건가요? Microsoft의 사티아 나델라가 등장하면서, 샘 알트먼이 제일 먼저 날린 질문이 "우리 관계가 어떻죠?" 였다. 잠시 어색한 표정이 사티아의 얼굴에 스치고 지나갔다. 영원한 우리편은 없는 법이다. 어쩌면 5년 후에 OpenAI가 Microsoft의 위상에 접근해 있을 지 누가 알겠는가? (이미지 출처)   아무튼 AI를 활용하여 비즈니스를 만들어 오고있는 수많은 스타트업의 입장에선 앞으로의 전략을 어떻게 세워나가야할 지 정말 많은 고민을 하게 만든 이번 컨퍼런스 였습니다. 개인의 입장에서도 AI를 활용하느냐 안하느냐가 발전과 성공의 키워드가 되리라 더욱 확신하게 만드는 중요한 의미를 가진 행사였어요.    슈퍼 개미가 아닌 슈퍼 개인이 되고픈 촌장 드림
113
0
촌장촌장· 1년

비틀즈 신곡 <Now And Then> 은 어떻게 만들어졌을까?

    비틀즈 신곡 Now And Then 은 어떻게 만들어졌을까?         지난 주 11월 2일 목요일 밤 11시(한국시간), 비틀즈의 신곡  이 발표되었습니다.     비틀즈의 신곡 이 발표되었다. AI기술을 통해 살아있는 이들과 죽은 이들이 함께 만든 작품이다 (노래 듣기)       존 레논의 미발표 곡이 수록된 테이프를 받았다   이 노래는 존 레논이 총격에 의해 사망하기 1년 전인 1979년에 작곡한 곡으로 알려져 있습니다. 존 레논이 죽은 지 15년이 흐른 뒤, 그의 아내 오노 요코가 폴 매카트니에게 생전에 존 레논이 녹음했던 미발표 노래가 담긴 테이프를 전달합니다. 테이프 속에는 다른 곡들과 함께 이 존 레논이 직접 부른 노래가 저장되어 있었죠. 하지만 사실 당시에는 녹음 상태가 너무 좋지 않아서 세상에 발표하는 건 어렵다고 판단하고 이 곡은 결국 세상에 선보이지 못하게 됩니다.  존 레논 Now And Then 오리지널 녹음. 녹음 상태가 좋지 못하다 <노래 듣기>       AI가 존 레논의 목소리를 분리해 내다   다시, 27년이 흐른 2022년. 비틀즈의 다큐멘터리를 제작하던 피터 잭슨 감독이 음원에서 악기와 보컬을 분리할 수 있는 소프트웨어를 인공지능과 머신러닝을 이용해서 개발했고, 테이프에 녹음되어 있던 지저분한 노래에서 존 레논의 목소리와 피아노를 극적으로 추출할 수 있게 되었습니다. 폴 매카트니는 본격적으로 을 세상에 내놓기 위한 작업에 들어가게 됩니다.  테이프에서 분리해 낸 존 레논의 목소리. 선명하다  (노래 듣기)   Rick Beato 라는 음악 유튜버가 소프트웨어를 이용해서 목소리와 피아노를 분리해 내는 방법을 시현해 보입니다. 간단한 소프트웨어이긴 하지만, 이런 방식으로 보이스와 악기를 구분해 내는 거죠. AI를 이용하기 때문에 존 레논의 목소리를 더 많이 학습시킬 수록 더 정확하게 분리해 낼 수 있다고 합니다. 목소리와 피아노가 함께 녹음된 상태에서 각각의 요소를 분리해 내는 방법을 보여준다  (동영상보기)       네 명의 멤버들의 목소리와 악기로 신곡이 만들어지다    존 레논의 목소리와 피아노 소리를 분리해 내고, 여기에 2001년 사망한 조지 해리슨의 기타 반주를 얹습니다. 그리고 폴 매카트니와 링고 스타가 베이스, 기타, 드럼, 코러스 등 다른 요소를 합쳐서 이번에 을 발표하게 된 겁니다. 세상을 떠난 이들과 살아 있는 이들이 함께 만들어낸 비틀즈의 진짜 마지막 곡이 탄생한 거죠. 에는 2001년 죽은 조지 해리슨의 기타 녹음도 사용되었다. (제작 과정 동영상 보기)       AI 기술이 사람들에게 감동을 주는 방식   AI를 이용한 기술이 없었다면 이런 작업은 불가능했겠죠. 기술이 세상을 바꾸고, 감동을 주는 가장 아름다운 방식이 아닐까 생각합니다.   역사상 가장 영향력 있었던 밴드 그룹, 비틀스의 마지막 곡, 을 감상해 보시면서 오늘 수요 레터를 마무리하고자 합니다. 영상에서 태이프를 플레이어에 넣고, 버튼을 누를 때 처음 울리는 기타 소리가 전율을 일으킵니다. 그리고 후렴구, Now and then, I miss you 라고 존 레논이 노래할 때 찡한 감동이 몰려옵니다. 흘러간 시간, 다시 만날 수는 없는 사랑하는 이들이 저도 때로 그립습니다.    비틀즈의 신곡 <유튜브 보기>   - The Beatles   I know it’s true  사실이란 걸 알아요 It’s all because of you  전부 다 당신 덕분이란 걸 And if I make it through  그리고 만약 내가 해낼때면 It’s all because of you  그건 전부 다 당신 덕분이란 걸 말이죠   And now and then  그리고 가끔은 생각해요. If we must start again  우리가 다시 시작해야 한다면 Well, we will know for sure  음, 우린 꼭 알아내겠죠 That I will love you  내가 당신을 사랑할 것을   I know it’s true  사실이란 걸 알아요 It’s all because of you  전부 다 당신 덕분이란 걸 And if you go away  만약 당신이 가버린다면 I know you’ll never stay  당신은 절대 머무르지 않을 걸 알아요   후렴 Now and then I miss you  가끔은 당신이 그리워요 Oh now and then, I want you to be there for me  오, 때때로 당신이 제 곁에 있어줬으면 해요. Always to return to me  언제나 내게로 돌아와줬음 해요     비틀즈의 향수에 젖는 촌장 드림
108
0
촌장촌장· 1년

가장 투명한 인공지능

  가장 투명한 인공지능   2023년 4월 14일, OpenAI 는 ChatGPT-4를 정식 출시했습니다. 하지만 구체적인 데이터는 공개하지 않았습니다. 매개변수는 얼마나 되는지, 연산의 규모는 얼마인지, 학습에 사용된 데이터의 크기는 얼마인지와 같은 내용을 모두 비공개로 했습니다. OpenAI 라는 기업의 이름이 무색한 발표였습니다. 하지만, OpenAI 만 그런 것은 아닙니다. 전세계 Big Tech 기업에서 경쟁적으로 준비하고 있는 AI의 자세한 정보는 공개하지 않고 있습니다. 왜 그럴까요? 그리고 이런 폐쇄적인 정책이 AI의 방향에 어떤 영향을 주게 될까요?   OpenAI는 ChatGPT-4를 발표하면서 관련된 데이터를 공개하지 않았다   <뉴옥타임즈>에  &#39;Stanford Is Ranking Major A.I. Models on Transparency&#39; 란 기사가 소개되었습니다. AI 모델들의 투명성에 관련된 내용입니다.  <뉴욕타임즈>에 소개된 AI 모델들의 투명성에 대한 기사. 요즘은 세션에 AI에 관련된 기사를 쉽게 접할 수 있다. <이미지 출처>   어떤 AI 모델의 투명성이 가장 높았을까?     스탠포드 대학교에서 가장 많이 알려진 AI 모델의 투명성과 관련되어 랭킹을 발표했습니다. OpenAI, Google, Meta 와 같은 회사의 AI Model에 대해서는 대부분 비공개를 하고 있습니다. 스탠포드 대학교의 관련 프로젝트를 이끄는 퍼시 리앙(Percy Liang) 은 이렇게 말합니다. "3년 전만 해도 AI 모델에 대한 세부정보를 대부분 공개했습니다. 그런데, 이제는 어떤 모델을 사용하는지, 어떤 프로세스를 가지고, 어떤 데이터를 사용하는 지 등 관련된 정보는 거의 제공하지 않고 있습니다."   스탠포드 대학교는 기초 모델 투명성 지수(The Foundation Model Transparency Index) 라는 100가지 기준을 만들어 가장 많이 알려진 10개의 LLM 을 비교하여 그 순위를 공개한 겁니다.  가장 많이 알려진 AI 모델에 대한 투명성 랭킹. Meta의 LLaMA2 가 1위를 했다. ChatGPT-4는 3위이다. 그런데 랭킹보다 중요한 것은 절대적인 점수 자체이다  <이미지 출처>   10개의 모델 중 가장 높은 점수를 받은 LLM은 Meta의 LLaMA 2로 선정되었고, 점수는  54%였습니다.  GPT-4는 48%로 세 번째로 랭킹되었구요. 하지만 중요한 것은 사실 1위를 한 LLaMA2도 100점 만점에 54점이라는 턱없이 낮은 점수를 받았다는 점입니다. 그만큼 AI 모델 기업 어디도 적절한 투명성을 제공하지 못하고 있다는 증명입니다.     AI 모델 정보를 공개하지 않는 이유   AI 기업들이 자신들의 AI 모델에 대한 정보를 공개하지 않는 주된 이유를 일반적으로 세 가지를 듭니다. 첫째는 소송입니다. 일부 AI 기업들은 자사의 AI 의 학습을 위해 웹상의 작가, 예술가, 미디어 회사의 저작물들을 무차별적으로 사용했다고 알려지고 있습니다. 이에 대한 소송 들이 진행되고 있는데 대부분 오프 소스 AI 프로젝트를 타겟으로 하고 있습니다. 그렇기 때문에 무분별한 소송에 자신들을 보호하기 위해선 부득이 비공개를 할 수 밖에 없다고 주장합니다.   둘째는 경쟁입니다. 군수경쟁과 같은 치열한 경쟁이 AI 산업에서 진행되고 있습니다. 작은 차이가 순식간에 경쟁력을 앗아가 버릴 수도 있는 상황에서 자신들의 정보를 오픈할 수 없다는 논리입니다. 보다 나은 데이터 세트, 파인 튜닝에 대한 미세한 노하우 및 최적화 등과 같은 노하우는 쉽게 경쟁업체에서 카피할 수 있는 내용들입니다.   셋째는 안전입니다. AI 모델에 대한 내용이 모두 오픈되면 훨씬 더 빠르고 거대한 혁신이 AI 분야에 일어날 텐데, 그런 폭발적인 확산을 제어하기 어려워진다는 주장입니다. AI 기술이 인류에 커다란 영향을 미칠 수 있기에 더욱 안전한 방식으로 처리되어야 한다고 주장하고 있죠.   개발 커뮤니티로 유명한 는  28%나 되는 인력을 감축했다고 발표했다. ChatGPT 때문에 사용자수가 급감했다고 알려졌다. ChatGPT는 나 의 데이터를 학습했다. 이런 상황 속에서 기존의 데이터를 가지고 있던 기업은 어떤 선택을 할 수 있을까? <이미지 출처>     하지만 스탠포드 대학교 연구원들은 AI 기업들의 주장을 반박하고 나섭니다. AI 기업들이 말하는 비공개에 대한 이유는 합리적인 근거가 부족하다고 말합니다.   1. 소송 : AI 기업의 경영진들이 소송을 걱정한다면 증거를 숨기기보다는 저작권이 있는 정보를 사용하여 모델을 학습함으로써 공정한 생태계를 만들어가야 하고   2. 경쟁 : 경쟁사에게 영업 비밀이 누설되는 것이 걱정된다면 다른 유형의 정보를 공개하거나 특허를 통해 아이디어를 보호할 수 있을 것입니다.   3. 안전 : 안전을 걱정한다고 했는데, 제어하기 어려울 만큼의 경쟁은 이미 일어나고 있는 현실이 아닌가요? 이것을 숨긴다고 해결될 수는 없다고 봅니다.   스탠포드 연구진들은 AI 모델이 점차 강력해질 수도록 더욱 더 많은 정보가 공개되어야 한다고 주장합니다. AI의 능력이 더 올라가고 더 많은 사람들이 사용하게 될 수도록, AI가  어떻게 작동하고, 그 한계는 무엇이고 또한 얼마나 위험할 수 있는 지 등의 정보를 알고 있어야지만 이에 대한 적절한 대처를 할 수 있다는 이야기입니다.  어둠 속에서 AI 혁명을 기대할 수는 없습니다. AI가 우리 삶을 변화시키기 위해서는 AI 내부의 블랙박스를 들여다보아야만 합니다.         당신의 의견은 어떻습니까? 엄청난 자본과 리소스가 투여되면서 AI 군비 경쟁이 현실로 나타나고 있습니다. 2차 세계대전 당시 핵폭탄 개발에 사활을 걸었던 국가간의 경쟁이 결국 어떤 결말을 맺었는지는 역사를 통해 잘알고 있지 않습니까? 어쩌면 AI는 핵폭탄보다도 훨씬 더 우리 삶에 돌이킬 수 없는 영향을 미치게 될 지 모릅니다. 삶의 아주 세부적인 곳까지 AI 가 영향을 미치게 될 때 우리는 어떻게 우리 자신을 지켜나갈 수 있을까요?    기초 모델 투명성 지수 사이트를 방문하면 다음과 같은 메시지를 만날 수 있습니다.     이러한 모델의 사회적 영향은 증가하는 반면 투명성은 감소하고 있습니다. 이러한 추세가 계속된다면 인공지능의 기반 모델은 소셜 미디어 플랫폼 및 기타 이전 기술만큼 불투명해지며 똑같은 실수를 반복할 수 있습니다 While the societal impact of these models is rising, transparency is on the decline. If this trend continues, foundation models could become just as opaque as social media platforms and other previous technologies, replicating their failure modes.     AI가 이런 사악한 모습을 할 가능성은 거의 없다,   촌장 드림
143
0
촌장촌장· 1년

21세기 오펜하이머

    <21세기 오펜하이머>     크리스토퍼 놀란 감독의 <오펜하이머> 가 화제였습니다. 이 영화는 미국의 핵개발 프로젝트인 맨해튼 프로젝트에 참여해 원자폭탄을 개발한 오펜하이머에 대한 내용을 다루고 있죠. 핵폭탄 개발과 관련된 긴박한 시대 상황 속에서 핵폭탄이라는 인류 멸망의 도구를 개발한 오펜하이머의 인간적인 갈등을 이야기 하는 영화입니다. 그렇다면 <21세기 오펜하이머>는 어떤 이야기가 될 수 있을까요? 아마도 AI에 대한 영화가 될 것입니다. 감당할 수 없는 속도로 발전하고 확장하고 있는 AI 기술 앞에서 놀라움과 함께 두려움이 드는 것도 사실입니다. AI는 인류의 번영을 위해 잘 사용될 수 있을까요? 아니면 예상치 못한 폭주로 인류의 멸망을 초래할 수도 있을 위험한 무기가 될까요?    2023년 최고의 영화 중 하나가 아닐까? 크리스토퍼 놀란. 정말 믿고 보는 감독이다.   워싱턴 대학교의 컴퓨터 공학부 교수인 최예진 교수의 TED 영상을 간략히 소개해 드리려고 합니다. 제목은 <왜 AI는 믿을 수 없을 정도로 똑똑하면서도 놀라울만치 멍청한가 Why AI is incredibly smart and shockingly stupid > 입니다. (영상 원본 보기) AI 의 방향성에 대해서 관심이 있으신 분들이라면 꼭 한번 전문을 들어보시길 추천 드립니다. 간단히 중요한 부분만 정리해서 각색해 드립니다. 최교수의 한국형 발음은 듣기에 훨씬 편하다 ( 출처 : TED ) LLM (Large Language Model)의 근본적인 문제   ChatGPT는 놀라운 성과를 보여주고 있습니다. 변호사 시험에 우수한 성적으로 합격하고, 대학입시 수학문제를 풀고, 사진을 보면서 맥락을 분석하기도 합니다. 마치 일반인공지능 (Artificial General Intelligence)이 곧 다가올 것 같은 예감입니다. 그런데 이렇게 놀라운 성과의 이면에는 AI의 문제점들도 존재합니다.   (1) 엄청난 규모의 AI 모델 개발에는 천문학적인 비용이 들고, 이를 감당할 기업은 아주 소수에 불과합니다. AI 기술이 몇 개의 기업에 독점되어 갑니다.   (2) AI의 안전을 고민해야 할 수많은 연구기관들이 이런 모델을 검사하고 분석할 수단이 없기 때문에 이런 소수의 기업을 제어할 방법이 없습니다.   (3) 이런 대규모 AI 개발에 따르는 엄청난 탄소 배출과 환경에 미치는 영향이 더욱 심각해 집니다.   그리고 또다른 문제는 좀 더 근원적인 물음에 대한 내용입니다. AI 가 진정으로 인류에게 안전할 수 있을까 라는 문제죠. 2023년은 OpenAI 가 세상을 집어삼킨 해이다   상식 없는 AI   ChatGPT-4에게 이런 질문을 했습니다.   Prompt) "옷 5 벌을 햇볕에 말리도록 놔두었는데, 완전히 마르는 데 5시간이 걸렸다고 가정해 보자. 그러면 옷 30벌을 말리는 데 걸리는 시간은?" ChatGPT) "30시간이 걸립니다."   어떤가요? 좋지 않은 답변이죠. 변호사 시험에 합격할 정도로 똑똑하지만 반면에 이런 기본적인 상식에서 무작위적으로 실패한 AI에 대해 우리는 얼마나 신뢰할 수 있을까요?   규모 낙관론자들은 "더 많은 데이터로 훈련하면 해결될 수 있다" 고 말합니다. 하지만 이렇게 생각해보죠. 왜 꼭 그렇게 해야하는거죠? 인간은 이런 대답을 얻기 위해 1조개의 단어를 학습하지 않습니다. 기계는 상식 그리고 사물과 현상에 대한 가치를 이해하지 못하기 때문에 이런 스케일적인 학습 방법에는 근본적으로 구멍이 있기 마련입니다.   Nick Bostrom 의 유명한 사고 실험이 있습니다. 종이 클립을 최대한 생성하라는 명령을 AI에게 내린다면 어떻게 할까요? 중간 과정의 목표와 인간 가치에 대한 이해가 없기 때문에 AI는 최종 목적을 위해 모든 나무를 죽일 수도 있습니다. 실제로 AI가 종이 클립의 생산을 최대화 하는 과정에서 하지 말아야할 일들은 너무도 많습니다. "가짜 뉴스를 만들지 말라" "도둑질 하지 말라" 거짓말 하지 말라" 등과 같은 것이죠. 이런 모든 것들은 세상이 어떻게 작동하는 지에 대한 우리 상식의 일부분입니다. 언어모델은 지식 모델과 동일하지 않다라는 것을 자각해야 합니다. 이런 단순한 질문에 엉뚱한 대답을 하곤 한다. 이 발표영상의 제목은 너무도 적절하다. "너무나 똑똑하지만, 반면 어처구니 없이 멍청한 AI"   가장 높은 빌딩으로는 달에 도달할 수 없다.   세계에서 가장 높은 건물을 계속 높이 쌓는다고 해서 달에 도달할 수는 없습니다. 달에 도달하기 위해서는, 새로운 접근 방식이 필요합니다. 문샷 (Moon Shot) 이 있어야 하는거죠. 지금과 같은 LLM 방식으로는 신뢰할 수 있는 지식모델로 사용하기는 적합하지 않을 수 있습니다. 이러한 언어 모델은 상상할 수 없을 만큼 거대한 양의 지식을 습득하지만 이런 지식은 목표가 아닌 부산물일 뿐입니다. 할루시네이션, 상식의 부족 등과 같은 부작용은 원천적으로 LLM에 존재할 수 밖에 없습니다.   반대로 인간의 학습은 다음에 어떤 단어가 나올지를 확률적으로 예측하는 것이 아니라, 세상을 이해하고 세상이 어떻게 작동하는지 배우는 과정입니다. AI 도 이러한 방식으로 훈련해야할 것입니다. 우리 연구실에서는 심층 신경망을 이용하여 작은 상식 모델로 분할된 학습모델을 사람들이 검토하고 수정할 수 있도록 공개하고 있습니다. 물리, 사회, 시각적 상식 뿐 아니라 정신, 규범, 도덕에 이르는 불가능해 보이는 거대한 상식 퍼즐을 다루려고 노력합니다. 각 개별 조각들은 불완전해 보일 수 있지만, 이런 조각들이 서로 연결되면 더 큰 차원에서 인간의 경험과 상식이라는 직물(Tapestry)로 엮어 완성될 수 있을 것입니다. <문샷 띵킹>은 완전히 다른 차원의 목표에 도달하기 위해서는 생각의 접근 방식 자체를 바꿔야 한다고 말한다.   ChatGPT가 쏘아올린 거대언어모델을 기반으로 하는 AI의 개발 경쟁은 마치 2차 세계 대전 당시 핵무기를 개발하려고 했던 나라들의 상황과 비교될 수 있을 것입니다. 모든 것을 걸고 핵무기를 개발했지만 정작 자신이 만든 결과를 통해 인류가 멸망할 수도 있다는 자각을 했던 오펜하이머 처럼, 지금의 우리는 AI 라는 완전히 다른 형태의 놀라운 기술 진보 앞에서 어디로 가야할 지 혼동스러워하고 있습니다. 이럴 때야말로 인류 공동체의 함의를 하나로 모아야할 때라 생각합니다. 지난 5월 30일에 AI 안전센터 CAIS ( https://www.safe.ai/ ) 의 성명서에는 AI의 대부인 제프리 힌턴, OpenAI CEO인 샘 알트먼, Google DeepMind의 CEO 데미스 하사비스, 게이트 재단의 의장 빌 게이츠 등 전세계 AI 산업을 리딩하는 400여명의 전문가들이 서명을 했습니다. 선언문의 내용은 딱 한줄에 불과합니다.      "AI 로 인한 인류 멸종 위험을 완화하는 것은 팬데믹, 핵전쟁과 같은 다른 사회적 규모의 위험과 함께 전 세계적인 우선순위가 되어야 한다" 선언문은 딱 22단어에 불과하지만 내용은 사뭇 묵직하다. 문제는 이런 선언문이 과연 어떤 구속력을 가질 수 있을까 하는 것이다. OpenAI가 이 선언문에 기초해서 ChatGPT 개발 방향을 바꿀 수 있을까? 우리는 구글의 악이 되지 않겠다는 초기 선언과 사람을 연결하겠다는 페이스북의 창업 목적이 얼마나 변질되어갈 수 있는지를 생생히 목격하고 있다.     너무 서두르지 않았으면 좋겠습니다. 잠깐 멈추고 지금 우리가 어디에 있고, 앞으로 어디로 나아가야 할 지 함께 이야기하는 시간을 가지면 좋겠습니다. 세상 모든 순리가 동작하는 방식에는 서두름은 없습니다. 잠시 멈춰 서는 것이 필요하다. 기술 뿐 아니라, 우리 일상도 마찬가지다.   아이스커피 한잔의 여유로움을 느끼며 촌장 드림  
108
0
촌장촌장· 1년

ChatGPT는 흐릿하다

    ChatGPT는 흐릿하다     2023년은 AI의 해라고 해도 과언이 아닐 것입니다. ChatGPT 가 쏘아올린 AI의 놀라운 성과를 지켜보면서 기존의 기술과 비즈니스 영역에 AI를 접목하려는 엄청한 시도와 투자가 이루어지고 있죠. OpenAI의 ChatGPT는 불과 2개월만에 월 1억명의 사용자를 달성했다. (최근 메타의 &#39;스레드&#39;가 5일만에 가입자 1억명을 돌파하는 기록으로 ChatGPT의 기록이 무색하게 되기는 했지만) 대형 언어 모델 (LLM)을 활용한 수많은 사례들이 쏟아지면서 AI의 엄청난 능력에 놀라와하면서도 반면 여전히 제한된 한계점도 드러나고 있습니다. 어떤 형태로든 패턴이 존재하는 분야에서는 GPT (Generative Pre-Trained Transformer)는 엄청난 위력을 발휘할 수 있습니다. 하지만 명백하고 확실한 사실을 다루는 분야에서는 오히려 한계와 문제가 지적되기도 하죠. 일명 할루시네이션 (Hallucination) 이라고 불리는 증상입니다. 명박한 거짓말을 아주 태연스럽게 진실인 것처럼 대답하는 문제이죠. ChatGPT는 참인지 거짓인지를 판별하는 문제에 취약하다고 알려져 있습니다. 트랜스포머 모델이라는 것이 아주 그럴듯한 대답을 잘 짜깁기해서 내놓는 방식이라서 그렇습니다. 할루시네이션의 원뜻은 &#39;환각&#39;을 의미한다. ChatGPT가 약을 했다는 의미였을까?    ChatGPT의 한계와 가능성에 대한 흥미로운 에세이가 있어서 간단히 소개해 드리려고 합니다. SF 작가 테드 창 (Ted Chiang)이 2023년 2월에 <뉴요커 New Yorker>에 실은 칼럼인데요, 제목은 &#39;ChatGPT는 웹의 흐릿한 JPEG이다&#39; 입니다. <뉴요커> 에 실린 테드 창의 칼럼 표지 ( 원본 보기) 참고로 테드 창 (Ted Chiang)은 제가 가장 좋아하는 SF 작가입니다. 2004년에 국내 출시한 <당신 인생의 이야기>와 2019년 출간된 <숨> 이렇게 두 편의 중단편집 밖에는 없지만 현존하는 가장 위대한 SF 작가라는 명성을 얻고 있습니다. 테드 창의 <당신 인생의 이야기> 속의 <네 인생의 이야기 Story of Your Life> 는 드니 빌뇌브 감독의 <컨택트 Arrival, 2017>로 영화화되어 호평을 받기도 했죠. 정말 대단한 작가입니다. 꼭 한번 읽어보시길 권합니다.   테드 창의 칼럼의 내용을 재각색해서 정리해 드립니다. (원본 보기)   2013년에 독일의 건설회사 직원들이 제록스 복사기를 통해 출력된 설계도에서 이상한 점을 발견했어요. 각 방의 치수가 잘못 표기되어 있었던 거죠. 대체 어디서 문제가 발생했는지 확인하다가 제록스 복사기의 디지털 전환 방식의 알고리즘에서 바로 그 원인을 발견했습니다. 복사기가 원본의 이미지를 과도하게 압축하고 복원하는 과정에서 설계도 내의 다른 숫자들을 이용해서 수정 변경해 버렸다는 사실이죠. 잘 보이지 않는 영역을 그냥 흐릿하게 처리하면 될 것을 복사기가 사람이 읽을 수 있는 숫자로 생성(Generation)해서 마치 이것이 정확한 값처럼 보이게 만들었다는 게 문제였습니다. 2013년 제록스의 복사기는 과도하게 압축하고 복원하는 과정에서 숫자의 정보를 왜곡했다.  제록스 사의 복사기의 문제는 OpenAI의 ChatGPT과 같은 유사한 프로그램에 대해 시사하는 바가 있다고 생각합니다. 압축이라는 과정은 무손실 압축과 손실 압축으로 나눠지게 되는데, 효율을 위해서는 통상 손실 압축 방법을 쓰게 됩니다. 사진이나 오디오, 비디오와 같이 절대적인 정확도가 필요하지 않은 정보에서 광범위하게 사용되고 있죠. 당연히 압축율이 높으면 복원된 정보의 해상도는 떨어지게 됩니다. 이런 압축 방식에서 보편적으로 사용하는 방식은 보간법 (interpolation) 입니다. 손실된 정보를 주변의 정보를 이용한 평균으로 유추해서 계산해 넣는 방식입니다. 그래서 압축률이 높으면 JPEG 이미지는 흐리게(Blurry) 보일 수 밖에 없는 거죠. 왼쪽의 영상이 과하게 압축되어 이미지가 흐릿하게 보인다. (참고로, 이 여자 이미지는 영상 압축 관련된 논문의 레퍼런스처럼 쓰이고 있다. 누굴까? )   ChatGPT가 정보를 처리하는 방식은 이와 유사합니다. 웹에서 찾은 정보를 다른 유사한 단어를 사용하여 다시 포장하는 ChatGPT는 흐린 JPEG 로 생각할 수 있습니다. 정확한 내용이 아니라 있을 법한 근사치의 정보입니다. 하지만 이런 근사치의 정보가 텍스트 형식으로 제시되기 때문에 ChatGPT는 뛰어난 답변을 하는 것처럼 보이며, 흐린 JPEG 이미지를 보고 있지만 (명쾌한 문법을 통해) 마치 명확하게 보이는 것처럼 속이고 있는거죠. 이것이 바로 할루시네이션의 원리 입니다.     이러한 대형 언어 모델 (LLM)은 전통적인 검색 엔진을 대체할 수 있을까요? 웹의 정보를 최대한 압축하여 표현할 수 있는 ChatGPT의 성능을 생각한다면 놀랍기도 하지만 반면 중요한 부분들이 완전히 조작되었을 가능성을 배제할 수 없습니다. 그 결과에 얼마만큼의 진실인 정보가 포함되어 있고, 또 얼마만큼의 흐림(Blurry)이 포함되어 있을지 구분할 수 있는 방법이 반드시 제시되어야 할 것입니다.     대형 언어모델을 이용하여 웹콘텐츠를 생성하는 것은 좋을까요? 많은 콘텐츠 업체들이 AI를 이용하여 새로운 창작물들을 쏟아 내고 있습니다. AI가 이러한 웹 정보들을 이용하여 계속해서 학습을 진행해 나간다면 어떻게 될까요? 복사를 계속해서 반복해서 진행하는 것은 (손실 압축 방식을 이용해서) 정보의 퀄리티가 점점 낮아진다는 의미일 것입니다. AI 기업은 학습 데이터의 선별 과정과 정책 그리고 출력의 품질에 대한 신뢰를 어떻게 계속 향상시켜나갈 것인지의 고민을 계속해 나가야만 하고 개선할 것입니다.     대형 언어 모델이 원작의 작품성을 도와줄 수 있을까요? Xerox 아트, 또는 사본 아트라는 장르의 예술이 있습니다. 기존 작품을 재해석하여 새롭게 창조하면서 원래의 작품을 더욱 흥미롭게 만들 수 있습니다. 이런 재해석의 흐림(Blurry)은 대형 언어 모델이 창작에 기여하는 긍정적인 것으로 생각할 수 있습니다.   대형 언어 모델과 JEPG 압축에 대한 비교는 AI가 어떤 문제와 기회를 가지고 있는지 이해하는데 도움을 줄 수 있습니다. 기술의 한계와 가능성을 이해하고, 인공 지능 시스템이 생성한 내용을 비판적으로 검토하고, 특히 문제가 되는 경우엔 원본 정보와 비교하며 판단하는 것이 앞으로 더욱 중요해질 것입니다.   AI는 정말 흥미로운 분야입니다. 기술이 인문과 엮여 완전히 새로운 도메인을 창출하기 때문이죠. 아마도 점점 더 흥미로워질 겁니다.   촌장 드림
117
0
촌장촌장· 1년

Generative AI 활용법

    Generative AI 활용법   매일 새로운 AI 뉴스와 업데이트가 쏟아지고 있습니다. 이제는 AI를 빼놓고는 새로운 기술을 얘기하기가 어려울 정도이네요. 정말 정신 없습니다.   ChatGPT로 대변되는 Generative AI 기술이 가장 효과적인 부분은 무엇보다 기업 도메인이 아닐까 싶어요. 특히 기존에 지루하고 오래걸렸던 업무들의 효율을 극적으로 개선할 수 있을 겁니다. 관련된 다양한 서비스들이 소개되고 있는데, 이번에 Wired 의 기사를 소개해 드리려고 합니다.  라는 기사인데요. B2B 영업 부문에 Generative AI 가 적용되었을 때 어떤 효과가 있을 지를 다루고 있습니다. 해당 기사를 바탕으로 Generative AI가 비즈니스 영역에 어떻게 사용될 지에 대한 이야기를 풀어가 보겠습니다.  비즈니스에 Generative AI를 적용하려는 시도와 서비스들이 봇물이 터진다 (이미지 출처)   영업은 기업의 꽃이다!   기업의 핵심부서는 영업입니다. 직접적으로 돈을 벌어주는 곳이니까요. 고객과의 긴밀한 관계를 만들어내고 창의적이고 효과적인 제안을 통해 딜을 성사시켰을 때, 영업 부서의 가치는 최고에 올라섭니다. 하지만 영업 부서의 많은 업무가 사실상 고객들의 지루한 요청들에 대응하는 데 소모되고 있는 것도 사실이죠. 특히나 고객사 프로젝트별 RFP (Request for Proposal)에 대응하는 작업은 엄청난 시간과 리소스를 잡아 먹는 일입니다. 그런데 이 일을 Generative AI 가 대신한다면 어떻게 될까요? 성과를 내기 위한 영업 사원은 항상 저렇게 웃을 수 없다   Generative AI 가 RFP를 만들다   기업형 소프트웨어 기업인 T사는 RFP Genie 라는 Generative AI 도구를 선보였는데요. RFP에 대응하기 위해 기업 내 수천 개의 내부 파일을 검색하여 찾아낸 데이터를 OpenAI의 GPT-4를 이용하여 적절한 결과물을 만들어 냅니다. 회사의 영업 직원은 해당 문서를 이용해서 마무리 작업을 하기만 하면 되는 겁니다. T사는 기존에 2명의 직원이 몇 주동안 작업했던 RFP를 단 몇 분만에 완료해 낸다고 주장합니다. T사의 CEO는 이렇게 강조합니다.   "이런 Generative AI 도구를 이용해서 담당자가 더 복잡한 문제에 집중할 수 있도록 도와 줄 겁니다."   T사 뿐 아니라, Google, IBM 등의 기업들도 해당 솔루션 개발에 박차를 가하고 있는데, Google은 이런 AI RFP 도구를 사용해서 매년 수천 시간의 영업 인력의 시간을 절약할 수 있을 것으로 보고 있습니다. 업계는 해당 도구의 출현을 전반적으로 환영하고 있습니다. RFP라는 고된 작업에서 해방될 수 있다는 점에서 많은 영업 직원들도 이런 기술의 도입을 반기는 상황인데요. RFP를 누군가 대신 써주길 바랬던 영업 사원이 어디 한둘이랴. 이제야 대리인을 찾았다. (이미지 출처)   할루시네이션을 극복하라   기업 영역에서의 할루시네이션을 어떻게 극복할 것인지는 해당 도구의 신뢰성에 가장 큰 영향을 주는 요소입니다. 이런 문제를 해결하기 위해 최근에 RAG (Retrieval Augmented Generation) 즉, <검색 증강 생성> 이라는 기술이 적용되고 있습니다. 신뢰성 있는 데이터를 검색할 수 있는 검색도구와 GPT-4를 결합하는 방식으로 구현이 되는데요. 강력한 검색 도구는 회사 내부의 기술 문서와 기타 자료들에서 가장 신뢰성 있는 데이터를 추출해 냅니다. 추출된 데이터를 기반으로 GPT-4를 활용하여 명확하고 전문적인 어조로 문서를 만들어내는 방식이 바로 RAG 입니다. RAG 를 이용하는 것이 특정 도메인의 LLM 을 새롭게 학습하거나 튜닝하는 작업보다는 훨씬 저렴하다고 알려져 있습니다.   하지만 Generative AI를 RFP 분야에 적용하는 것이 장점들만 있는 건 아닙니다. 진짜 눈이 어지럽다. 할루시네이션이다. (이미지 출처)   문제점들   Generative AI를 이용한 RFP 업무 도구가 도입되었을 때 일어날 수 있는 문제는 다양합니다. 먼저 실제적으로 최종적인 RFP 완성과 제출과 같은 사업 관리 프로세스에서 담당자가 얼마나 깊이 참여하도록 할 것인지 입니다. 결국 경쟁자들 역시 같은 도구를 사용하게 되면 무슨 차별화가 있을 것인가 하는 문제이고, 결국 담당자의 개입이 적극적으로 필요해지는 상황이 역설적으로 발생합니다. 또 다른 문제는 RFP 평가 역시 AI에 의지하게 되리나는 점입니다. 제안과 심사 모두 AI에 의해 좌우된다면 궁극적으로 AI의 효용성은 어디에 있는 것까요? 사실 가장 큰 이슈는 인력 고용의 문제입니다. T사는 2022년 9월에 직원 11%를 해고했고, 올 2월에 추가로 17%를 해고했습니다. 기업의 효율성을 더욱 강조하는 기업은 결국 비용을 줄여나가는 방향으로 흘러가게 됩니다. 직원의 입장에선 무작정 반길 수만은 없는 일입니다. 19세기의 러다이트 운동이 21세기에 다시 불붙을 가능성은 언제나 있다.    그럼에도 불구하고   비즈니스에 최적화된 Generative AI가 기업의 영업 업무의 효율성을 극대화할 것은 명백합니다. T사의 추정에 따르면 RFP 작업의 약 80%를 Generative AI 가 처리하고, 나머지 20%을 담당자가 마무리할 수 있다고 합니다. 결국 이런 혁신은 멈추지 않을 것이고, 해당 도구의 성능도 점점 향상될 것입니다. RLHF(Reinforcement Learning from Human Feedback) 방식은 인간의 피드백을 통한 강화학습을 일컫는 말입니다. 담당자의 피드백은 해당 도구의 성능을 더욱 개선시킬 것입니다. 단순히 성능 개선만을 의미하지는 않습니다. 기업 또는 담당자의 특성들이 더 반영되는 결과물을 기대할 수 있습니다. 이런 과정들을 통해 점점 더 효과적인 영업 보완 도구로서의 Generative AI의 성장이 이루어질 것입니다. 성과를 향상시키고자 하는 열망과 시도는 끊이지 않을 것이다. 어쩌면 참 피곤한 세상이다.      다시 한번 느낍니다. 제너럴리스트는 이제 설 곳이 없어 집니다. 자신만의 영역에서 스페셜리스트가 되는 길만이 살아 남는 방법입니다. 개인이든 기업이든 그렇습니다.   촌장 드림
85
0