ChatGPT가 정보를 처리하는 방식은 이와 유사합니다. 웹에서 찾은 정보를 다른 유사한 단어를 사용하여 다시 포장하는 ChatGPT는 흐린 JPEG 로 생각할 수 있습니다. 정확한 내용이 아니라 있을 법한 근사치의 정보입니다. 하지만 이런 근사치의 정보가 텍스트 형식으로 제시되기 때문에 ChatGPT는 뛰어난 답변을 하는 것처럼 보이며, 흐린 JPEG 이미지를 보고 있지만 (명쾌한 문법을 통해) 마치 명확하게 보이는 것처럼 속이고 있는거죠. 이것이 바로 할루시네이션의 원리 입니다.
이러한 대형 언어 모델 (LLM)은 전통적인 검색 엔진을 대체할 수 있을까요?
웹의 정보를 최대한 압축하여 표현할 수 있는 ChatGPT의 성능을 생각한다면 놀랍기도 하지만 반면 중요한 부분들이 완전히 조작되었을 가능성을 배제할 수 없습니다. 그 결과에 얼마만큼의 진실인 정보가 포함되어 있고, 또 얼마만큼의 흐림(Blurry)이 포함되어 있을지 구분할 수 있는 방법이 반드시 제시되어야 할 것입니다.
대형 언어모델을 이용하여 웹콘텐츠를 생성하는 것은 좋을까요?
많은 콘텐츠 업체들이 AI를 이용하여 새로운 창작물들을 쏟아 내고 있습니다. AI가 이러한 웹 정보들을 이용하여 계속해서 학습을 진행해 나간다면 어떻게 될까요? 복사를 계속해서 반복해서 진행하는 것은 (손실 압축 방식을 이용해서) 정보의 퀄리티가 점점 낮아진다는 의미일 것입니다. AI 기업은 학습 데이터의 선별 과정과 정책 그리고 출력의 품질에 대한 신뢰를 어떻게 계속 향상시켜나갈 것인지의 고민을 계속해 나가야만 하고 개선할 것입니다.
대형 언어 모델이 원작의 작품성을 도와줄 수 있을까요?
Xerox 아트, 또는 사본 아트라는 장르의 예술이 있습니다. 기존 작품을 재해석하여 새롭게 창조하면서 원래의 작품을 더욱 흥미롭게 만들 수 있습니다. 이런 재해석의 흐림(Blurry)은 대형 언어 모델이 창작에 기여하는 긍정적인 것으로 생각할 수 있습니다.
|
아직 댓글이 없습니다. 첫번째 댓글 작성자가 되어주세요 :)