본문 바로가기
카테고리 없음

GPT-4와 GPT-3 특징과 비교 그리고 기능향상

by 콩북1 2023. 3. 16.
반응형

GPT-4와 GPT-3 특징과 비교

샘 올트먼 오픈AI 최고경영자(CEO)가 공개한 생성 인공지능 GPT-4를 설명한 자료이다.

GPT-4의 가장 큰 특징은 '멀티모달(multimodal)' AI라는 점이다. 멀티모달은 다양한 형태의 콘텐츠를 입출력에 활용할 수 있다는 의미다. GPT-3는 텍스트 데이터만 학습해 문자로 물어보면 문자로 답을 얻을 수 있었다. 반면 GPT-4는 이미지를 함께 학습했다. 오픈AI의 이미지 생성 AI인 '달리2' 처럼 텍스트를 입력하면 이미지를 만들어 주는 기능은 없다.

 

대신 이미지에 담긴 내용과 맥락을 이해해 텍스트 내용과 결합한 답변을 내놓는다. 예를 들어 GPT-4에 밀가루, 계란, 우유 등이 있는 사진과 함께 "이 재료들로 무엇을 만들 수 있을까"라고 질문하면 팬케이크, 와플, 프렌치토스트 등을 제시한다. 무거운 추에 풍선을 매단 사진을 업로드하고 "줄을 자르면 어떻게 될까"라고 물어보면 "풍선이 하늘로 날아간다"는 답을 준다. 그래프 내용을 분석해주기도 하고 유머 사진이 웃긴 이유를 설명하는 것도 가능하다.

기능향상

기본적인 답변 능력도 한층 발전했다. 고급 추론 기능을 갖춰 복잡한 질문에 답할 수 있다. 가령 세 사람의 일정표를 입력하고 이 들이 30분 동안 회의할 수 있는 시간을 알려줘라고 물었을 때 GPT-3.5 기반인 챗GPT는 잘못된 답을 제시했지만 GPT-4는 정확한 답을 내놨다.

 

오픈AI는 광범위한 일반 지식과 문제해결 능력 덕분에 어려운 문제를 더 정확하게 해결할 수 있다고 강조했다. 실제로 각종 시험에서 챗GPT보다 나은 성적을 거뒀다. 미국 변호사 시험에서 챗GPT는 213점으로 하위 10%에 그쳤지만 GPT-4는 298점으로 상위 10%에 포함됐다.

 

미국 대학 입학자격시험인 SAT 읽기 및 쓰기와 수학 시험에서도 상위 10% 수준의 성적을 기록했다. 한 번에 기억할 수 있는 단어 수도 대폭 늘었다. GPT-3.5는 한 번의 대화에 최대 8000 단어를 처리할 수 있지만 GPT-4는 최대 6만 4000 단어까지 처리할 수 있다.

 

수십 쪽짜리 논문을 입력하고 요약해 달라고 하는 게 가능하다는 의미다. 오픈AI는 안정성을 높였다는 점도 강조했다. 챗GPT는 질문에 틀린 답을 내놓는 환각 현상으로 논란이 되기도 했다. 오픈AI는 불법 행위와 관련한 요청에 응답할 가능성이 GPT-3.5 대비 82% 줄었고 사실에 입각한 응답을 하는 비율은 40% 높아졌다. 정말 빠르게 바뀌어가는 세상, 앞으로 챗GPT가 우리 삶에 어떤 변화를 줄지 긍정적인 마음을 가지고 기대를 해본다.

반응형

댓글