수입만들기/블로그

영화 HER 현실판, GPT-4o 사용법은?

메라쎄 2024. 5. 17. 10:53
반응형

ChatGPT의 새로운 모델 GPT-4o

 

 

 

GPT-4o의 알파벳 o는 모든 것이라는 뜻의 Omni에서 나왔다. 사용자와 실시간으로 대화가 가능하며, 대화 상대의 감정을 인식하고 상황에 맞는 감정적인 대응도 가능하기에, 농담, 노래를 부를 수도 있다.

 

또한 기존에는 질문을 듣고 처리하는 딜레이가 있었지만, 새로운 모델은 즉시 말하기가 가능하다, 심지어 사용자의 말이 끝나기 전에 끼어들기까지 한다. 

 

텍스트, 오디오, 이미지를 동시에 입력받아 처리할수 있고, 출력도 가능하다. 

 

 

새로운 GPT - 4o 의 주요 기능

 

음성인식 + 텍스트 인식 + 이미지 인식 기능이 통합되어 여러 가지를 활용하여 질문이 가능해졌고, 답변받을 수 있게 되었다.  더 강력해진 멀티모달 모델을 바탕으로, 실제 인간과 대화하는 느낌을 느낄 수 있다. 

 

텍스트의 이미지 구현

기존에도 텍스트를 바탕으로 이미지를 생성해 주는 AI는 많이 존재했다. 하지만 새로운 GPT는 기존에 나와있는 이미지 구현 AI들을 뛰어넘는 최강의 기능을 가지고 있다. 

 

또한 사진을 인식하고, 그 사진을 바탕으로 새로운 이미지를 창조해 내는 기능도 가지고 있다. 예를 들어 내 사진을 찍어 업로드하고, 초상화로 그려달라거나, 캐리커쳐로 변환해 달라는 명령도 수행할 수 있다. 

 

 

GPT- 4o vs GPT- 4 

 

 새로 나온 모델인 GPT-4o의 성능이 월등히 뛰어나다고 OpenAI는 밝혔다. 

 

추론능력, 음성자동인식능력, 음성번역능력등 다양한 분야에서 기존 GPT 보다 월등한 성능을 보였다.

 

거기에 더해 GPT-4 터보에 비해 2배나 빠른 처리 속도를 보였고, 써주는 글의 양도 5배나 많았다. GPT-4o는 무료 사용자에게도 텍스트 및 이미지 기능을 제공한다. 

 

 

 

실시간 통역 영상

 

 

 

 

비꼬는 말투로 말하는 영상

 

 

 

 

GPT-4o 활용방법

 

무궁무진한 활용방법이 있겠지만 대표적인 몇 가지를 소개한다. 

 

실시간 화상 대화 기능 : 실제 영상통화 하듯 카메라로 본인을 비 춘 상태에서 챗GPT와 실시간 대화가 가능하다.

이 기능을 활용하여 영어 연습, 말하기 연습 등을 하고 피드백을 받을 수 있다. 

 

거기에 더해, GPT가 카메라에 비치는 모습을 파악하여 상황에 맞는 답변을 할 수 있다. 예를 들면, 생일 파티 현장의 모습일 경우, GPT가 이를 알고 생일 축하 노래를 불러주는 것이 가능하다. 

 

 

카메라로 문제집 풀어 달라고 하기 : 문제를 풀다가 막히는 부분이 있으면, 카메라로 촬영하며 실시간으로 풀이 방법을 도움 받을 수 있다. 과외선생님에게 지도를 받는 것과 동일하다. 사교육을 못 받는 학생들에게 큰 도움이 될 수 있다. 

 

 

실시간통역 : 외국에 나갔을 때 실시간으로 그 나라의 현지 언어를 실시간으로 통역받을 수 있다. 

반응형