수입만들기/블로그

인간 추월한 구글 인공지능 제미나이(Gemini) 공개

메라쎄 2023. 12. 8. 07:55
반응형

 

 

 

 블로그 

 

 

 

구글 인공지능 제미나이 발표

 

 

구글에서 첫번째 버전인 제미나이 1.0을 발표 했다. 제미나이는 구글이 개발한 언어 모델로 텍스트, 이미지, 오디오 등을 동시에 인식하고 이해할수 있다. 구글 측에선 벤치마크 점수에서 오픈AI의 GPT를 능가하는 점수를 보여줬다고 발표했다. 

 

 

제미나이의 종류는 세가지로 아래와 같은 모델이 존재한다. 

 

제미나이 울트라(Gemini Ultra) : 복잡한 작업에 유용하고 규모가 큰 모델

 

제미나이 프로(Gemini Pro) : 다양한 작업에서 확장하기에 가장 적합한 모델

 

제미나이 나노(Gemini Nano) : 온 디바이스 작업에 효율적인 모델

 

 

 

 

 

구글 제미나이 사용방법

 

구글의 인공지능 언어 모델인 바드에는 아직 제미나이가 적용되지 않았다.

 

구글은 바드에 제미나이를 적용할 계획을 가지고 있으며 제미나이가 적용되면 바드에서 텍스트, 이미지, 오디오를 동시에 처리할수 있게 될 것이다. 

 

 

 

바드에 적용되지 않은 제미나이를 미리 사용해 보려면 구글 클라우드 플랫폼을 사용해야 한다.  

 

구글 제미나이를 사용하려면 먼저 구글 계정을 만들어야 한다. 구글 클라우드 플랫폼 계정을 만들고 제미나이를 직접 코딩하여 사용해 볼 수 있다. 

 

구글 클라우드 플랫폼 계정 만들기

https://cloud.google.com/free

 

 

 

GCP 계정이 있으면 다음 단계에 따라 제미나이를 사용해 볼수 있다. 물론 직접 코딩해야하는 수고스러움이 있지만 먼저 써보려면 어쩔수 없이 시도해봐야한다. 

 

1. GCP 콘솔에 로그인.

2. 왼쪽 메뉴에서 AI Platform을 클릭.

3. Natural Language을 클릭.

4. Models 클릭.

5. Gemini 검색.

6. 사용 클릭

 

 

 

제미나이를 사용하기위해 모델 구성 방법

 

1.Models 페이지에서 Gemini를 클릭

2. Configuration 탭을 클릭

3. Model size에서 사용하려는 모델 크기를 선택

4. TPU를 선택

5. Create를 클릭

 

 

모델이 생성되면 Deploy를 클릭하여 배포한다. 모델이 배포되면 Predict 탭을 사용하여 제미나이를 사용할 수 있다.

 

Predict 탭에서는 아래의 정보를 제공한다.

 

Input: 제미나이에 제공할 입력 데이터 :  입력 데이터는 텍스트, 이미지, 오디오 등이 될 수 있다.

Output: 제미나이에서 생성할 출력 데이터 :  출력 데이터는 텍스트, 이미지, 오디오가 될수 있다.

 

Predict를 클릭하면 제미나이가 입력 데이터를 처리하고 출력 데이터를 생성한다.

 

 

 

 

 

 

 

 

제미나이의 성능은?

 

 

제미나이는 다양한 작업에서 최첨단 성능을 달성했다고 한다.

 

텍스트 이해: 제미나이는 MMLU 테스트에서 90.04%의 점수를 기록하여 전문가 인력보다 높은 결과를 기록한 최초의 모델이 되었다. (Chat GPT4.0 = 86.4%)

 

이미지 이해: 제미나이는 객체 문자 인식(OCR) 시스템의 도움 없이도 이전의 최신 모델보다 뛰어난 성능을 보였다.

 

멀티모달 추론: 제미나이는 고도의 추론 능력이 요구되는 다양한 영역에 걸친 멀티모달 작업으로 구성된 새로운 MMMU 벤치마크에서 59.4%의 최상위 점수를 획득했다.

 

이 멀티 모달 추론은 수학, 물리학, 역사, 법률, 의학, 윤리 등 50여개 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 테스트다. 제이나미는 인간 전문가 점수인 89.8%를 넘은 최초의 인고지능 모델이라고 밝혔다. 

 

 

 

 

 

관련기사 바로가기

 

입이 떡…첫 인간 추월 AI, 구글 ‘제미나이’ 공개

“물보다 밀도가 작은 고무로 만든 오리군요.” “오른쪽 자동차가 공기저항에 유리해 더 빨라요.” 지금까지 나온 인공지능(AI) 모델 가운데 사람에 버금가는 가장 높은 성능의 대규모 언어모

www.seoul.co.kr

 

 

 

 

 

제미나이 활용법

 

 

제미나이가 다양한 데이터 유형을 처리할수 있다는 것은 많은 가능성을 열어 놓고 있는 것이다. 제미나이의 멀티모달 기능을 활용하면 블로그, 영상 만들기, 다양한 자료의 정리 등과 같은 곳에 활용할 수가 있다. 

 

 

이미지 설명 및 생성: 제미나이는 이미지를 분석하고 설명할 수 있다. 또한, 사용자가 특정 시나리오를 설명하면 그에 따라 이미지를 생성할 수도 있다.

 

비디오 콘텐츠 분석: 제미나이는 비디오 클립을 분석하고, 그 내용을 설명하거나, 특정 장면이나 캐릭터에 대한 정보를 제공할 수 있다.

 

멀티미디어 학습 자료 생성: 제미나이는 텍스트, 이미지, 오디오, 비디오 등 다양한 형태의 학습 자료를 생성할 수 있다. 이를 통해 보다 풍부하고 다양한 학습 경험을 제공할 수 있습니다.

 

멀티미디어 콘텐츠 검색: 사용자가 특정 이미지나 비디오 클립을 기반으로 정보를 검색하려고 할 때, 제미나이는 해당 멀티미디어 콘텐츠를 분석하고 관련 정보를 찾아낼 수 있다.

 

 

 

 

제미나이는 AI의 미래를 열어놓는 흥미로운 기술이다. 모델은 종전의 인공지는 모델과는 다르게 텍스트, 이미지, 오디오, 비디오 등 다양한 데이터 유형을 처리하는 능력을 가지고 있어, 이전의 AI 모델들이 가진 한계를 넘어서는 새로운 가능성을 제시하고 있다.

 

 

제미나이의 등장은 AI 기술의 발전과 그 활용 분야가 얼마나 넓어질 수 있는지를 보여주는 중요한 단계처럼 보인다. 이러한 발전은 우리가 정보를 찾고, 학습하고, 소통하는 방식을 완전히 바꿀 수 있다.

 

제미나이는 우리 생활에 더 가깝게 AI가 들어오고,  미래엔 아이언맨의 토니스타크가 '자비스' 에게 많은 일을 시켰듯이, AI가 여러 분야를 구현하는 데 중요한 역할을 하게 될 것이다.

반응형