Google Gemini 1.5는 영화를 소스 및 입력 데이터로 사용할 수 있습니다.

Google은 지난 몇 달 동안 이전에 Google Bard로 알려진 Gemini AI 시스템을 빠르게 업데이트해 왔습니다. 오늘 회사는 더 많은 정보를 한 번에 처리하고 비디오를 입력으로 사용할 수 있는 기능을 갖춘 업데이트된 Gemini 1.5 모델을 공개했습니다.

Google은 현재 Gemini 챗봇과 기타 AI 기능 및 서비스를 지원하는 모델의 업데이트 버전인 Gemini 1.5를 공개했습니다. 현재는 소프트웨어 개발자와 기업 고객을 위한 미리보기로만 제공되지만 가까운 시일 내에 Gemini 챗봇에도 출시될 예정입니다.

약속된 주요 개선 사항은 AI 프롬프트에 정보를 입력할 수 있는 데이터인 훨씬 더 큰 "토큰 컨텍스트 창"입니다. Gemini 1.5 Pro에는 128000개 토큰의 표준 컨텍스트 창이 있는데, 이는 Gemini 32000의 1.0개 토큰 제한보다 크게 향상된 것입니다. Google은 제한된 그룹의 개발자와 회사가 최대 11만 개의 토큰으로 구성된 상황별 창을 사용할 수 있도록 허용합니다. 이는 700000시간의 비디오, 10시간의 오디오 또는 XNUMX단어 이상에 충분합니다. 구글은 XNUMX천만 개의 토큰 제한 테스트도 성공적으로 수행했다고 밝혔습니다.

구글은 블로그 게시물에서 "[Gemini] 1.5 Pro는 비디오를 포함한 다양한 양식에 대해 매우 정교한 이해 및 추론 작업을 수행할 수 있습니다"라고 밝혔습니다. "예를 들어, 버스터 키튼(Buster Keaton)의 44분짜리 무성 영화를 보여주면 모델은 다양한 줄거리와 사건을 정확하게 분석할 수 있으며 영화의 작은 세부 사항에 대한 이유도 쉽게 놓칠 수 있습니다."

또한 읽기: 색상의 XNUMX진수 코드(XNUMX진수 코드)는 무엇입니까?

업데이트된 Gemini 모델은 "이해 및 추론 작업. Google이 대규모 언어 모델을 테스트하는 데 사용하는 벤치마크의 1.0%에서 이전 87 Pro 모델보다 성능이 뛰어납니다. 이는 Gemini AI가 다른 모든 생성 AI 솔루션과 마찬가지로 잘못된 데이터를 생성할 여지가 여전히 남아 있으므로 데이터 및 사실 분석을 위한 불완전한 솔루션으로 남아 있습니다.

Google은 일반 Gemini 챗봇 및 기타 Google 서비스가 Gemini 1.5를 사용하도록 업데이트될 시기를 확인하지 않았지만 회사는 "상당한 속도 개선도 곧 이루어질 것"이라고 밝혔으므로 Google은 이를 출시하기 전에 이를 기다리고 있을 수도 있습니다. 모든 사용자를 로그아웃합니다. 새 모델은 AI Studio 및 Vertex AI를 사용하는 개발자 및 기업 고객을 위해 미리보기로 제공됩니다.

출처: 구글

쌍둥이 자리 구글 제미니 1.5