Gemini
Год выпуска: 2023
Страна: США
Разработчик: Google DeepMind
Способ распространения: условно-бесплатный
Официальный сайт: gemini.google.com
Декабрь 2023 года стал периодом, когда Google представила модель искусственного интеллекта под названием Gemini, а в феврале 2024 года была выпущена обновленная версия — Gemini 1.5. Разработчики утверждают, что Gemini превосходит даже самую передовую модель искусственного интеллекта GPT-4.
Содержание:
- Что такое Gemini
- Что умеет Gemini
- Чем Gemini лучше GTP-4
- Как пользоваться Gemini
- Почему Gemini может ошибаться
Что такое Gemini
Gemini - это разработка компании Google DeepMind в области искусственного интеллекта. Она представлена в трех вариантах:
- Gemini Nano — доступна на смартфонах Google Pixel 8 Pro.
- Gemini Pro — на ее основе работает чат-бот Gemini (ранее известный как Google Bard). Этот вариант позволяет создавать тексты и изображения, задавать вопросы и проводить поиск информации. Размер контекстного окна составляет 32 тысячи токенов, что означает возможность передачи нейросети запроса объемом до 32 тысяч единиц информации. Единицей информации могут быть буквы, символы, слова, части слова, предложения и т.д.
- Gemini Ultra — это вершина развития модели, представляющая собой полноценную ИИ-модель с максимальным функционалом, конкурирующая с GPT-4.
Что умеет Gemini
Gemini Nano, находящийся на смартфоне Google Pixel 8 Pro, осуществляет краткие записи с диктофона, предлагает варианты ответов в переписках в WhatsApp, Line и KakaoTalk, а также обеспечивает лучшую защиту персональных данных от утечек.
Gemini Pro способен создавать разнообразные тексты, начиная от простых ответов на вопросы типа "Как дела?" и заканчивая компьютерным кодом на различных языках программирования. Кроме того, он распознает и описывает содержимое изображений, генерирует изображения и делает краткие резюме текстов.
Модель Gemini Ultra имеет возможность распознавать и анализировать тексты, изображения, аудио и даже видео, что пока не доступно GPT-4. Она также способна генерировать тексты и изображения. Вот некоторые примеры функций Gemini Ultra:
- Распознавание рукописного текста на изображениях;
- Проверка наличия ошибок в тексте и обоснование необходимости их исправления;
- Создание индивидуального интерфейса для каждой задачи, например, пошаговой инструкции с иллюстрациями для приготовления блюд;
- Генерация компьютерного кода, таблиц, разнообразных текстов и изображений;
- Ведение "осознанного" диалога с пользователем.
Gemini Ultra более точно отвечает на вопросы, понимает запросы пользователей, создает код на Python, решает сложные математические задачи и расшифровывает аудиозаписи.
Одним из основных преимуществ модели является ее взаимодействие с видео, позволяющее распознавать действия, предсказывать развитие событий и предлагать варианты развития событий, а также играть в игры, сравнивать предметы и предлагать иллюстрированные варианты использования.
Чем Gemini лучше GTP-4
Представители компании сообщили, что Gemini Ultra превзошла GPT-4 по 30 из 32 тестов. Google также опубликовала сравнительную таблицу по работе с текстом, в которой указываются преимущества Gemini перед GPT-4:
- Более точные ответы на простые научные вопросы по бенчмарку MMLU (Measuring Massive Multitask Language Understanding), который включает задачи по математике, истории США, информатике, праву и другим областям.
- Решение сложных для ИИ задач, что было подтверждено при тестировании Gemini с использованием набора задач BIG-Bench Hard (BBH), включающего 200 вопросов по рекомендации фильмов, решению логических и математических задач.
- Лучшее понимание текста, что подтверждено результатами бенчмарка DROP, разработанного для оценки точности ИИ-моделей в решении задач по пониманию текста.
- Более успешное решение алгебраических и геометрических задач.
- Улучшенная способность написания кода на Python, что было оценено с использованием бенчмарка HumanEval, оценивающего качество NLP моделей и их способность производить результаты, соответствующие человеческому восприятию.
Основные преимущества, выделенные разработчиками модели, включают большую гибкость Gemini, возможность работы без подключения к интернету и бесплатный доступ к продвинутым функциям, вероятно, на время тестирования.
Как пользоваться Gemini
Использование Gemini Nano возможно исключительно на смартфонах Pixel 8 Pro.
Gemini Pro предоставляется бесплатно в чат-боте Gemini, но для этого необходимо войти в аккаунт Google.
Gemini Ultra доступна в веб-версии на сайте Gemini Advanced и в приложениях для Android и iOS с тем же названием. Однако для ее использования требуется платить — $19,99 в месяц, с возможностью бесплатного двухмесячного пробного периода.
Почему Gemini может ошибаться
Сам генеративный ИИ и его возможности действительно поражают воображение, но следует помнить, что это совершенно новая технология. Gemini может допускать ошибки. Несмотря на то, что он постепенно улучшается, иногда может предоставлять неверную информацию или делать неприемлемые заявления.
Поэтому важно перепроверять информацию, полученную от Gemini. У него есть инструменты, которые помогают выявить потенциально неверные заявления. Один из них — кнопка Google, которая позволяет найти контент в Google Поиске для дополнительной оценки информации.
Однако при перепроверке утверждений Gemini также возможны ошибки. Например, может быть сообщено, что в Google Поиске найдены подтверждающие материалы, хотя на самом деле они противоречат ответам Gemini. Контент в интернете также может быть недостоверным, поэтому важно внимательно читать, проверять и тщательно оценивать контент, найденный при перепроверке, учитывая контекст.
Google оценивает отзывы о неправильных ответах, чтобы улучшить Gemini, поэтому в приложении предусмотрены функции отправки отзывов. Пользователи могут отмечать хорошие и плохие ответы, а также использовать кнопку для сообщений о нарушениях законодательства.