Gemini AI от Google: Конкурент GPT-4 с Уникальными Возможностями

Google представила Gemini, искусственный интеллект, созданный для соперничества с ChatGPT. Ориентированная на превосходство над GPT-4 в различных тестах, модель Gemini стала значительным шагом вперед в развитии ИИ, согласно высказываниям главы Google Сундара Пичаи. Её предстоящий запуск 13 декабря ожидается сильно повлиять на линейку продуктов компании Google.

Разнообразие Предложений: Gemini Nano, Pro и Ultra

Под общим названием Gemini Google представила несколько моделей искусственного интеллекта. Перед скорым запуском Gemini Pro, предназначенной для различных сервисов Google, включая чат-бота Bard, появилась модель Gemini Nano, специально разработанная для устройств на базе Android. Модель Gemini Ultra, объявленная самой мощной моделью LLM от Google, представляет интерес для центров обработки данных и корпоративных приложений.

Информация о Выходе и Доступе

Выход моделей Gemini, Pro и Nano запланирован на 13 декабря. Доступ к модели Pro будет организован через чат-бота Bard, а разработчики и корпоративные клиенты смогут воспользоваться Google Generative AI Studio или Vertex AI в облачной платформе Google Cloud. Отметим, что версия Bard на базе Pro не будет доступна в Великобритании и Швейцарии из-за координационных задержек. Ultra находится на стадии тестирования и ожидается лишь в 2024 году, возможно, с интеграцией в более усовершенствованную версию Bard под названием Bard Advanced.

Планы Расширения и Интеграции

Начально работающая только на английском языке, модель Gemini Google планирует расширить поддержку других языков в ближайшей перспективе. По словам Пичаи, модель будет плавно внедрена в поисковую систему Google, рекламные продукты, браузер Chrome и различные приложения.

Мультимодальные Способности и Производительность

Gemini обладает мультимодальными функциями и успешно обрабатывает текст, аудио, изображения, видео и код. Тесты Google между Ultra и GPT-4 подтвердили превосходство Ultra в 30 из 32 оценок производительности, включая рассуждения и распознавание изображений. Кроме того, модель Pro показала более высокие результаты по сравнению с GPT-3.5 в шести из восьми тестов.

Вехи и Будущие Развития

Ultra достигла важного успеха, превзойдя человека в многофункциональном тесте MMLU, охватывающем предметы от математики до этики. Её интеграция в AlphaCode2, предположительно превосходящий в тестах 85% человеческих программистов, является значительным достижением.

Особые Преимущества и Перспективы Роста

Главное преимущество модели Gemini заключается в её мультимодальности, что отличает её от отдельных моделей, специализирующихся на распознавании голоса или изображений. Google обещает постоянные улучшения в восприятии Gemini с целью более глубокого понимания и повышенной точности. Эти стремления совпадают с видением главы DeepMind Демиса Хассабиса, который предвидит, что Gemini приобретет больше «сенсорных» способностей, станет более осознанным, точным и в конечном итоге будет лучше понимать окружающий мир.