Ведущий научный сотрудник Google Джефф Дин сообщил об открытии публичного доступа к нейросети Gemini 1.5 Pro. Фирменная языковая модель справляется с широким спектром задач и, по заявлению её создателей, значительно превосходит по своим возможностям GPT-4.
Gemini 1.5 Pro первой смогла перешагнуть порог в миллион токенов за один запрос (примерно 700 000 слов). Нейросеть способна обработать до 11 часов аудио и до 1 часа видео в рамках одного запроса, считывая события, которые происходят в тексте и в кадре. ИИ умеет анализировать до 30 000 строчек кода и понимает, что изображено на фотографиях, определяя контекст и объекты.
Как утверждает Google, модель Gemini 1.5 Pro не только превзошла GPT-4 в 8,2 раза по размеру «контекстного окна», но и оказалась способна понимать информацию на всём его протяжении.
Доступ к нейросети сейчас предоставляется только в некоторых регионах на ограниченном количестве языков. Ознакомиться с «системными требованиями» Gemini 1.5 Pro можно по этой ссылке.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: