«Алиса» в «Яндекс Браузере» получила навык интерпретации картинок — от иллюстраций в статьях до фото товаров и постов в соцсетях. Голосовой ассистент формирует короткое описание и, по запросу, добавляет детали: цвет, крой, посадку, композицию кадра.
В основе функции — мультимодальная нейросетевая модель, которая анализирует и текст, и изображение целиком. Она не только распознаёт отдельные объекты, но и понимает контекст сцены, связи между элементами и их смысл, благодаря чему выдаёт лаконичные и осмысленные подписи.
Получить описание можно через пункт «Описать картинку» в контекстном меню или с панели поверх изображения — либо просто навести фокус программы экранного доступа. Если экранный доступ включён, «Алиса» создаёт подписи лишь для тех картинок, на которые пользователь может нацелить фокус. Описание можно не только прочитать, но и прослушать.
Управление находится в настройках «Браузера» в разделе «Специальные возможности». Разработчикам сайтов напоминают о важности доступности: корректная разметка элементов интерфейса позволяет людям с нарушениями зрения быстрее получать описания и ориентироваться на странице.
В «Яндекс Браузере» доступны и другие инструменты доступности — режим чтения убирает лишнее со страницы, тёмная тема и масштаб интерфейса облегчают работу с мелким шрифтом, в мобильной версии «Умная камера» помогает распознавать печатные тексты и предметы.







