Браузер: описание изображений в Яндекс Браузере

Общая информация

Всем привет! Меня зовут Всеволод Попов, и сегодня мы будем говорить с вами об описании изображений в Яндекс Браузере. Эта функция позволяет получать описание изображений на веб‑страницах.

Описание генерируется при помощи нейросети Алиса AI и доступно в кратком и подробном вариантах.

Функция работает на всех платформах со всеми популярными скринридерами: с JAWS, NVDA для Windows, TalkBack для Android и VoiceOver для iOS и macOS.

В этой инструкции я расскажу и продемонстрирую, как она работает под Windows и Android.

Когда может быть полезна функция описания изображений и чем она может быть интересна?

Мне, например, интересно смотреть обложки альбомов моих любимых исполнителей в веб‑версии Яндекс Музыки. Им там даётся описание, поскольку они представлены в качестве изображений.

Или функцию можно использовать при выборе товаров, чтобы получить примерное описание того, как они выглядят.

Она также может быть полезна, если вы хотите снять или купить квартиру. На странице с информацией о недвижимости всегда имеются изображения комнат, и вы можете получить примерное представление о них благодаря описанию.

В самом начале я упомянул, что имеется два варианта описания изображений: краткое и подробное. Краткое доступно всегда. Подробное нужно получать по запросу для каждого изображения через его контекстное меню.

Описание изображений включается в разделе «Специальные возможности» настроек браузера.

Но в случае с iOS, macOS и Windows после установки и авторизации в браузере при помощи учётной записи Яндекс ID может появиться приветственный диалог, в котором будет приведена краткая информация о функции с кнопкой «Понятно». При нажатии кнопки функция включится. Такие диалоги появляются, когда в Яндекс Браузер внедряют новые возможности.

Демонстрация описания изображений будет проводиться на следующих операционных системах и с использованием скринридеров: Windows 11, Яндекс Браузер версии 26.3.0.2120, NVDA 2025.3.3, синтезатор RHVoice с голосом «Елена» и Android — на устройстве Google Pixel 9 (Android 16), TalkBack версии 16.2, Яндекс Браузер версии 26.3.1.115 и тем же синтезатором и голосом.

Перед демонстрацией скажу, что клавишу‑модификатор NVDA я буду называть NVDA. То есть, если я скажу NVDA+пробел, это значит, что NVDA — это ваша клавиша Insert или CapsLock в зависимости от вашей раскладки.

Начнём с Windows.

Настройки на Windows

Сейчас описание изображений в моём браузере выключено. Чтобы его включить, нужно отметить флажок генерации описания картинок в настройках специальных возможностей.

Посмотрим, как это сделать. Открываю меню браузера нажатием клавиши Alt.

Синтезатор речи (далее СР): Яндекс Браузер. Кнопка свёрнута. Настройки Яндекс Браузера.

Перехожу стрелкой вверх к пункту меню «Настройки» и активирую его нажатием Enter.

СР: Меню. Закрыть браузер. Настройки. Область. Настройки. Документ. Поиск. Редактор. Пусто.

Открылись настройки браузера. NVDA находится в редакторе поиска по настройкам в режиме редактирования. Настройки Яндекс Браузера — это веб‑страница, и по ней можно перемещаться абсолютно так же, как и по любому другому веб‑документу.

Например, можно перейти в режим обзора при помощи сочетания клавиш NVDA+пробел и перемещаться по всем настройкам при помощи стрелки вниз, либо перемещаться по заголовкам при помощи клавиши H, воспользоваться поиском по странице, имеющимся в NVDA, при помощи сочетания клавиш NVDA+Ctrl+F и так далее.

Можно также найти необходимую настройку в редакторе поиска по настройкам, в котором мы сейчас находимся. Так и сделаем. Нам нужно найти описание изображений. Для этого напишу «описан.»

СР: О. П. И. С. А. Н. Найдено пять совпадений.

И перейду в режим обзора NVDA при помощи сочетания клавиш NVDA+пробел, чтобы впоследствии изучить результаты поиска. Теперь перехожу к заголовку «Специальные возможности» и при помощи стрелки вниз изучаю представленные настройки.

СР: Инструменты. Область. Инструменты. Заголовок уровень 2. Специальные возможности. Область. Заголовок уровень 3. По щелчку флажок не отмечен: генерировать описание картинок при их озвучивании.

Этот флажок нам нужен, мы его отмечаем.

СР: Отмечено.

Переходим к следующему флажку.

СР: По щелчку флажок не отмечен: показывать кнопку описания картинок.

Этот флажок включает и выключает показ кнопки описания картинки на панели с картинкой, которая становится доступна при наведении мыши на неё.

Пользователям скринридеров этот флажок отмечать не обязательно. Мы будем получать краткое описание изображения автоматически при наведении фокуса скринридера на него, а подробное — с помощью пункта «Описать картинку» в контекстном меню изображения.

На этом настройка завершена. Заданные настройки сохраняются автоматически. Вкладку можно закрыть при помощи сочетания клавиш Ctrl+W.

Использование функции на Windows

Посмотрим, как функция работает на практике. Я нахожусь на странице с товарами и перемещаюсь по изображениям при помощи клавиши G.

СР: По щелчку конструктор «Город в деталях. Встречайте робота‑доставщика» от Яндекс, 320 деталей. Кажется, это на изображении представлен робот с четырьмя колёсами и логотипом Яндекс. Рядом находится коробка с изображением робота и природы. Графика. Ссылка.

Это описание изображения. Оно начинается со слов «Кажется, это на изображении».

СР: Футболка. Кажется, это на изображении мужчина в тёмно‑зелёной футболке и джинсах. Фон светлый. В верхнем правом углу логотип. В левом — надпись «Придумано в Яндекс Фабрике». Графика. Ссылка. Портативная колонка. Мощность 5 Вт. Влагозащита. Светло‑голубой. Кажется, это на изображении показан серый круглый умный динамик с логотипом на боковой стороне. Фон светлый, с тенью от динамика. Графика. Ссылка.

Здорово! Так можно получить примерное представление о товаре перед покупкой. Это короткое описание изображений, но в Яндекс Браузере есть ещё и подробное.

Для его активации нужно вызвать контекстное меню на изображении и выбрать пункт «Описать картинку». Но здесь есть одна задача — вызвать контекстное меню изображения.

Для этого нужно навести на него курсор и открыть контекстное меню.

Для решения этой проблемы было создано дополнение для NVDA «Показать контекстное меню» — Show Context Menu. Оно позволяет вызвать контекстное меню на изображении в фокусе при помощи сочетаний клавиш NVDA+Shift+F10 или NVDA Applications.

Дополнение доступно в официальном магазине дополнений NVDA.

Давайте его установим. Открываю меню NVDA, перехожу в меню «Сервис» и далее в «Магазин дополнений».

СР: Меню. Параметры под меню T. Сервис под меню Р. Просмотрщик, просмотр магазина дополнений.

Открылся магазин дополнений. Нам нужно перейти на вкладку «Доступные дополнения».

Для этого нажимаю Shift+Tab для перехода к списку вкладок и стрелкой вправо выбираю нужную.

СР: Доступные дополнения, вкладка выделена.

Всеволод Попов: Теперь клавишей Tab перемещаюсь к полю поиска.

СР: Поиск, редактор. Пусто.

Всеволод Попов: И пишу слово «Показать».

СР: П. О. К. А. З. А. Т. Мягкий знак.

Всеволод Попов: Tab.

СР: Доступные дополнения. Список.

Сейчас дополнение отфильтровано по введённому запросу. В списке нам нужно найти дополнение «Показать контекстное меню». Это можно сделать, перемещаясь стрелкой вниз.

СР: Показать контекстное меню. Состояние: доступно. Доступная версия 1.0. Канал: стабильный.

Для установки дополнения открываю его контекстное меню клавишей Пробел.

СР: Контекстное меню.

И выбираю пункт «Установить».

СР: Установить.

Проверяю, установилось ли дополнение. Нажимаю NVDA + стрелка вверх для произнесения текущей строки. В раскладке ноутбука это сочетание клавиш NVDA + L.

СР: Показать контекстное меню, состояние: загружен, ожидает установки доступной версии 1.0.

Всё. Дополнение загрузилось и ожидает установки. Теперь нам нужно перезагрузить NVDA, чтобы оно установилось. Для этого перехожу к кнопке «Закрыть» при помощи клавиши Tab и активирую её при помощи Пробела или Enter.

СР: Закрыть, кнопка. Нажата. Установка, перезагрузка.

Открылся диалог перезагрузки NVDA с кнопками «Да» и «Нет». Нажимаем на кнопку «Да», и NVDA перезагружается.

Скринридер перезагружен, дополнение установилось. Я вернулся на страницу с товарами и теперь пробую вызвать подробное описание изображений. Перехожу к изображению при помощи клавиши G.

СР: Кажется, это на изображении маленький рыжий котёнок в блестящем серебристом платье. Котёнок стоит на задних лапках. Передние лапки вытянуты вперёд. Графика, ссылка.

Открываю контекстное меню изображения нажатием сочетания клавиш NVDA + Shift + F10.

СР: Контекстное меню изображения открыто.

И ищу элемент «Описать картинку».

СР: Исследовать элемент. Показать меню группы. Показать меню вкладки. Распознать текст. Перевести картинку. Описать картинку.

Нажимаю Enter.

СР: Диалог. Группа. На изображении маленький рыжий котёнок в блестящем серебристом платье. Котёнок стоит на задних лапках. Передние лапки вытянуты вперёд.

Это короткое описание изображения, которое мы только что слышали, когда переместились к нему. Изучим диалог и посмотрим, что тут есть.

СР: Информация, кнопка.

Эта кнопка открывает страницу помощи с информацией об описании изображений в Яндекс Браузере.

СР: Закрыть, кнопка. Подробнее, кнопка. Озвучить, кнопка.

Кнопка «Озвучить» позволяет озвучить описание при помощи Алисы.

СР: На изображении маленький рыжий котёнок.

Озвучивает. Теперь давайте нажмём на кнопку «Подробнее» и узнаем, что же там за котёнок.

СР: Подробнее, кнопка. На изображении изображён маленький рыжий котёнок с пушистой шерстью. Стоит на задних лапках, передние лапки слегка приподняты, как будто он танцует или собирается сделать шаг. На котёнке надета блестящая серебристая одежда, похожая на платье или накидку, которая переливается на свету. Фон изображения тёмный, с синеватым оттенком, что создаёт контраст с ярким цветом котёнка и его одежды. В целом изображение создаёт весёлое, игривое настроение.

Действительно, довольно милое изображение, которое вызывает улыбку. Обратите внимание, что на данный момент краткое и подробное описание изображений в этом диалоге можно прослушать только один раз.

Если вы хотите повторно прослушать описание, можно воспользоваться дополнением Speech History, с помощью которого можно просматривать историю речевых сообщений NVDA и копировать их в буфер обмена при необходимости.

Также для повторного прослушивания описания можно воспользоваться просмотрщиком речи NVDA.

На этом демонстрация описания изображений под Windows заканчивается, и мы переходим к Android.

Настройки на Android

Чтобы включить описание изображений в браузере под Android, необходимо перейти в его настройки.

Для этого нужно нажать на кнопку «Меню» в новой вкладке или, если какая‑то вкладка уже открыта, нужно нажать на кнопку «Меню браузера» и там выбрать пункт «Настройки».

СР: Кнопка «Меню». Кнопка «Настройки».

Здесь необходимо найти заголовок «Специальные возможности». Он находится перед заголовком «Инфо». Выбираю детализацию по заголовкам и перемещаюсь к нему.

СР: Заголовки. Специальные возможности. Заголовок 77 из 83.

И перемещаюсь по элементам после заголовка.

СР: Показывать кнопку описания картинок. Выкл. Переключатель. Выкл.

Этот флажок нам нужен, чтобы получать подробное описание изображений. Если его не отметить, пункта «Подробное описание изображения» в контекстном меню не будет.

СР: Генерировать описание картинок при их озвучивании. Выкл. Переключатель. Выкл.

Этот флажок нам нужен, чтобы при попадании фокуса на картинку его описание генерировалось и автоматически озвучивалось. Настройки применяются автоматически, и их можно закрыть при помощи кнопки или жеста «Назад». На этом настройка завершена. Можно переходить к использованию.

Использование функции на Android

Я нахожусь на странице с информацией о недвижимости, и здесь имеется множество изображений квартиры, на описание которых можно посмотреть. Перемещаюсь к одному из них.

СР: Кажется, это комната с кроватью, покрытой бордовым пледом, с подушками. На стене полка с растениями. Есть книжный шкаф, картины, светильники, уютная и светлая атмосфера.

Это короткое описание. Чтобы вызвать подробное описание изображений, необходимо нажать дважды с удержанием на нём, и откроется контекстное меню. Если контекстное меню не открывается, попробуйте развернуть изображение на весь экран при помощи нажатия дважды одним пальцем.

Давайте на всякий случай сделаем это перед открытием контекстного меню. Изображение развернулось на весь экран. Теперь мне нужно переместиться к нему и открыть контекстное меню.

СР: Кажется, это комната с кроватью, покрытой бордовым пледом, с подушками. На стене полка с растениями. Есть книжный шкаф, картины, светильники, уютная и светлая атмосфера.

Теперь открываю контекстное меню нажатием с удержанием одним пальцем.

СР: Яндекс Браузер.

Контекстное меню открылось. Ищем пункт «Подробное описание изображения».

СР: Подробное описание изображения. Кнопка. Коснитесь дважды, чтобы активировать.

И активирую его.

СР: Яндекс Браузер.

Открылся диалог, состоящий из двух элементов. Первый — подробное описание изображения. Второй — кнопка «Озвучить описание», которая позволяет озвучить его с помощью Алисы, так же как в Windows.

Переместимся к подробному описанию.

СР: Описание картинки сделано Алисой. На изображении представлена уютная спальня с кроватью, застеленной тёмно‑бордовым покрывалом и украшенной подушками разных цветов. Над кроватью висит полка с зелёными растениями и декоративными элементами. Справа от кровати находится стена с узором в виде кругов, на которой висит картина с изображением детей. Слева от кровати стоит небольшой круглый столик с зелёной скатертью. Рядом с ним находится книжный шкаф с книгами и декоративными элементами. В комнате также есть два подвесных светильника, которые освещают пространство. В углу комнаты стоит небольшой круглый столик. В комнате много света, создающего уютную атмосферу.

Таким образом можно получить представление о квартире, которую вы, возможно, собираетесь купить или снять.

Перейдём к кнопке «Озвучить описание» и нажмём на неё.

СР: Озвучить описание. Кнопка. На изображении представлена уютная спальня с кроватью.

Описание озвучивается. Так вы можете получать краткое и подробное описание изображений под Android. Описание изображений под iOS работает точно так же, как под Android.

Заключение

На этом демонстрация описания изображений в Яндекс Браузере подходит к концу. Надеюсь, функциональность будет как минимум интересной, а как максимум полезной для ваших задач. Ведь действительно интересно узнать, что изображено на картинке.

С вами был я, Всеволод Попов. До новых встреч.