Новости СМИ2

Последние новости


10:35
Глава «мусорной» госкомпании стал кандидатом на пост замминистра
12:27
Посол заявил об использовании Россией доходов от западных активов
13:00
Фиксированный сервисный сбор в «Яндекс Маркете»
09:30
Госдума может запретить звонки и сообщения с незнакомых номеров в мессенджерах
17:00
Роскомнадзор может с марта 2025 года запретить публиковать статистику по VPN
15:08
Sony показала, какими будут игры и консоли через 10 лет
15:00
Россиян будут массово обучать использовать нейросети
11:30
СПБ Биржа опровергла сообщения о подаче документов на банкротство
09:30
Почти 500 тысяч жителей Крыма остались без света из-за шторма
15:30
Минсвязи Израиля договорилось с Маском о работе Starlink в секторе Газа
08:00
Цифровой рывок
18:37
Страховщики назвали регионы с самой высокой долей риска по ОСАГО
22:06
Сенаторы одобрили поправки в закон о выборах президента России
22:42
Депутаты готовят поправки в ПДД для электросамокатов
18:53
Арт-подсчет
17:55
Десятый пакет санкций Евросоюза предусматривает ограничения на 10 млрд евро
09:44
Ученые выдвинули новую версию происхождения коронавируса
17:06
Коронавирусное перемирие
15:36
Цифровой саммит G20
11:20
В США разработан план борьбы с коронавирусом без закрытия предприятий
08:28
Когда пандемии придет конец?
08:28
FT: уровень смертности от коронавируса остается загадкой
00:59
Книги
22:23
Драматургия на повышенных тонах
20:14
Музыка
20:14
Кинотоннель Вавилон-Берлин
20:13
Большая байкальская уборка
20:11
По неведомым дорожкам
20:10
Норильск очень чистый
20:05
Начало континентального первенства сулит испытания властям Франции
Больше новостей

Фоторобот


CBIR – это технология компьютерного зрения, которая помогает искать картинки, полностью идентичные с загруженной человеком. Впрочем, важно понимать, что, в отличие от поиска по словам, это новшество не будет таким популярным. По-хорошему, сервис по поиску изображений будет необходим не чаще раза в неделю, а то и в месяц. Зачем человечеству поиск по картинкам, «РР» выяснял у Александра Крайнова, руководителя технологий компьютерного зрения компании «Яндекс».

Зачем вообще нужно осваивать «Сибирь»?

Один из частых сценариев: человеку нужно узнать, что за «зверь» на картинке. Или нельзя узнать ученого по фотографии. Другой случай: для презентации вам нужна точно такая же картинка, но в другом качестве. «Сибирь» поможет найти картинку большего разрешения и, что довольно часто требуется, без логотипов.

Технология также может быть полезна, если вы заинтересуетесь фотографией конкретного офисного стула из неизвестного вам каталога. Сервис покажет, на сайтах каких интернет-магазинов опубликован снимок.

Что происходит с картинкой после ее загрузки?

Для пользователя все выглядит просто: заходишь в «Яндекс.Картинки», загружаешь изображение или даешь на него ссылку – решаешь свою задачу. Например, узнаешь, что или кто на ней изображен. С точки зрения технологий это очень сложная задача. За считанные доли секунды поисковая машина превращает картинку в набор так называемых «визуальных слов».

«Визуальные слова» – это удобные для поиска численные представления ключевых точек изображения. Что интересно, цвет картинки не имеет значения – технология «видит» черно-белые тона. После этого машина выбирает среди десятков миллиардов картинок интернета те, где встречаются те же самые «визуальные слова». И отбирает идентичные.

Сколько времени потребовалось на разработку «Сибири»?

Сложно подсчитать. Мы запустили проект пару недель назад – 9 сентября. Впрочем, от разговора: «Круто бы сделать такую вещь, а давайте попробуем» – прошло около двух лет. При этом запуску «Сибири» очень помогли предшествующие разработки. Мы используем технологии компьютерного зрения в разных проектах больше пяти лет. Но этот запуск – наиболее сложный с точки зрения технологий.

Есть ли связь между появлением поиска и популярностью соцсетей, где главное сообщение – это картинка?

Прямой связи нет, однако есть довольно много сценариев, когда поиск по похожим картинкам может быть полезен для пользователей социальных сетей. Например, можно проверить, настоящую ли фотографию разместил пользователь на страничке. Если это фотография селебрити, она с большой степенью вероятности найдется. Другой случай: кто-то опубликовал фотографию достопримечательности, но не указал источник. Поиск по фотографиям поможет найти сайты, где опубликован снимок. В принципе в будущем возможно захватывать контент «Инстаграма» и «Тумблера». Сложностей в плане технологий здесь нет.

Сейчас актуальна тема «пиратства». Депутаты приняли запрет на распространение видео, на очереди – тексты и аудио, а с помощью технологии можно выявить нарушения авторских прав по изображениям?

Нет, мы можем показать, кто первый опубликовал картинку в интернете. Однако автор мог выложить фотографию в интернет позже других, поэтому очередность – это недостаточная информация. Устанавливать правообладателя по размеру изображения также некорректно – выложить картинку в хорошем качестве может кто угодно.

Где еще используются технологии компьютерного зрения?

Прежде всего, расскажу, где используется в «Яндексе». Для нас, например, интересный опыт был в Турции, когда мы снимали города для «Яндекс.Панорам». Местное законодательство запрещает публикацию лиц и номеров автомобилей в интернете, и нам пришлось разрабатывать свою систему детектирования, что оказалось непростой задачей. Как показывают исследования, мы можем узнать знакомого на очень маленькой картинке – размером всего 14х14 пикселей. При этом ни одно лицо не должно было быть видным на этих «Панорамах». С машинами также была своя специфика. Кроме того, при фотосъемке «Панорам» номера автомобилей располагаются под разными углами, что осложняло задачу.

Стоит понимать, что компьютерное зрение используется в самых разных отраслях, например, в медицинской сфере – рентгенографии. Благодаря машинному анализу изображения можно обнаружить различные патологии. Также этим технологиям нашли применение в геологоразведке и биологии.

Постепенно мы будем развивать способности к обобщению, например, находить не просто такую же картинку, а другое изображение, содержащее такой же объект. Например, автомобиль на постере к премьере фильма. В эту сторону сейчас смотрит вся наука и индустрия распознавания

Насколько сервис может быть полезен для распознавания лиц?

Детектор лиц используется и в других сервисах компании, например, для фильтра по портретам в «Яндекс.Картинках». Он позволяет оставить в выдаче только лица крупным планом. Или в «Яндекс.Фотках». Там у нас работает не только детектор, но и распознавание лиц. Это помогает пользователям отмечать друзей на изображениях.

Сейчас уже можно оценить, какой отклик у пользователей получил запуск сервиса?

Пока рано обобщать результаты! Сейчас пользователи больше «пробуют» сам сервис – ищут похожие картинки по известным местам, людям. И пока это больше «фан», нежели решение конкретных практических задач.

Постепенно мы будем развивать способности к обобщению, например, находить не просто такую же картинку, а другое изображение, содержащее такой же объект. Например, автомобиль на постере к премьере фильма. В эту сторону сейчас смотрит вся наука и индустрия распознавания.

Можно ли назвать поиск по видео и музыке новым вызовом для компьютерного зрения? По стоп-кадру можно понять, о какой ленте идет речь? Или видеопоиск приведет к нагрузке на сайт, схожей с DDOS-атакой?

Поиск по статичной картинке из видео возможен, но требует больших инфраструктурных затрат. Что касается музыки, мобильное приложение «Яндекс.Музыка» уже умеет искать по фрагменту композиции, но это другая технология.

Весной китайский Baidu анонсировал вслед за американцами запуск технологии наподобие очков Google Glass. По их словам, это гарнитура с LCD-дисплеем, который будет распознавать лица и делать поиск по картинкам. В чем же отличие Google Glass и подобных от «Сибири»?

Проект очков – это не средство распознавания. Это дисплей и камера, изображение с которой через Bluetooth передается на телефон, а с него – на сервер. Потом по той же цепочке обратно.

Многие проекты, занятые поиском изображений, были закрыты из-за маленького фотобанка. Стратегическое преимущество, как я понимаю, – это «Яндекс.Картинки», ими каждый месяц пользуется более 30 млн человек. В чем еще уникальность «Сибири», если сравнивать с сервисами конкурирующих компаний – Google и TinEye?

Все-таки не совсем корректно говорить о том, что компании конкурируют между собой, скорее, есть общие глобальные вызовы. С точки зрения пользователя, мы практически ничем не отличаемся. Пользователь загружает интересующую картинку, а поисковая система находит такие же картинки в интернете. Для пользователя заметны разве что отличия в интерфейсах. Основные различия – в используемых технологиях. При этом сравнивать полноту поиска довольно тяжело: какие-то изображения ищет лучше один поисковик, другие – другой.

Baidu, например, меньше находит «наши» картинки. При этом вполне возможно, что Baidu лучше ищет картинки, которые загружают китайские пользователи. Из мировых компаний нельзя не отметить Microsoft и Google – они уделяют компьютерному зрению очень много внимания. При этом компьютерное зрение – это настолько передовая область, что правильнее говорить не о конкуренции, а об одинаково сложных вызовах.

Материал опубликован на сайте «Русский репортер»