Новости СМИ2

Последние новости


13:00
Фиксированный сервисный сбор в «Яндекс Маркете»
09:30
Госдума может запретить звонки и сообщения с незнакомых номеров в мессенджерах
17:00
Роскомнадзор может с марта 2025 года запретить публиковать статистику по VPN
15:08
Sony показала, какими будут игры и консоли через 10 лет
15:00
Россиян будут массово обучать использовать нейросети
11:30
СПБ Биржа опровергла сообщения о подаче документов на банкротство
09:30
Почти 500 тысяч жителей Крыма остались без света из-за шторма
15:30
Минсвязи Израиля договорилось с Маском о работе Starlink в секторе Газа
08:00
Цифровой рывок
18:37
Страховщики назвали регионы с самой высокой долей риска по ОСАГО
22:06
Сенаторы одобрили поправки в закон о выборах президента России
22:42
Депутаты готовят поправки в ПДД для электросамокатов
18:53
Арт-подсчет
17:55
Десятый пакет санкций Евросоюза предусматривает ограничения на 10 млрд евро
09:44
Ученые выдвинули новую версию происхождения коронавируса
17:06
Коронавирусное перемирие
15:36
Цифровой саммит G20
11:20
В США разработан план борьбы с коронавирусом без закрытия предприятий
08:28
Когда пандемии придет конец?
08:28
FT: уровень смертности от коронавируса остается загадкой
00:59
Книги
22:23
Драматургия на повышенных тонах
20:14
Музыка
20:14
Кинотоннель Вавилон-Берлин
20:13
Большая байкальская уборка
20:11
По неведомым дорожкам
20:10
Норильск очень чистый
20:05
Начало континентального первенства сулит испытания властям Франции
19:59
Война объявлена, боевые действия отложены
19:56
Ямал — это не вахта
Больше новостей

Вместо мышки


На протяжении всей истории человечества информация была дефицитом и ценностью. Однако последние десятилетия заставляют менять отношение к ней. Данные накапливаются эксабайтами (1018 байт), охватывая все: от частоты пульса пользователей «умных» браслетов до снимков удаленных галактик, от расхода воды в каждой квартире до параметров ядерных реакторов. Согласно оценкам компании Cisco, к концу 2014 года только ежемесячный мобильный трафик данных в мире составил 2,5 эксабайт, к 2019-му он достигнет 24,3 эксабайт в месяц, а число подключенных мобильных устройств превысит 10 млрд единиц. На Facebook ежечасно загружается более 10 млн фотографий. На YouTube каждую секунду загружается более часа видео. По прогнозам IDC, к 2020 году общий объем цифровых данных достигнет 40 зеттабайт. Для понимания масштабов: если записать 40 зеттабайт (40*1021 байт) данных на самые емкие современные диски Blue-ray, суммарный вес дисков без упаковки будет равен весу 424 авианосцев. При этом используется лишь менее 3% из 23% потенциально полезных данных.

Тема перспективности анализа Big Data на слуху уже шесть-семь лет и успела поднадоесть. Однако в огромном количестве публикаций, рассказывающих о светлом будущем больших данных, практически нет реальных примеров внедрений. Как с изрядной долей самоиронии подметил главный технический директор корпорации Teradata Стивен Бробст, «Big Data — как секс в старших классах: все о нем говорят, но мало кто пробовал, а те, кто попробовал, плохо поняли, что это».

Мы все же попытались найти российские примеры реализации работы с Big Data. Прямо скажем, это было непросто. Достичь результатов на практике и внедрить решения оказывается куда сложнее, чем это выглядит в рекламных презентациях. Признаваться в неудачах никто не хочет, успешные примеры тем более засекречиваются — даже намек на сделанное позволит конкурентам повторить этот путь и уничтожить преимущество. Консультанты лишь с горестью разводят руками — они были бы счастливы похвастаться достижениями, да кто ж позволит.

Понимать не обязательно

Общим местом стали упоминания, что большие данные — лишь маркетинговый ход. Накопленные данные росли в объеме на протяжении всего развития современной цивилизации, и их анализом занимались издавна. Стремительное снижение стоимости хранения и обработки лишь делает работу с данными все более доступной.

Однако количественные изменения начинают переходить в качественные. Отличие первое: данные становятся все детальнее и персонифицированнее и собираются у все большего числа игроков. Если раньше анализ велся преимущественно на макроуровне, то сейчас даже владелец небольшой сети магазинов может отслеживать и анализировать действия своих покупателей и монетизировать результаты этого изучения. Второе отличие — качественное: отказ от проверки простых гипотез о причинно-следственных взаимосвязях в пользу более сложных математических моделей. То, что раньше делалось «вручную», теперь начинают доверять системам машинного обучения.

Чтобы показать разницу, раз