Big Data — серия подходов, инструментов и методов обработки, структурированных и неструктурированных данных огромных объёмов и многообразия для получения воспринимаемых человеком результатов.
Социальные сети, мобильные устройства, данные с измерительных устройств, бизнес-информация — это все примеры источников, способных генерировать гигантские объемы информации. По данным исследования IDC Digital Universe, опубликованного в 2012 году, ближайшие 8 лет количество данных в мире достигнет 40 Зб (зетабайт) что эквивалентно 5200 Гб на каждого жителя планеты!
Еще примеры того, что может быть источником данных, для которых необходимы методы работы с большими данными:
Чтобы работать с большими данными нужно уметь их:
читать с датчиков, забирать из транзакционных систем, подключаться к соц. сетям
управлять неструктурированными данными, состоящими из текстов, изображений, видео и других типов, объединять данные из разных источников, обеспечивать возможность доступа из аналитических и транзакционных приложений
анализировать, определять закономерности, искать и фильтровать информацию, давать рекомендации и заключения
Сложности работы с большими данными:
В настоящий момент каждая компания ищет практические сценарии работы с Big Data, которые смогут принести компании пользу. Вот лишь некоторые примеры практического использования данной технологии.
Пример 1.
Металлургическое производство — очень сложный процесс. Управлять им — большое искусство! Например, при выплавке стали через специальные устройства — фурмы — в печь подается воздух. От огромных температур они регулярно прогорают, что негативно сказывается на качестве выплавляемой стали. Раз в две недели, во время технологического перерыва, фурмы можно поменять. С уже сгоревшими все понятно. А что делать с еще хорошими? Смогут ли они проработать еще две недели или сгорят через день, испортив всю плавку? Даже очень опытному специалисту тяжело это определить. Алгоритм по работе с большими данными на базе искусственного интеллекта проанализирует тысячи показателей, учтет все нюансы производства: температурные режимы, химический состав стали, давления дутья и подскажет правильное решение! Расчеты показали, что годовой экономический эффект предприятия от внедрения сценария составит около 65 миллионов рублей.
Пример 2.
Функционал системы по работе с персоналом SAP Success Factors может быть существенно расширен технологией работы с большими данными для построения карьерного пути сотрудника.
Пример 3.
Прогнозирование объема закупок. Для крупных компаний планирование закупок на 3–4 года вперед является желанной задачей. Однако учесть все влияющие факторы очень сложно. На закупки могут влиять курсы валют, биржевые данные (котировки нефти, металлов), тенденции и направления в развитии индустрии (например, развитие шельфового бурения) и многое другое. Только автоматизированным способом можно найти влияющие факторы и максимально точно спрогнозировать закупки.
Прогнозная модель позволяет предупредить остановку процессов, предлагая комплекс мероприятий по обслуживанию оборудования. Торговые и игровые автоматы, банкоматы, вышки сотовой связи, промышленные станки или пользовательское оборудование — все эти устройства могут передавать информацию о своем состоянии (температура, вибрация и прочее). На основе истории собранных технологических параметров работы оборудования, а также истории предупреждений и сбоев создается модель, которая может предсказывать критические ситуации, требующие остановки оборудования или его ремонта.
Расчет влияния макроэкономических и иных внешних факторов на бизнес представляет собой очень сложную задачу. На основе истории продаж, оплат, отгрузок, макроэкономических факторов, таких как прогнозы уровня цен товаров и сырья, стоимость биржевых индексов и т.д., создается модель, позволяющая прогнозировать объем сбыта, точно рассчитать потребность в оборудовании, избежать простоев или недостатка производственных мощностей.
На основе данных о технологических параметрах оборудования (вибрация, температура и др.), условиях внешней среды, а также истории контроля качества продукции, создается прогнозная модель. Такая модель способна определять шаблоны параметров оборудования, являющиеся признаком будущих проблем с оборудованием.
Погодные условия могут создать проблему для транспортировки грузов, например, сильный снегопад, шторм или толстый лед. В ряде случаев только спецтехника может обеспечить проход основного грузового транспорта. На основе данных со спутника, метео-сервисов и других источников определяются зоны риска, где может возникнуть необходимость в спецтехнике. Модель прогнозирования позволяет оптимально спланировать участие ледоколов, снегоуборочных машин, разработать оптимальные маршруты, снизив таким образом расходы и время ожидания.
Своевременное обслуживание удаленного оборудования также можно организовать с использованием прогнозных моделей. На основе исторических данных о продажах и внешних условиях, например, событиях в зоне размещения автомата (футбольный матч, концерт) создается модель прогноза продаж конкретного автомата и график его технического обслуживания. Это позволяет определить оптимальную маршрутную карту для специалистов, которые обслуживают автомат.
Компании, располагающие историческими данными по проведению маркетинговых кампаний, могут использовать эти данные для прогнозирования финансовых результатов. На основании информации о результативности прошлых кампаний, программ лояльности, макроэкономических факторов создается прогнозная модель, способная оценить эффективность новых маркетинговых кампаний.
Для планирования необходимо понимать факторы, влияющие на финансовые результаты. Использование предиктивной аналитики позволяет смоделировать сценарии и определить характер влияния того или иного решения. Предоставляется возможность находить статистическую зависимость между финансовыми показателями компании и другими историческими наборами данных.
На основе истории отгрузок, платежей дебиторов, данных по ценам производных или связанных товаров, макроэкономических факторов создается прогнозная модель, определяющая риски по каждому дебитору. В результате в компании снижается уровень просроченной дебиторской задолженности за счет активной работы с потенциальными проблемными дебиторами.
Прогнозная модель, созданная на основе данных из открытых источников о размещении торговых предприятий, транзакциях, перемещении людей, погодных условиях позволяет оценить вероятность, насколько прибыльным может быть данный вид торговли в выбранном месте. С помощью такого моделирования можно подобрать лучшее место для открытия торговой точки.
К моменту вывода нового пакета услуг на рынок компания может спрогнозировать, как данный пакет повлияет на продажи других услуг, и какова будет прибыль от данного пакета. С помощью модели, построенной на истории предложений тарифов, данных о действиях потребителей есть возможность видеть не только маржинальность пакета услуг за отдельный период, но и проследить как меняется маржинальность абонентов в зависимости от набора подключенных им услуг.