Тема «больших данных» (big data) пользуется огромной популярностью. Возможно, вы уже знаете о преимуществах аналитического подхода для работы с бизнесом, а возможно, вы только погружаетесь в процесс работы с данными.
Давайте выясним, что такое датафикация, какими бывают данные и как правильно принимать решения.
Что такое датафикация
Это уродливое слово, но прекрасная идея: когда столь многое из того, чем мы занимаемся, способно обеспечить нас информацией, можно узнать даже гораздо больше, чем требуется.
Позвольте привести пример: если бы 30 лет назад вы вдруг захотели узнать, сколько писем приходит в вашу компанию, вам пришлось бы поручить одному из сотрудников скучную и долгую работу по подсчету всей входящей корреспонденции. Если бы вы захотели выяснить, какой объем этой корреспонденции адресован вам лично, сотруднику пришлось бы отсортировывать все адресованные вам письма и ежедневно подсчитывать их количество.
А если бы при этом вас заинтересовало, получаете ли вы больше писем, чем ваши коллеги, то сотруднику пришлось бы на протяжении нескольких недель заниматься сортировкой и подсчетом корреспонденции, после этого составить отчет, сделать фотокопию и принести ее вам.
Затем, если у вас произошли какие-то изменения (например, вы делегировали работу коллеге), этому несчастному, сортирующему корреспонденцию, пришлось бы на протяжении еще нескольких недель повторять эту скучную работу, подготовить еще один отчет, найти первый отчет в каталоге, скрепить их вместе и, возможно, даже постараться сформировать небольшую статистику…
Мир изменился, но многие (фактически большинство из нас) не пытаются идти в ногу со временем. Давайте тоже меняться.
Сбор данных
Данные — ключевой компонент. При этом речь идет не о любых данных, а о правильных. Необходимо, чтобы набор данных соответствовал вопросу, который требуется решить. Помимо этого, данные должны быть своевременными, точными, чистыми, объективными, и, что важнее всего, они должны заслуживать доверия.
Это не так-то просто. Данные никогда не бывают настолько чистыми, как вам кажется. Они могут быть предвзятыми, что может повлиять на результат анализа, а очистка данных может стать трудоемким и дорогим процессом, требующим времени. Часто приходится слышать, что специалисты по работе с данными до 80% времени тратят на их сбор, очистку и подготовку и только 20% — на построение моделей, процесс анализа, визуализацию и формулировку заключений на основе этих данных. Как показывает опыт, это вполне вероятно.
Качество данных
Качество данных определяется несколькими аспектами. Данные должны отвечать ряду требований.
Доступность. У аналитика должен быть доступ к данным. Это предполагает не только разрешение на их получение, но также наличие соответствующих инструментов, обеспечивающих возможность их использовать и анализировать.
Точность. Данные должны отражать истинные значения или положение дел.
Взаимосвязанность. Должна быть возможность точно связать одни данные с другими.
Полнота. Под неполными данными может подразумеваться как отсутствие части информации (например, в сведениях о клиенте не указано его имя), так и полное отсутствие единицы информации (например, в результате ошибки при сохранении в базу данных потерялась вся информация о клиенте).
Однозначность. Каждое поле, содержащее индивидуальные данные, имеет определенное, недвусмысленное значение.
Релевантность. Данные зависят от характера анализа.
Надежность. Данные должны быть одновременно полными (то есть содержать все сведения, которые вы ожидали получить) и точными (то есть отражать достоверную информацию).
Своевременность. Между сбором данных и их доступностью для использования в аналитической работе всегда проходит время. На практике это означает, что аналитики получают данные как раз вовремя, чтобы завершить анализ к необходимому сроку.
Ошибка всего в одном из этих аспектов может привести к тому, что данные окажутся частично или полностью непригодными к использованию или, хуже того, будут казаться достоверными, но приведут к неправильным выводам.
Составление отчетности
Предположим, у вас есть аналитическая группа с доступом к точным данным. Эта группа получает данные по объему продаж и гордо рапортует о росте портфеля заказов компании на 5,2% с апреля по май.
Кажется, что в компании осуществляется управление на основе данных. Однако этого по-прежнему недостаточно. Разумеется, хорошо, что специалисты отслеживают данные по продажам. Генерального и финансового директоров эти цифры, несомненно, заинтересуют. И тем не менее — о чем на самом деле говорит показатель 5,2%? Практически ни о чем. Возможны самые разные причины роста объема продаж компании.
— Предположим, вы продаете сезонный товар, например купальные костюмы. Может быть, рост в 5,2% — это гораздо ниже, чем обычно. Может быть, в предыдущие годы рост объема продаж в мае составлял более 7%, а в этом году он ниже обычного.
— Возможно, директор по маркетингу потратил кучу денег на национальную кампанию по повышению узнаваемости бренда. Какой процент роста из этих 5,2% обусловлен проведенной кампанией? Насколько эффективным оказалось подобное вложение средств?
— Может быть, генерального директора вашей компании пригласили поучаствовать в телешоу Good Morning America, или ваш продукт был упомянут в Techcrunch, или ваше видео стало «вирусным», и это послужило фактором роста продаж. То есть причина — какое-то конкретное событие, способное обеспечить временный или устойчивый рост.
— Возможно, продажи за месяц характеризуются низким объемом и широким ассортиментом. Возможно, это было лишь удачным стечением обстоятельств, а общая тенденция — нисходящая. (Если вы когда-нибудь пробовали играть на бирже, то понимаете, о чем речь.)
— Может быть, ошибка в самих данных. Если уровень продаж относительно стабилен и вы видите резкий скачок без каких-либо предпосылок к тому, возможно, все дело в качестве данных.
Все это возможные объяснения. Цифра в отчете представляет собой именно это — числовой показатель без контекста.
Как принимают решения
Здесь не все так просто. Многие компании искренне верят, что у них процесс принятия решений происходит на основе данных, но, к сожалению, интуиция по-прежнему правит бал. В исследовании 2014 года, которое проводило аналитическое подразделение журнала Economist, на основе опроса 1135 руководителей высшего звена получилось следующее: интуиция (30%) и опыт (28%) в совокупности оставили далеко позади аналитические данные.
Тем не менее, невозможно вести бизнес на одной интуиции, но, скорее всего, совсем игнорировать внутренний голос тоже нельзя. Секрет в том, чтобы знать, когда к нему стоит прислушаться.
Одним из важнейших аспектов всегда будет фактор времени. От данных мало пользы, если вы не можете получить их до того момента, когда вам необходимо принять решение. Исследования показывают, что гроссмейстеры в состоянии моментально оценить ситуацию на доске, потому что до этого они проанализировали сотни тысяч положений и могут быстро соотнести, что видят на доске, со своим игровым опытом. Даже если обычные игроки могли бы провести аналогичный анализ, он занял бы у них неизмеримо больше времени.
Таким образом, вы вынуждены полагаться на интуицию в случаях, когда решение нужно принимать немедленно или у вас нет возможности получить дополнительную полезную информацию. Будьте внимательны: в любой ситуации принятие интуитивного решения несет в себе больше рисков, так как мы подвержены собственным убеждениям, а знание контекста при этом ограничено.
По материалам книг «Управление на основе данных» и «Аналитическая культура».