Правильная работа с данными помогает действовать быстрее, рациональнее и эффективнее. Но одни лишь данные мало чем помогут компании. Человеческий фактор в управлении компанией на основе данных — важнейший: необходимы люди, способные задавать правильные вопросы, люди с необходимыми навыками для получения нужных данных и показателей, люди, использующие данные для планирования следующих шагов.
Подготовили полезную информацию для аналитиков по материалам книг «Аналитическая культура», «Управление на основе данных» и «О чем говорят цифры».
1. Снижение количества ошибок при вводе данных
Первый шаг, если он возможен, заключается в сокращении количества этапов от генерации данных до ввода. Если есть возможность избежать бумажной формы, лучше сразу вносить данные в компьютер. Это поможет снизить количество таких типов ошибок как вставка, удаление, перемена мест, включая диттографию (случайное повторение символа) и гаплографию (пропуск повторяющегося символа).
Если есть ограниченный набор допустимых значений, предложите пользователю выбрать нужный вариант из меню выпадающего списка.
2. Автозаполнение
Автозаполнение может стать еще одним вариантом. В целом стремитесь к тому, чтобы пользователю пришлось вводить как можно меньше данных: лучше предложить варианты ответа на выбор, если, конечно, это позволяет формат требуемой информации. В идеале постарайтесь максимально исключить человеческий фактор при сборе данных и по возможности автоматизируйте этот процесс.
3. Принцип двойной записи
Если вы располагаете временем и ресурсами, поручите двум сотрудникам независимо друг от друга расшифровывать данные (или пусть это дважды делает один сотрудник), сравнивать результаты и перепроверять данные в случае расхождений. Этот метод известен как «принцип двойной записи».
4. Контрольное число
Интересный метод проверки применяется при передаче важных данных в цифровой форме, например номеров банковских счетов и номеров социальной страховки. Этот метод называется контрольное число. После передаваемого номера добавляется число, которое представляет собой определенную функцию остальных цифр номера, и это число используется для проверки того, что предыдущие цифры были переданы из системы в систему без ошибок.
Предположим, вам нужно передать индекс 94121. Последовательно сложим все цифры, составляющие наш индекс, и получим 17. Сложим и эти цифры, получим 8. Передаем число 941218 (исходный индекс плюс восьмерка). Принимающая система выполняет все те же самые операции, но в обратной последовательности. Она отсекает последнюю цифру, проверяет сумму цифр и получает в итоге 8. Почтовый индекс передан верно.
5. Дублирование данных
Дублирование данных случается чаще, чем вы думаете. Если вы не знаете, что в ваших данных встречается продублированная информация, это может повлиять на ваши показатели. Но хуже всего, что в какой-то момент времени это все равно обнаружится. А если качество данных будет поставлено под сомнение хотя бы однажды, это снизит доверие к выводам аналитиков, и эти выводы не будут учитываться в процессе принятия бизнес-решений.
Есть несколько способов предотвратить дублирование. Наиболее эффективный — добавление ограничений в таблицу с базой данных. Вы можете создать составной ключ, который определяет одно или несколько полей и делает запись уникальной. После добавления этого ограничения у вас будет появляться оповещение, если вводимая комбинация данных совпадет с уже существующей в таблице.
Второй способ — выбор варианта загрузки данных по принципу «все или ничего». Если в момент загрузки данных обнаруживается проблема, происходит откат на изначальные позиции, а новая информация в базе данных не сохраняется. Это дает шанс разобраться с причиной проблемы и повторить процесс загрузки данных без дублирования информации.
Наконец, третий (менее эффективный) подход — выполнять две операции при загрузке: первая операция — SELECT, чтобы выяснить, не присутствует ли уже такая запись, вторая операция — INSERT, добавление новой записи.
Из книги «Аналитическая культура».
6. Надежные сервисы
Согласно данным компании Harris Interactive, 92% людей по старинке продолжают отсылать информацию в формате вложения в письмах электронной почты. Это значительно повышает вероятность отправить не тот документ, потерять письмо в большом количестве входящей корреспонденции или допустить утечку информации, если случайно забыть телефон в такси.
Более надежный вариант — пользоваться безопасными способами обмена данными, например DropBox или Google Drive, или использовать облачное приложение для хранения данных, чтобы у вас был один источник информации.
7. Соцсети
Не стоит расценивать действия в социальных сетях как намерение потратить деньги или взять на себя серьезное обязательство в реальной жизни. Очень легко начать слишком доверять социальным сетям, но все же не стоит увлекаться по следующим причинам:
1) «лайк» и намерение сделать покупку — это не одно и то же;
2) пользователи могут делать ретвиты и «лайкать» ваши сообщения как по положительным, так и по отрицательным причинам;
3) нет доказательств, что это не эмоциональный порыв, а осознанное решение;
4) люди, которые это делают, могут быть не теми, кто вам интересен.
С другой стороны, соцсети дают бесплатное статистическое представление, которое может обеспечить вас некоторыми полезными данными. Оно отражает те аспекты деятельности вашей компании или вашей рекламы, которые пользователи социальных сетей считают интересными. Оно может выявить тренд и обеспечить быструю обратную связь.
8. Закономерности
Простое составление таблиц или графиков — это еще не способ принимать более эффективные решения.
Они либо указывают на необходимость понимания того, что происходит, если мы не знаем причин появления этой закономерности, либо показывают, что какой-то фактор оказывает влияние, если мы понимаем какой.
9. Устранить неполадку в том, что пока еще работает
Чтобы прогнозировать, что может пойти не так или, наоборот, сложиться наилучшим образом, можно представить, что проект провалился. В таком случае руководитель анализирует причины воображаемого провала, оценивает потенциальные риски и угрозы и решает, какие меры можно предпринять.
Известный бизнес-тренер финансовых трейдеров Даг Хиршхорн говорит, что даже люди, ежедневно идущие на риск, не справляются с этим базовым методом анализа. Во время обучения он предлагал трейдерам гипотетическое пари, вероятность выигрыша в котором всегда составляет 95%.
Вы бы согласились на такое пари? 19 из 20 человек сразу же говорят «да». И лишь один задумчиво интересуется: «А что будет, если я проиграю?»
«Людей не интересует, как устранить неполадку в том, что пока еще работает, — говорит Даг Хиршхорн. — Их интересует, как они на этом могут заработать».
10. Отчетный период
Начало и завершение периода, за который делается отчет, имеет значение. Если вам говорят, что темпы роста составили 5% с 2007 года, поинтересуйтесь, какими они были в 2006 или 2004 году.
Происходит ли глобальное потепление в последние годы? Кривая графика будет зависеть от того, что вы подразумеваете под словами «в последние годы».
Из книги «Управление на основе данных».
11. Ценность вторичных данных
Многие аналитики самостоятельно собирают, а затем анализируют данные. Но иногда можно воспользоваться данными, собранными кем-то другим (так называемыми вторичными данными), и существенно сэкономить время. Обычно вторичные данные получают из результатов переписей, опросов, внутренней документации и других подобных источников. Таких данных везде очень много, и они просто ждут, когда аналитики обратят на них внимание.
Иногда вторичные данные помогают получить очень важные результаты. Достаточно вспомнить, например, работу астронома Иоганна Кеплера. Он родился в бедной семье, но ему повезло получить очень точные вторичные данные о движении астрономических объектов, тщательно собиравшиеся в течение нескольких десятилетий. Необыкновенный математический талант и удача помогли ему разгадать тайны планет.
12. Наглядность
Если можно использовать цвет и анимацию, чтобы оживить презентацию, — сделайте это! Оформление данных в виде черно-белых таблиц — это прекрасный способ заставить людей проигнорировать их, даже если это результаты совсем простого описательного анализа. Результаты легко представить в простой графической форме (гистограммы, диаграммы, графики), а можно выбрать более затейливый вариант: например, интерактивный дисплей.
13. О чем лучше умолчать
Аналитики хорошо знакомы со статистической терминологией (описание статистических методов, определение коэффициентов регрессии, расчет значения R2 и т. п.) и зачастую полагают, что их слушатели разбираются во всем этом не хуже. Однако это большая ошибка. Большинство не поймет, о чем идет речь в насыщенном специальной терминологией докладе или презентации.
Как сказал один из аналитиков компании iHG, «никому не интересны ваши R-квадраты». Часто аналитики стараются изложить результаты в виде последовательности процедур и операций, которые они проделали для их получения: «Сначала мы исключили выбросы из массива данных, затем сделали логарифмическое преобразование. Выявился высокий уровень автокорреляции, поэтому мы ввели переменную с лагом в один год», — вы уже представили себе, как это выглядит?
Повторим еще раз: аудиторию, как правило, не интересует, как вы получили те или иные результаты, поскольку им важны только сами результаты. Полезно привести подобную информацию в приложении к докладу или презентации, но не стоит включать ее в ваш рассказ. Лучше начните непосредственно с того, что хотят знать ваши слушатели.
Из книги «О чем говорят цифры».
Все картинки поста: источник.