Риск снижения эффективности больших данных
Данных много, а пользы нет? Только проверенные компании, которые специализируются на Big DataЧеткость структуры собираемых и обрабатываемых данных, их управляемость и качество направлены на то, чтобы исключить снижение результативности работы с большими данными по мере разрастания их объемов. Помещение данных в хранилище должно быть управляемым и контролируемым. Даже если переполнение хранилищу не грозит, то сохранять в нем «всякие» данные – не самый удачный вариант. Попробуйте разберитесь в них потом! Очевидно, что приходится затрачивать много времени и вычислительных ресурсов в хранилище с плохой структурой данных, с низким уровнем индексирования и классификации данных, с неясными типами и минимальными метаданными для поиска информации.
Для устранения риска снижения эффективности больших данных четко формулируются принципы упаковывания данных в хранилище и их структурирования. Сомнительные данные рекомендуется размещать обособлено.
Риск ошибок больших данных
Несколько примитивнейших ошибок (или даже одна) могут легко испортить долгую кропотливую работу. Большие данные – не исключение. А учитывая, что объемы больших данных способны достигать огромных размеров – ошибки весьма вероятны (как в содержании и структуре данных, так и в инструментах работы с ними).
Для снижения риска ошибок больших данных необходимо:
- Проводить периодические ревизии данных (автоматизированные и выборочные);
- Контролировать ключевые параметры данных;
- Вести журнал выявленных ошибок и их устранения;
- Разрабатывать инструменты и алгоритмы устранения или нивелирования ошибок и некорректных состояний данных;
- Оценивать результативность инструментов;
- Проводить независимую оценку и экспертизу;
- Применять специальные средства тестирования данных и инструментов, которые разрабатываются самостоятельно;
- Использовать инструменты последовательно, подконтрольно и пошагово с постоянным контролем обрабатываемых данных в целом или по выборкам.
Риск конфиденциальности
Потеря контроля над данными и их передача в руки конкурентов может нанести серьезный экономический и репутационный ущерб. Разглашение конфиденциальных данных в СМИ или в Сети тоже нежелательны для бизнеса, даже если это не представляет явного коммерческого интереса для кого-то из игроков рынка.
Снизить опасность разглашения данных призвана система обеспечения безопасности.
В связи с риском конфиденциальности стоит отметить особый статус сервисов хранения и обработки данных, которые предоставляются сторонними компаниями («облака сторонних лиц»). Указанный риск здесь выше и непосредственно неподконтролен. Остается доверять порядочности таких поставщиков услуг и включать в контракты условия о компенсации разглашения данных третьим лицам.
Безусловный плюс для банков
Более активное размещение валютных пассивов гражданами позволяет финансовым учреждениям привлекать ресурсы по низкой ставке, а это благоприятно сказывается на банковской системе России, считает президент СРО «Национальная финансовая организация» Василий Заблоцкий.
Чужие деньги
Фото: ТАСС/Станислав Красильников
«Сумма покупок за два последних месяца 2020 года в $4,7 млрд кажется значительной, но только если не учитывать падение спроса в предыдущие 10 месяцев. Среди вероятных причин, по которым граждане покупают валюту, могут быть опасения новых санкций, желание диверсифицировать накопления», — резюмирует эксперт.
Риск мошенничества
Когда приходится работать с внешними консультантами или создавать команды проекта больших данных, существует вероятность столкнуться с банальным мошенничеством.
Особенно велик риск мошенничества при покупке больших данных «оптом и в розницу» или при подключении платных сервисов сбора и обработки больших данных. Проверить достоверность внешней информации или эффективность алгоритмов ее обработки крайне сложно. Необходимо быть высоко квалифицированным и опытным специалистом, чтобы выявить подделанные или скомпрометированные данные. В самом деле, ну как для терабайтного массива цифровых данных провести полноценную экспертизу? Да и сколько она будет стоить…
У мошенников много вариантов для формирования данных. Данные можно специальным образом сгенерировать или имитировать, скрывая это за красивым фасадом «сверхчувствительного» алгоритма и «сверхумного» регистратора.
Качественные данные стоят недешево, и тут высок риск мошенничества, поэтому и подходить к их покупке следует осторожно. Фото на обложке: Shutterstock. Фото на обложке: Shutterstock
Фото на обложке: Shutterstock.
Риск формирования неэффективного набора данных
Совокупность больших данных решает вполне конкретные цели и задачи, стоящие перед бизнесом. Бесконтрольный сбор (получение) и хранение данных могут привести к тому, что данные будут большими, четкими, удобными, но бесполезными по содержанию. Они могут быть неполными и не представлять полноценно фактическую сторону дела. На базе таких данных аналитики и менеджеры не смогут принять сколь-либо значимое решение.
Данные, а тем более большие, контролируются не только по форме, но и по содержанию, чтобы минимизировать риск формирования информационного набора неэффективного в целом или для решения отдельных поставленных задач. Допустимо рассматривать этот риск как несоответствие больших данных и бизнес-модели.
Риск экономической нецелесообразности
Не исключено, что аналитики не найдут ответы на проблемные вопросы бизнеса, обработав доступный им объем больших данных. Замена аналитиков, реформирование модели потоков больших данных, реструктуризация данных исправят как-то ситуацию в будущем. Однако затраты на проект произведены, а результат отсутствует.
Полностью избавиться от риска экономической нецелесообразности больших данных нельзя. Но минимизировать – реально.
Вот что нужно для этого использовать:
- Корректную постановку целей и задач проекта;
- Стратегическое планирование проекта и его окружения;
- Стратегию интегрирования больших данных в бизнес-модель;
- Формирование профессиональной команды проекта;
- Полноценное обеспечение проекта ресурсами;
- Эффективное управление проектом;
- Контроль за ходом проекта.