ROI = (Доход за период - сумма инвестиций за период) / сумма инвестиций за период
необходимо грамотно собрать, посчитать вложения, понесенные на программу. Иностранные эксперты пишут о сложности объективной калькуляции
профита и расходов по Data Governance (DG). Важно учесть все активности, статьи, относимые к DG.
Далее представлена попытка перечислить все расходные статьи.
Затраты на сбор данных
-
• Использование существующих корпоративных, коммерческих или открытых данных;
-
• Сбор детальных или агрегированных данных;
-
• Сбор всех или выборочных атрибутов;
-
• Сбор всех записей или достаточна репрезентативная выборка;
-
• Собираемые данные хранятся в едином формате, стиле, отчетливо интерпретируемы, структурированы, имеют уникальные наименования атрибутов и файлов;
-
• Надобны ли транскрипции, переводы;
-
• Требуется ли чьё-то согласие на сбор данных;
-
• Необходимы ли специальные меры для передачи данных с технического оборудования, мобильных устройств, с полевых объектов или с домашней техники;
-
• Нужно ли программное или аппаратное обеспечение для шифрования данных до начала их передачи или для синхронизации данных между местоположениями.
Затраты на обработку данных
-
• Требуется ли очистка, парсинг, верификация, дозаполнение данных;
-
• Требуется ли соединение, сведение данных, полученных из разных источников;
-
• Требуется ли сопоставление данных с мастер данными (MDM);
-
• Нужно ли проверять орфографию текстовых данных;
-
• Требуется ли обогащение данных;
-
• Должны ли быть оцифрованы аналоговые или бумажные данные (карты, фотографии, изображения, газетные вырезки);
-
• Требуется ли дополнительное оборудование или программное обеспечение для сканирования, преобразования, обработки.
Затраты на документирование данных
-
• Существует ли актуальная модель данных;
-
• Таблицы, атрибуты имеют подробные описания;
-
• Соблюдаются ли стандарты кодирования, соглашения о наименовании;
-
• Имеются в наличии актуальные профили данных;
-
• Имеются словари данных, глоссарий терминов;
-
• Текстуальные данные, такие как стенограммы интервью, имеют описание контекста;
-
• Есть ли документация, описывающая контекст и методологию сбора данных;
-
• Существует ли актуальная модель потоков данных, сквозных потоков данных;
-
• Есть ли документация по обработке, [обогащению] и контролю качества данных;
-
• Используется ли специализированное программное обеспечение класса Data Tools.
Затраты на хранение данных
-
• Как часто необходимо делать резервные копии и сколько резервных копий следует хранить;
-
• Сколько требуется места для хранения данных.
Затраты на доступ к данным и их безопасность
-
• Требуется ли внешним лицам доступ к данным, обеспечение VPN или безопасного FTP доступа;
-
• Обязательно ли защищать данные от несанкционированного доступа или распространения;
-
• Требуется ли шифрование файлов, данных перед хранением или передачей;
-
• Требуется ли обезличивание данных или псевдонимизацию перед хранением или передачей и далее;
-
• Требуется ли выделенный безопасный сервер, дополнительное программное / аппаратное обеспечение.
Затраты на доступность и повторное использование данных
-
• Имеют ли другие стороны авторские права на данные, нужно их согласие на утилизацию данных;
-
• Необходимо получить разрешение на авторское право, прежде чем делиться данными;
-
• Нужны ли юридические услуги;
-
• Существуют требования по приведению данных, метаданных к конкретным стандартам.
Затраты на консервирование данных
-
• Требуется ли преобразование данных в стандартный или открытый формат для долгосрочного сохранения;
-
• Требуется ли специальное программное или аппаратное обеспечение для преобразования.
Общие расходы
-
• Организация и проведение встреч команд;
-
• Распределение ролей и обязанностей, специальный менеджер ресурсов;
-
• Вовлечение архитектора баз данных или архитектора хранилища данных;
-
• Услуги администратора баз данных;
-
• Привлечение внешнего консалтинга;
-
• Обучение, тренинг персонала, практические семинары.
Какие-то из перечисленных выше пунктов могут быть не актуальны для конкретной организации.
И всё же, приступая к работе (или к отдельному проекту?) по расчету окупаемости Data Governance полезно иметь подобный чек-лист.