|
HFLabs ФАКТОР
промышленное решение для обеспечения
качества данных
|
|
Вот типичные проблемы, которые обычно беспокоят
пользователей, сталкивающихся с данными низкого качества:
- Как привести все адреса к КЛАДР и стандарту Почты
России?
- Содержится ли этот клиент в базе один раз? Или таких
записей несколько?
- Могу ли я проверить существование указанного почтового
адреса, телефона и e-mail?
- Как я могу понять, какой процент покупателей-женщин
находится в городе Москва, если почтовый адрес задан
неразделенной строкой, а пол не задан?
- Как мне подготовить почтовые адреса к нанесению
на карту?
- Как проанализировать десять различных источников
данных о покупателях нашей продукции, если каждый из
источников находится в своем формате?
- Могу ли я объединить все файлы и базы данных организации
в единую базу данных и убедиться, что в ней нет дубликатов?
Серверный программный продукт ФАКТОР позволяет
обеспечить высокий уровень качества информации о физических и юридических
лицах путем автоматизации процессов проверки, очистки, приведения
к единому виду и устранения дубликатов в базах данных, содержащих
информацию о клиентах и партнерах организации.
Продукт предназначен для государственных и коммерческих
организаций, использующих базы данных, которые содержат недостаточно
структурированную текстовую информацию, в частности контактные данные.
Высокая производительность и надежность позволяют
использовать ФАКТОР для очистки, приведения к единому виду
и устранения дубликатов в практически любых видах контактной информации.
|
|
| |
Состав продукта
|
| |
1. Модули очистки и стандартизации данных
позволяют эффективно распознавать, обрабатывать и приводить
к стандартному представлению различные виды контактной информации.
В модули заложены обширные базы знаний (несколько миллионов единиц)
и уникальные алгоритмы для обработки данных с учетом возможных опечаток
в распространенных видах контактной информации, к которой относятся
почтовые адреса, ФИО, телефоны.
2. Модуль устранения дубликатов позволяет
производить слияние записей, которые похожи друг на друга на основании
заданного набора полей (например, ФИО, почтовый адрес и дата рождения).
Устранение дубликатов может производиться как на основании автоматически
настроенных правил (автоматический режим), так и с вмешательством
человека в особо сложных случаях (ручной режим).
3. Модуль трансформации быстро и эффективно
позволяет преобразовывать данные из одного формата в другой, выполняя
по ходу необходимые трансформации (в том числе очистку и стандартизацию
данных).
4. Рабочее место аналитика данных позволяет
анализировать исходные данные, процессы их преобразования и результаты
обработки.
|
|
| |
Преимущества использования HFLabs ФАКТОР
|
| |
Качественные данные
- ФАКТОР способен обрабатывать практически
любые виды русскоязычной контактной информации в любом
формате.
- Восстанавливает пропущенные компоненты в адресах,
телефонах, именах: автоматически определяет город, если
пропущена улица; телефонный код, если указан город и
т.д.
- Проверяет существование почтовых адресов и телефонов
по российским справочникам.
- Позволяет обнаруживать «мусорные данные» (случайно
набранные на клавиатуре последовательности, подозрительные
слова и т.д.).
- Разбивает неструктурированные данные на компоненты.
- Позволяет обрабатывать данные с опечатками и ошибками.
- Не требует вмешательства оператора на этапе обработки
данных; оператор обрабатывает только особо сложные случаи.
- Предоставляет SOAP-интерфейсы для вызова методов
обработки данных.
Качественный результат
- Качество данных при автоматизированной обработке
оказывается на порядки выше, чем при ручной обработке
операторами.
- Предсказуемость обработки данных обеспечивается
настраиваемыми правилами обработки, регулярными обновлениями
словарей и справочников.
- Надежность обработки обеспечивается путем протоколирования
всех проведенных преобразований данных и причин, по
которым было применено то или иное правило.
- Существует возможность создавать собственные правила
обработки данных, подключать свои словари и использовать
их для обработки данных.
Легкость освоения
- Программа снабжена общим руководством пользователя
и руководством аналитика данных.
- Эффективные методики обучения позволяют обучить
персонал заказчика всем необходимым знаниям о качестве
данных и их обработке с использованием ФАКТОР.
Высокая производительность
- Использование ФАКТОР позволяет силами одного
сотрудника ежедневно обрабатывать до десятков тысяч
записей. Также есть возможность полностью автоматического
режима работы.
Быстрая окупаемость
- Использование ФАКТОР экономически более эффективно,
чем организация ручной обработки.
- Затраты на приобретение системы носят разовый характер,
в то время как высокое качество данных гарантировано
в течение длительного времени.
Поддержка
- Разработка, внедрение, сопровождение и поддержка,
а также обучение пользователей производится российской
компанией, находящейся в центре Москвы. Это дает
возможность оперативного разрешения возникающих
вопросов и доработки продукта под специфичные требования.
|
|
| |
Если вас заинтересовали возможности ФАКТОР,
пожалуйста, свяжитесь с нами по электронной почте
info@hflabs.ru
или по телефону +7 (495) 928 86 41 |