HFLabs - Home  







HFLabs ФАКТОР
промышленное решение для обеспечения качества данных

Вот типичные проблемы, которые обычно беспокоят пользователей, сталкивающихся с данными низкого качества:

    • Как привести все адреса к КЛАДР и стандарту Почты России?
    • Содержится ли этот клиент в базе один раз? Или таких записей несколько?
    • Могу ли я проверить существование указанного почтового адреса, телефона и e-mail?
    • Как я могу понять, какой процент покупателей-женщин находится в городе Москва, если почтовый адрес задан неразделенной строкой, а пол не задан?
    • Как мне подготовить почтовые адреса к нанесению на карту?
    • Как проанализировать десять различных источников данных о покупателях нашей продукции, если каждый из источников находится в своем формате?
    • Могу ли я объединить все файлы и базы данных организации в единую базу данных и убедиться, что в ней нет дубликатов?

Серверный программный продукт ФАКТОР позволяет обеспечить высокий уровень качества информации о физических и юридических лицах путем автоматизации процессов проверки, очистки, приведения к единому виду и устранения дубликатов в базах данных, содержащих информацию о клиентах и партнерах организации.

Продукт предназначен для государственных и коммерческих организаций, использующих базы данных, которые содержат недостаточно структурированную текстовую информацию, в частности контактные данные.

Высокая производительность и надежность позволяют использовать ФАКТОР для очистки, приведения к единому виду и устранения дубликатов в практически любых видах контактной информации.

 

Состав продукта

 

1. Модули очистки и стандартизации данных  позволяют эффективно распознавать, обрабатывать и приводить к стандартному представлению различные виды контактной информации. В модули заложены обширные базы знаний (несколько миллионов единиц) и уникальные алгоритмы для обработки данных с учетом возможных опечаток в распространенных видах контактной информации, к которой относятся почтовые адреса, ФИО, телефоны.

2. Модуль устранения дубликатов позволяет производить слияние записей, которые похожи друг на друга на основании заданного набора полей (например, ФИО, почтовый адрес и дата рождения). Устранение дубликатов может производиться как на основании автоматически настроенных правил (автоматический режим), так и с вмешательством человека в особо сложных случаях (ручной режим).

3. Модуль трансформации быстро и эффективно позволяет преобразовывать данные из одного формата в другой, выполняя по ходу необходимые трансформации (в том числе очистку и стандартизацию данных).

4. Рабочее место аналитика данных позволяет анализировать исходные данные, процессы их преобразования и результаты обработки.

 

Преимущества использования HFLabs ФАКТОР

 

Качественные данные

    • ФАКТОР способен обрабатывать практически любые виды русскоязычной контактной информации в любом формате.
    • Восстанавливает пропущенные компоненты в адресах, телефонах, именах: автоматически определяет город, если пропущена улица; телефонный код, если указан город и т.д.
    • Проверяет существование почтовых адресов и телефонов по российским справочникам.
    • Позволяет обнаруживать «мусорные данные» (случайно набранные на клавиатуре последовательности, подозрительные слова и т.д.).
    • Разбивает неструктурированные данные на компоненты.
    • Позволяет обрабатывать данные с опечатками и ошибками.
    • Не требует вмешательства оператора на этапе обработки данных; оператор обрабатывает только особо сложные случаи.
    • Предоставляет SOAP-интерфейсы для вызова методов обработки данных.

Качественный результат

    • Качество данных при автоматизированной обработке оказывается на порядки выше, чем при ручной обработке операторами.
    • Предсказуемость обработки данных обеспечивается настраиваемыми правилами обработки, регулярными обновлениями словарей и справочников.
    • Надежность обработки обеспечивается путем протоколирования всех проведенных преобразований данных и причин, по которым было применено то или иное правило.
    • Существует возможность создавать собственные правила обработки данных, подключать свои словари и использовать их для обработки данных.

Легкость освоения

    • Программа снабжена общим руководством пользователя и руководством аналитика данных.
    • Эффективные методики обучения позволяют обучить персонал заказчика всем необходимым знаниям о качестве данных и их обработке с использованием ФАКТОР.

Высокая производительность

    • Использование ФАКТОР позволяет силами одного сотрудника ежедневно обрабатывать до десятков тысяч записей. Также есть возможность полностью автоматического режима работы.

Быстрая окупаемость

    • Использование ФАКТОР экономически более эффективно, чем организация ручной обработки.
    • Затраты на приобретение системы носят разовый характер, в то время как высокое качество данных гарантировано в течение длительного времени.

Поддержка

    • Разработка, внедрение, сопровождение и поддержка, а также обучение пользователей производится российской компанией, находящейся в центре Москвы. Это дает возможность оперативного разрешения возникающих вопросов и доработки продукта под специфичные требования.
  Если вас заинтересовали возможности ФАКТОР, пожалуйста, свяжитесь с нами по электронной почте info@hflabs.ru или по телефону +7 (495) 928 86 41