Проверка и дополнение ФИО, адреса, телефона и пр.

S7
На сайте с 16.05.2015
Offline
5
4923

Предлагаю услуги по валидации и уточнению следующих данных:

  • ФИО, с выделением имени, отчества, фамилии, определением пола
  • Телефон, с выделением типа телефона, названия оператора и географии обслуживания: город или регион
  • Email, с проверкой корректности доменной части
  • Адрес, с выделеним региона, района, города, улицы
  • Банковских реквизитов по актуальной базе банков
  • БИК, КПП, ИНН, корсчета, ОГРН, ОГРНИП, паспорта РФ, СНИЛС

Зачем это надо?

  • Вы купили базу контактов, и хотите проверить ее качество - количество валидных телефонов и email'ов.
  • В Вашем Интернет-магазине есть много заказов, нужна по ним нормализация данных для целей аналитики (приведение их к единой форме с выделением, напрмиер, города, или определения пола клиента).
  • Думаете заказать рассылку по своим клиентам, и необходимо определить пол, выделить имя и определить временную зону клиента, чтобы написать: "Добрый вечер, уважаемая Екатерина" или "Доброе утро, уважаемый Павел Витальевич".
  • Ваши менеджеры собрали адреса, но необходимо определить почтовые индексы для директ-мейла.
  • Необходимо провести актуализацию банковских реквизитов в базе клиентов.
  • В базе данных есть куча реквизитов клиентов, и хочется вычистить все некорректные.
  • ну и так далее. :)

Сколько стоит?

Опция 1 - до 1 000 записей, базовая цена $7. Дополнительно, стоимость одной задачи - $1.

Опция 2 - до 10 000 записей, базовая цена $15. Дополнительно, стоимость одной задачи - $2.

Опция 3 - до 100 000 записей, полная цена $80. От числа задач не зависит.

Опция 4 - до 500 000 записей, полная цена $125. От числа задач не зависит.

Фиксация курса - на дату заказа по курсу ЦБ.

Список тарифицируемых задач:

  • Выделить из ФИО имя, отчество, фамилию, пол
  • Проверить телефоны, определиить тип (мобильный/фиксированный), оператора, регион, временную зону
  • Проверить корректность email
  • Добавить к адресу индексы
  • Распознать адрес, разложить на составляющие, указать временные зоны
  • Проверить корректность банков по ИНН/БИК/корсчету
  • Валидировать данные клиента: банковский счет, ОГРН, ОГРНИП, паспорта РФ, СНИЛС

ВАЖНО. данные клиентов (см. последнюю задачу) принимаются только с обезличенными идентификаторами, без ФИО, телефонов email'ов и адресной информации.

Примеры

Показаны результаты выполнения отдельных задач, но если в исходном файле данные разных задач будут расположены "в одну строку", то и результат будет в одной строке. То есть, если, например, входной файл будет содержать ФИО, телефон, email, то в результирующем файле будет детализация ФИО, телефона, email в одной записи.

Пример 1 - Выделение из ФИО имени, отчества, фамилии, определение пола

Пример 2 - Проверка телефонов

Пример 3 - Проверка корректности email

Пример 4 - Определение почтовых индексов

Пример 5 - Распознавание адресов

Пример 6 - Актуализация данных о банках

Пример 7 - Валидация различных значений

Какова точность и органичения?

  • Определение имени, фамилии отчества, пола - до 95% при записи имени в полной форме (Алексей, но не Леша)
  • Определение и разделение адреса на части - до 80% в зависимости от качества информации на входе
  • Определение географии по номеру телефона - до 80%
  • Актуальность базы по банкам - примерно одна неделя.
  • При разборе адреса, все относящееся к дому (корпус, квартира, строение) сохраняется единой строкой, иначе слишком высока вероятность ошибки.

В любом случае, если мне самому не понравится результат - я сброшу статистику и примеры - Вы примите решение, выкупать и оплачитвать ли работу.

Да, кстати, мои услуги - по ПОСТ-оплате. То есть после выполнения работы я пришлю скриншоты, если по ним результат будет признан подходящим, то должна последовать оплата, и затем - передача Вам архива.

Как протестировать мою услугу?

Готов сделать бесплатно тестовый прогон на 10-20 записях, чтобы Вы могли визуально оценить результаты конвертации.

Какой нужен исходный формат?

В принципе любой. Excel или CSV конечно будет удобней. :) У меня есть специлаьные технологии, которые позволят мне быстро извлечь данные из любого вашего формата. Это входит в цену, указанную выше. Сказанное касается только случая предоставления данных мне в виде файла. Если нужно получить данные с сайта из Интернета - это уже другая задача, парсинг.

Какой срок исполнения работы?

Три рабочих дня, с момента, как подтвержу, что исходный формат взят в работу. Если формат простой (CSV или Excel), то такое подтверждение дам в течение суток.

В каких форматах будет результат?

Результат передается покупателю сразу в нескольких форматах: CSV, JSON, YAML, XML, Excel. На скриншотах выше как раз все они показаны.

Как заказать?

Для заказа - пишите в личку. Оплата - Яндекс.Деньги, WebMoney (WMZ, WMR). После оплаты высылаю результаты на e-mail или выложу в Dropbox.

IBakalov
На сайте с 05.10.2011
Offline
218
#1

Для выделения объектов используется Томита, или какая-то своя разработка?

[Удален]
#2

ТС, вас и ФСБ возьмет на работу...или уже? 🙅

S7
На сайте с 16.05.2015
Offline
5
#3
IBakalov:
Для выделения объектов используется Томита, или какая-то своя разработка?

Все алгоритмы и ПО - собственные. В процессе обработки ни одного обращения к внешним API не происходит.

S7
На сайте с 16.05.2015
Offline
5
#4

Все что связано с адресами - ФИАС (последняя версия от 11.01.2016). По банкам - сборка с разных источников, в том числе с сайта ЦБ РФ через их публичные API. Телефоны - Россвязь, ФИО - собственные справочники имен.

OR
На сайте с 12.05.2014
Offline
62
#5

Можно использовать так: есть ФИО примерный адрес - получить выборку по всем?

S7
На сайте с 16.05.2015
Offline
5
#6
OmgRes:
Можно использовать так: есть ФИО примерный адрес - получить выборку по всем?

Уточните, пожалуйста. Я правильно понял, что, напрмиер, есть строка:

Петров Иван Васильевич Влад. ул Адмирала Кузнецова, 6

И нужно в одну же строку разложить ФИО и адрес на составляющие? Другими словами - не рвать связку ФИО/адрес? Если да - то так можно.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий