Коллега раньше работал программистом в страховой компании. Один из проектов был - рассылка потенциальным клиентам предложений об "очень выгодной" медицинской страховке. Базы адресатов добывались разнообразными и не всегда легальными путями, и надо было эти базы как-то между собой сопоставить, чтобы не задалбывать людей десятком одинаковых писем, не писать на адрес, с которого человек давно уехал, и в то же время никого не пропустить.
Ну и сопоставляли по множеству критериев: фамилия, имя, дата рождения, номера телефонов, номер социального страхования (редко в каких базах есть), даты обращений к врачам и прививок (а этого добра хватало, базы в основном медицинские) и так далее. Типа если 25 параметров из 40 совпадает, то это тот же самый человек, а если только 24, то скорее всего разные.
...
Читать дальше »