Az IBM Privacy Institute kutatói egy olyan szoftveren dolgoznak, amely automatikusan megváltoztatja (randomizálja) a webhely látogatójának személyes adatait – így azoknak a jövőben nem kell füllenteniük, ha adataikat meg akarják védeni.
Az online látogatók ugyanis gyakran élnek ezzel az eszközzel, így azonban a kereskedő, aki az adatokat termékfejlesztéshez és marketing tevékenységéhez akarja felhasználni, már eleve hibás adatokból kényszerül építkezni. A Dr. Rakesh Afrawal és a Dr. Ramakrishnan Srikant által kifejlesztett szoftver viszont már azelőtt megváltoztatja a fogyasztó adatait, hogy az a kereskedő rendszerébe kerülne – viszont az adatbányászás során mégis érvényes demográfiai információkhoz és modellekhez tud jutni anélkül, hogy ehhez látnia kellene a tényleges fogyasztó valóságos adatait. Amikor a látogató beviszi életkorát, fizetését vagy akár testsúlyát, ehhez a szoftver automatikusan hozzáad vagy elvesz belőle egy tetszőleges értéket – vagyis egy 31 éves felhasználó lehet 42 éves, vagy egy 34 éves 28. A kereskedő viszont meghatározhatja a randomizáció mértékét pl. plusz-mínusz 1-től 12 évig – így ez konstans marad. Az IBM adatbányász szoftvere ennek ismeretében rekonstruálni tudja a valóságos adatokat. A kutatók kimutatták, hogy még 100 százalékos randomizáció esetén is csupán az adatok 5-10 százaléka esik áldozatul a modell pontossága szempontjából. A program egyelőre kutatási szakaszban van, de hamarosan várható a béta verzió.