Досега всички знаят, че данните са много ценни. Големите корпорации използват данни, за да вземат решения, които се надяваме да тласнат бизнеса напред и да постигнат по-високо ниво на рентабилност. Като администратори на бази данни, ние защитаваме данните, особено личната информация (PII). Системите са хакнати за получаване на данни. Данните имат голяма стойност и ще трябва да живеете под пословичната скала, за да научите това днес.
Това, за което рядко чета и предмет на тази публикация в блога, е как стойността на данните се променя с течение на времето. Стойността на данните трябва да се използва за управление на вашите политики за задържане.
Повечето данни губят стойността си, колкото по-стари стават. Наскоро работех по проект относно производителността на приложението и показателите, които улавяме, за да измерим тази производителност. Някои хора в проекта искаха да запазят тези показатели за повече от пет години. Проговорих и уведомих групата, че показателите за ефективност от пет години имат нулева стойност. Нашето приложение се променя твърде много през годините. Не можем да сравним ефективността на приложението днес с работата на приложението преди пет години. Няма да е сравнение между ябълки и ябълки.
Не всички стойности на данни намаляват с еднаква скорост. В примера, който дадох в предишния параграф, метричните данни за ефективността на приложението са на стойност нула за пет години. Въпреки това, търговец на дребно, който има данни, показващи, че клиент е закупил пелени преди пет години, сега знае, че клиентът вероятно ще закупи дрехи за пет или шест годишно дете днес. Това дете най-вероятно е в начално училище и може да се нуждае от ученически пособия. В този случай данните за покупките на този клиент отпреди пет години все още имат известна стойност. Данните не са безполезни. Като се има предвид това, не ни трябват всички данни отпреди пет години. Нуждаем се само от обобщение на дейността на този клиент, за да направим смислени заключения относно техните настоящи и бъдещи покупки.
Твърде често виждам как хората третират системите за бази данни като сметище. Данните просто се изхвърлят там и много малко хора се замислят какво да правят с тези данни в дългосрочен план. Много малко хора се замислят колко струват тези данни в дългосрочен план. Има разходи, свързани със съхраняването на тези данни. Ако данните имат малка или нулева стойност поради възрастта си, струва ли си разходите за съхраняване на тези данни в базата данни?
Има смекчаващи стратегии, които да се използват за по-стари данни. Администраторът на базата данни може да премести по-стари данни с по-малка стойност към по-евтино ниво на съхранение. Ако данните имат нулева стойност, данните трябва да бъдат унищожени. Много пъти вече не се нуждаем от пълните подробности за тези стари данни, когато обобщенията са достатъчни, в който случай обобщаваме данните и съхраняваме резултатите. След това се отървете от детайлите.
Като администратор на базата данни, ваша отговорност е да бъдете стопанин на вашите данни и ресурсите, необходими за хостването им. Винаги трябва да питате за подходящите стъпки, необходими, за да се грижите за тези данни с остаряването.