Качество на данните
Качество на данните (на английски: data quality) е термин, с който се описва състоянието на даден набор от стойностите на качествени и количествени променливи величини. Съществуват много дефиниции на понятието „качество на данните“, но като цяло данните се смятат за качествени, ако „отговарят на целта, за която са предназначени за опериране, вземане на решения и планиране“.[1] Алтернативно, данните се смятат за качествени, ако коректно представят конструктите от реалния свят, за които се отнасят.
Наред с тенденцията обемите от данни да стават все по-големи, на преден план излиза и въпросът за вътрешната съгласуваност на данните (data consistency), без значение дали тези данни отговарят на нуждите на каквато и да е конкретна външна цел. Различните потребители могат да имат различни виждания за качеството на данните, дори когато става въпрос за един и същ набор от данни, използвани за една и съща цел. За осигуряване на качество на данните може да е необходима допълнителна процедура по пречистване на данните (data cleansing).[2]
Източници
[редактиране | редактиране на кода]- ↑ Redman, Thomas C. Data Driven: Profiting from Your Most Important Business Asset. Harvard Business Press, 30 декември 2013. ISBN 978-1-4221-6364-1.
- ↑ What is data scrubbing (data cleansing)? – Definition from WhatIs.com
Тази страница частично или изцяло представлява превод на страницата Data quality в Уикипедия на английски. Оригиналният текст, както и този превод, са защитени от Лиценза „Криейтив Комънс – Признание – Споделяне на споделеното“, а за съдържание, създадено преди юни 2009 година – от Лиценза за свободна документация на ГНУ. Прегледайте историята на редакциите на оригиналната страница, както и на преводната страница, за да видите списъка на съавторите.
ВАЖНО: Този шаблон се отнася единствено до авторските права върху съдържанието на статията. Добавянето му не отменя изискването да се посочват конкретни източници на твърденията, които да бъдат благонадеждни. |