Veri Düzeni Tanımlama ve Örnek |
Foodski
İçindekiler:
Nedir?
Veri düzeltme , bir veri kümesinden aykırı değerleri çıkarmayı içeren istatistiksel bir tekniktir. bir model daha görünür…
Nasıl çalışır (Örnek):
Örneğin, bir üniversitenin son 10 yıldaki suç verilerini analiz ettiğini varsayalım. Şiddet içeren suçların sayısı şu şekildedir:
Gördüğünüz gibi, çoğu zaman üniversite yılda 15'ten az suçla karşılaşır. Ancak, 2006 ve 2007 yıllarında, üniversitenin kamu güvenliği ekibinin deneysel raporlama gereksinimi nedeniyle 44 yaşandı. Raporlama deneyi, şiddet suçlarının tanımını o yıllarda çalınan her tür hırsızlığı da içerecek şekilde değiştirdi ve bu da kampüsteki “şiddet” suçlarının sayısında büyük bir sıçrama yarattı. Eğer bu yılları ortalamaya dahil edersek - yani, bir miktar veri pürüzsüzlüğü yaparsak - üniversite yılda ortalama 19 şiddet suçu yaşadı. Ama eğer bu yılları geride bırakırsak, daha gerçekçi bir ortalamanın yılda 13 şiddet suçu olduğunu görebiliriz -% 32 bir fark.
Neden Önemlidir:
Hareket etmeyi kullanma da dahil olmak üzere verileri düzeltmenin birçok yolu vardır. ortalamalar ve algoritmalar. Buradaki fikir, veri yumuşatmanın kalıpları daha görünür hale getirmesi ve böylece hisse senedi fiyatlarındaki, müşteri eğilimlerindeki veya diğer herhangi bir işletme bilgisindeki değişiklikleri tahmin etmede yardımcı olmasıdır. Bununla birlikte, veri yumuşatma, önemli bilgileri gözden kaçırır veya önemli gerçekleri daha az görünür kılar; diğer bir deyişle, verilerin "kenarlarını yuvarlama" bazı verileri aşırı vurgulayabilir ve diğer verileri göz ardı edebilir.