Veri Bilimi & Veri Manipülasyonu

Keşfedici Veri Analizi

Yayın tarihi :15-Ara-21

Keşfedici veri analizi nedir?

Keşfedici veri analizi (Exploratory Data Analysis) veya EDA, veri setlerinin ana özelliklerini özetleyerek anlatma işlemidir. Genellikle görsel çizimlerden faydalanılır. Makine öğrenmesi konularında da göreceğimiz gibi zamanımızın büyük bir kısmını verileri keşfetmek ve düzenlemek alacaktır.

Keşifsel veri analizi nasıl yapılır?

Verileri anazliz etmeye başlamadan önce;

  • Çalışılacak olan veri setinin hangi bilgileri içerdiğinin, satır veya sütunların ne ifade ettiğininin anlaşılması gerekmektedir.
  • Veri setininin analiz yapmak için hazır durumda olup olmadığına bakılır. Her veri seti temiz ve kullanıma hazır bir şekilde bize ulaşmayacaktır. Veri setinde boş alanlar var olması veya aykırı değerlerin olup olmadığı işlemlerimizin sonuçlarını değiştirebilecektir. Bu ve bunun gibi durumları hazırladıktan sonra analiz yapma işine geçmek gerekir.
  • Yukarıda bahsettiğimiz 2 maddeninde sonucunda, veri setini iyi anlayabilmek için EDA komutlarını kullanabiliriz. Bu kodlar:
    • head(n): veri setinin ilk n satırını getirecektir.
    • tail(n): veri setinin son n satırını getirecektir.
    • sample(n): veri setinden rasgele n satır veri getirecektir.
    • shape: veri setinin kaç satır ve sütundan oluştuğunu getirecektir.
    • info(): veri seti hakkında geniş çerçeveli bir bilgi getirecektir. 
    • describe(): veri setinin istatistiksel bilgilerini getirecektir.
    • isnull().sum(): eksik değer sayılarını getirecektir.
    • corr(): veri setinin değişkenleri arasındaki korelasyonu getirecektir. 
Paylaş:

Yorum Yap (*Yorumunuza kod eklemek isterseniz Kod Parçacığı Ekle butonuna tıklayarak ekleyebilirsiniz.)

Yorumlar

Henüz hiç yorum yapılmamış, ilk yorum yapan sen ol.