Box Plot, Matplotlib kütüphanesi içerisinde bulunan boxplot minimum, birinci çeyrek, medyan, üçüncü çeyrek ve maksimum gibi özelliklere sahip veri değerleri kümesinin özetini görüntülemek için kullanılmaktadır. Boxplot grafiğinde, girdi verilerinin birinci çeyrekten üçüncü çeyreğe kadar ki değerlerini kapsayan bir kutu oluşturulur ve oluşturulan kutu içerisinde ortanca değer üzerinde dikey bir çizgi bulunmaktadır. Grafik iki farklı eksenden (x ve y) oluşur ve bu grafikte x ekseni çizilecek verileri gösterirken y ekseni frekans dağılımını gösterir.
Söz dizimi: boxplot (x, notch=None, sym=None, vert=None, whis=None, positions=None, widths=None, patch_artist=None, bootstrap=None, usermedians=None, conf_intervals=None, meanline=None, showmeans=None, showcaps=None, showbox=None, showfliers=None, boxprops=None, labels=None, flierprops=None, medianprops=None, meanprops=None, capprops=None, whiskerprops=None, manage_ticks=True, autorange=False, zorder=None, *, data=None)
- x, x ekseninde(yatayda) alacağı değerler listesidir.
Bir grafiğin nasıl elde edileceği bilgisi aşağıdaki örnekler içersinde detaylandırılarak anlatılmıştır.
Örnek-1: Rastgele olarak 2 farkı değişken oluşturalım ve bu değişken değerlerini görselleştirelim.
#Gerekli kütüphaneler import edildi
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
#Değişken ataması yapıldı
x=np.random.normal(10,1,20) #ortalaması 10, standart sapması 1, 20 tane data
y=np.random.normal(10,2,20) #ortalaması 10, standart sapması 2, 20 tane data
print("x="+str(x))
print("y="+str(y))
Çıktı:
x=[10.14889672 10.72461519 7.69675031 11.13491586 10.33146166 10.97846402 9.17698654 8.22039121 8.47584872 10.52215067 8.98939875 7.57948951 11.275914 9.83350569 8.89051702 8.4498993 10.72486725 11.21264963 9.76755219 7.46357301] y=[ 8.37158507 7.92689261 10.16177269 10.12007643 8.09613029 7.67676029 8.05204672 8.82199046 11.38829811 10.05550602 6.51127664 14.39823741 7.81537554 7.3317078 9.70635726 11.59665778 10.36797624 13.17343048 12.36213744 6.80486293]
Değişken ataması yapıldığı için artık görselleştirme aşamasına geçilebilir. Görselleştirme aşamasında Figure ve Axes konusunda görülen yapının aynısı kullanılacak olup sadece ilgili grafik çizme yöntemi ne ise (burada Box Plot) ilgili eksene yerleştirilecektir.
plt.figure(figsize=(8,4))
plt.boxplot(x)
plt.title("X verisetinin boxplot grafiği")
plt.xlabel('X sutünu')
plt.ylabel('Y sutünu')
plt.savefig("resim1.png",dpi=128)
Çıktı:
Örnek-2: Rastgele olarak 2 farkı değişken oluşturalım ve bu değişken değerlerini görselleştirelim.
#Kütüphaneler import edildi
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
#Değişken atama işlemleri yapıldı
x=np.random.normal(10,1,20) #ortalaması 10, standart sapması 1, 20 tane data
y=np.random.normal(10,2,20) #ortalaması 10, standart sapması 2, 20 tane data
#Görselleştirme yapıldı
plt.figure(figsize=(8,4))
plt.boxplot([x,y])
plt.title("X verisetinin boxplot grafiği")
plt.xlabel('X sutünu')
plt.ylabel('Y sutünu')
plt.savefig("resim2.png",dpi=128)
Çıktı: