Veri Bilimi & Veri Manipülasyonu - Pandas

Dış Kaynaklı Veri Seti Yazma

Yayın tarihi :23-Ara-21

Oluşturulan bir veri setini dış kaynak olarak Pandas kütüphanesi aracılığı ile aşağıda sıralanan yapılar ile istenilen formatta kaydetme işlemi yapılabilmektedir.

  • to_csv
  • to_dict
  • to_excel
  • to_feather
  • to_gbq
  • to_hdf
  • to_html
  • to_json
  • to_latex
  • to_markdown
  • to_numpy
  • to_parquet
  • to_period
  • to_pickle
  • to_records
  • to_sql
  • to_stata
  • to_string
  • to_timestamp
  • to_xarray
  • to_xml

**Not: Aşağıdaki söz dizimi "to_csv" baz alınarak oluşturulmuştur. Yaklaşık olarak diğerlerinde de aynı söz dizimi geçerlidir.

Söz dizimi: DataFrame.to_csv(path_or_buf=None, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression='infer', quoting=None, quotechar='"', line_terminator=None, chunksize=None, date_format=None, doublequote=True, escapechar=None, decimal='.', errors='strict', storage_options=None)

  • path_or_buf, kayıt yapılacak dosya ismi veya adresini temsil etmektedir.
  • sep, kayıt işleminde verilerin hangi karekter ile ayrılacağını temsil etmektedir. Varsayılan olarak "," dür.
  • header, oluşturulan veri setinin kayıt esnasında başlık kısmını alınıp almayacağını temsil etmektedir.
  • index, oluşturulan veri setinin kayıt esnasında index değerinin alınıp alınmayacağını temsil etmektedir. "True" olarak seçilmesi durumunda "Unnamed:0" adında yeni bir sütun oluşacaktır.

Örnek-1: Rastgele verilerden oluşan bir veri seti oluşturarak bu veri setini "myDataSet.csv" adında bilgisayar ortamına kaydedelim. Daha sonra da kaydedilen veri setini tekrar okuyalım.

import pandas as pd
import numpy as np

df=pd.DataFrame(data=np.random.randint(1,20,(6,4)),
               columns=["S1","S2","S3","S4"])
df

Çıktı:

df.to_csv("myDataSet.csv")

Yukarıdaki işlem sonucunda çalışma dosyasının olduğu alanda "myDataSet.csv" adlı bir dosya oluşacaktır. Kaydedilmiş olan bu dosyası okuyarak inceleyelim.

df=pd.read_csv("myDataSet.csv")
df

Çıktı:

"Index=True" özelliği aktif olduğundan dolayı "Unnamed:0" adlı bir sütunun da (eski index değerlerini tutan sütun) veri setine dahil olmuştur. Bunu kayıt esnasında kaldırarak tekrar veri setine okuma işlemi yapalım.

#veri seti kaydedildi
df.to_csv("myDataSet.csv",index=False)
#veri seti okundu
df=pd.read_csv("myDataSet.csv")
df

Çıktı:

Paylaş:

Yorum Yap (*Yorumunuza kod eklemek isterseniz Kod Parçacığı Ekle butonuna tıklayarak ekleyebilirsiniz.)

Yorumlar

Henüz hiç yorum yapılmamış, ilk yorum yapan sen ol.