Bir veri bilimi projesinde veri okuma, veri ön işleme ve veri temizleme işlemlerinin yapılması için kullanılan ve Python programlama dilinin en önemli kütüphanelerinden biri olan Pandas‘ın 2.0.0 sürümünün sürüm adayı, Marc Garcia tarafından duyuruldu. Bu sürümün bazı yeni özellikler, hata düzeltmeleri ve performans iyileştirmeleri içerdiği söyleniyor. Pandas 2.0.0’ı yayınlama sürecindeki olduklarını belirten Garcia; önemli olan yeni bir değişikliğin, panda verileri için yeni Apache Arrow arka ucu olduğunu ifade etti. Pandas tarafından sayısal hesaplamalar için kullanılan NumPy’in, Pandas için popüler kitaplık yapacak kadar iyi olsa da, hiçbir zaman veri çerçevesi kitaplıkları için bir arka uç olarak oluşturulmadığını ve bazı önemli sınırlamaları olduğunu belirten Garcia; Pandas’ın birkaç yıldır NumPy’ye büyük ölçüde güvenmekle birlikte yavaş yavaş ondan ayrıldığını söyledi. Pandas 2.0.0’da tüm veri türleri için Apache Arrow desteğini eklediklerini belirten Garcia; varsayılan olarak Pandas’ın orijinal türleri kullanmaya devam edeceğini ifade etti. Garcia; daha önce de belirtildiği gibi, en önemli önceliklerden birinin mevcut kodu veya API’leri bozmamak olduğunu söyledi. Hiçbir şey gerçekten değişmediğini söyleyen Garcia; ancak dtype’ı Arrow’u kullanmak için değiştirebileceklerini belirtti. Apache Arrow bellek içi veri temsili, belirtiminin bir parçası olarak eşdeğer bir temsil içeriyor. Pandas, Arrow’u kullanarak her veri türü için kendi sürümünü uygulamak zorunda kalmadan eksik değerlerle başa çıkabilecek. Pandas 2.0.0rc1 hakkında bilgi edinmek için sürümler sayfasını inceleyebilirsiniz.
Pandas 2.0.0rc1 edinmek için aşağıdaki linkten yararlanabilirsiniz.