Data Blending

    Samet İlhan

    Verileri birlikte kullanmak istediğimizde sıklıkla başvurduğumuz yöntemlerden biri join, ama bazı durumlarda bunu yapamıyoruz.
    İki tablo arasında kurulacak join veriyi çokluyor olabilir. Tabi bir ETL süreci çalıştırmak ve/veya view oluşturup oradan almakta buna bir çözüm olarak sunulabilir ama sonuçta anlık olarak bir rapor çıkarmak istediğinizde elinizin altındaki bir özellik hayat kurtarıcı olabiliyor.

    Bir diğer durum ise farklı veri kaynakları arasında join yapılamıyor olması. Örneğin, excel ve x veritabanı arasında bir join kurulamıyor. Tableau 10 versiyonuyla birlikte buna olanak sağlamış olsa da eski versiyonları kullanmaya devam eden/edecek olanlar için data blending hala bir çözüm önerisi.
    Data blending iki veri kaynağını yerel bilgisayarınızda left joine yakın bir şekilde birleştirerek gerçekleştirir. Left joinde sol taraftaki veri sağ taraftaki kırılım sayısına göre çoklama yapar. Bunun sonucunda soldaki veride eğer bir ölçütünüz varsa bunların hesaplamalarında bu çoklamaya dikkat etmeniz gerekir.
    Bunun yanında data blending özelliği ise sol tarafı tek satır bırakır ve sağ tarafı toplayarak bir kolon olarak veriye ekler. Ölçütler için tam olarak istenen sonuç elde edilse de ekstra gelen bir boyuta kırılım gibi davranmayacak ve * olarak gösterecektir.
    Örnek vermek gerekirse join ve blend sonuçları alttaki gibi olacaktır.

    Gelelim bu özelliği nasıl kullanacağımıza…
    Aynı çalışma kitabında veri kaynaklarınıza bağlantılar kurun ve sanki tek veri kaynağı gibi gerekli bulduğunuz alanları her iki veri kaynağından ekrana sürükleyip bırakın.

    Ekrana eklediğiniz verilerden bir kısmı normal görünürken bir kısmının sağında turuncu işaretli bir silindir göreceksiniz. Aynı işaret veri kaynağı kısmında da ismin sol tarafında mevcut. Bu verinin ikincil veri olduğunu gösterir. Bu ayrımı Tableau ekrana ilk eklediğiniz veri kaynağını birincil veri kaynağı, diğer veri kaynaklarını (birden fazla da olabilir) ise ikincil veri kaynağı olarak kabul eder. Ana veriyi seçerken bunu göz önünde bulundurmanız gerekir.
    İkincil veri kaynaklarında bazı alanların sağında gri, eğer kullanılmışsa (ekrana veri attığınızda otomatik olur ya da el ile siz tıklayarak yapabilirsiniz) kırmızı ataş ikonu göreceksiniz. Tableau varsayılan olarak aynı isimdeki alanları bir join alanı olarak kabul edip bunların yanına bu ikonları ekleyerek join yapabileceğiniz alanları belirler. Tabi isimler aynı değilse bu listede görünmez sizin bunu Tableau’ya söylemeniz gerekir.
    Bunu üstteki sekmelerden “Data > Edit Relatioships…” yolunu izlediğinizde gelecek olan pencerede yapabilirsiniz.

    Gelen pencerede birincil ve ikincil veri kaynağını seçtikten sonra hemen sağındaki Custom opsiyonunu seçip, ardından aktif olan Add butonuna tıklayarak join alanınızı ekleyebilirsiniz.

    Custom opsiyonunu seçtiğinizde aktif olan listeni üzerine geldiğinizde sağ tarafında çıkan kırmızı x ikonuna tıklayarak istemediğiniz join alanlarını kaldırabilirsiniz. Zorunda değilsiniz çünkü rapor yaparken ataç gri ise bunları join alanı olarak kullanmıyor olacaksınız.

    Bunun yanında join alanlarını eksik kullanırsanız üstteki gibi sayıların yanlış olduğunu göreceksiniz. Kırmızı ataştan anlayacağınız gibi yıl bazında bir join var ve her yıl kendi içinde toplanmış. Bunun yanından ekranda İl kırılımı var ama sonuçta bu il kırılımını joine eklemediğimiz için sayılar her il için aynı gelmiş durumda. İl kırılımını da joine eklediğimizde sonuçları doğru olarak buluyoruz.

    Bunun yanında isterseniz ikincil veri kaynağı üzerinden hesaplanmış alanlarda oluşturabilirsiniz.

    İlgili Yazılar

    Leave a comment

    Your email address will not be published.