Segmentasyon en kaba ifadeyle benzer olanları bir araya getirilerek yapılan bir işlem. Supervised bir machine learning modeli olan classification yerine hatta profiling yerine bile sektörde çoğu zaman “segmentasyon” kelimesi kullanıldığına defalarca şahit olmuşuzdur.
Kavramlar bu kadar iç içe girmişken o halde en temele inmek ve benzerliği tanımlayarak başlamakta fayda var.
Tabii ki benzerliğin ne olduğunu tanımlamak, hele de bunu metrik bir şekilde ifade etmek oldukça zor. İki şeyin bir birine benzer olup olmadığını nasıl tarif edebilirsiniz ki?
{Elma, Armut , Kalem} nesnelerinden oluşan kümeyi ele alalım. Her bir nesne için yazdığım kelimelerin aklımıza getirdiği özellik setleri var. Buna göre eminim ki ilk akla gelen Elma ve Armut’u bir kümeye, Kalem’i bir başka kümeye koymak olmuştur ki gayet mantıklı. Peki ya ilk akla gelenin dışında bir kümelemeye ihtiyaç duyuyorsanız? Hatta bu farklı kümelemenin nasıl olması gerektiği ile ilgili fikriniz dahi yoksa?
Tecrübe ve Adaptasyon
Hemen her e-ticaret firmasında “son X gün ziyareti olmayanlar”, “son Y gün alışveriş yapmayanlar” gibi temel analizlerinin yapıldığını biliyoruz. Bunun gibi çalışmalar en az ar-ge masrafıyla en hızlı çözümü sağlaması açısından oldukça kıymetli. Lakin şu var ki bu tarz uygulamalarda başarı elde edebilmek için parametreleri doğru belirlemek çok kritik. Eminim sizler de iftiharla sunulan yüzlerce segmente bölünmüş müşteri analizleri görmüşsünüzdür, tabii overlapping %80+ 🙂 Kısaca domain bilgisi ve tecrübe bu metodoloji özelinde çok büyük önem taşıyor.
Ne var ki bugünlerde yaratıcı pazarlama ekiplerinden neşet eden ezber bozan kampanyalar müşteri davranışı noktasındaki bilgi birikimini silip süpürebiliyor. Her firmanın kendi etki alanındaki pazar dinamiklerini kurcalayıp durduğunu düşündüğümüzde verinin bir çok boyuttaki patternlerini yakalamakla kalmayıp hızlı değişimine de ayak uydurabilen algoritmalara ihtiyaç duyulduğu aşikar.
Zira kuralları biz belirlediğimizde cerrah hassasiyetiyle tek tek milyonlarca müşteriye ait verileri inceleyip ayrı ayrı mikro segmentlere yerleştirmemiz gerekir ki buna ne zaman ne insan kaynağı yeter. Biz yapana kadar o segment belki tamamen yok olur. Saklı öznitelik çıkarımı tam da bunun için var.
Nedir Bu Saklı Öznitelikler?
Aslında burada belirli bir tanım yok. Zaten hangi segmenti nasıl tanımlayacağımızı bilmediğimizden dolayı bu yolu seçtik. İşin tanım tarafı biraz “Explainable AI” kavramı içine giriyor.
Bu işlemin amacından bahsetmek daha doğru sanırım. Amacımız her bir temsil eden özet sayısal bir ifade elde etmek ki diğer müşteri verileriyle benzerlik hesapları yapıp gruplayabileyim.
İlk olarak müşterimizin çeşitli ortamlarda bıraktığı izleri sayısallaştırarak çok boyutlu bir matris üretmek var. Bu izler ziyaret günü, süresi, sepete eklediği ürünlere ait bilgiler vs gibi uzayıp gidebilir. İzlerin sayısallaştırılmasının, mesela “sepete eklediği ürünlere ait bilgiler” dediğimiz verinin matematiksel modeller içerisinde nasıl elde edildiğinin detayına girmeyeceğim, her boyuttaki verinin doğru yöntemlerle vektörize edilebildiği ön kabulüyle devam ediyorum.
Bu izleri değerlendirmedeki zorluk, ortaya çıkan veri yapılarının hem çok boyutlu hem de oldukça seyrek/sparse olmaları. Bundan dolayı anlamlı bağlantılar ortaya çıkarmak cidden zor.
Şuna benzetebiliriz; koca bir futbol sahasına rastgele dağılmış sadece 20 tane kırmızı 16 tane yeşil bilye olsun. İstenen ise kırmızı ve yeşil bilyelerin konum bilgilerine göre bir şablon ortaya çıkarmak ve yeşil kırmızıya X kadar mesafede ölçümünü yapabilmek. Dolayısıyla buradaki ilk amaç bu seyrek/sparse datayı içerdiği anlamlı veriyi kaybetmeden dense hale getirmek. İşte elde edeceğimiz bu dense vektör saklı öznitelikleri temsil ediyor.
Burada çeşitli yöntemler uygulanabilir. Mesela direkt belli bir thresholdun altındaki verileri silebilirsiniz, muhtemelen çalışmaz ama pratik olur 🙂 Zaten sayfanızı ziyaret eden müşterilerin %98’i alış veriş yapmadan çıkıyordur. Her geleni alış veriş yapmayacaklar diye “tahmin” edince accuracy %98. Daha ne olsun.
Burada Birol Kuyumcu ve Nasrettin Hoca’ya bir selam vererek devam edelim. http://derindelimavi.blogspot.com/2005/06/zeka-hakknda-kssal-yazlar-3.html
Biz LSTM ve CNN türlerinde yapay sinir ağı mimarileri üzerine bina edilmiş yöntemler denedik. Bilimsel standartlar içerisinde gerekli karşılaştırma ve çalışmaları tamamlayınca detaylarını yayın olarak çıkaracağız. Elde edilen öz nitelikleri temsil eden dense vektör, müşterilerin bir birine benzetilerek mikro gruplara bölünmesine imkan sağlayacak çözünürlükte. Her bir mikro grubun tanımlanması ise dediğim gibi “explainable ai” kapsamında. Ya da pazarlama bölümlerindeki uzmanların detay incelemeleri ile ortaya çıkarılabilir.
Şimdilik oldukça cesaret verici ön test sonuçlarından bahsedersem; Takip eden 1 ay içerisinde alış veriş yapma ihtimali en yüksek 30K kişilik gruptan %66, ihtimali bir seviye daha düşük 330K kişilik gruptan ise %17 müşteri gerçekten tahmin edildiği gibi alış veriş yaptı. Bundan sonrası tabii ki pazarlama ekiplerine kalıyor. Bu %66 ‘ya ne yapılacak güzel bir soru.
Kategori Teorisi
Şimdilik saklı öznitelikleri kullanarak basit çok boyutlu mesafe ölçümleriyle denemeler yaptık. Kategori Teorisi ise bu alanda çok daha başarılı çalışmalar yapmaya imkan sağlayabilecek kapılar açıyor.
Bu konuda Bartosz Milewski’yi takip etmenizi mutlaka tavsiye ederim. https://bartoszmilewski.com/
Yukarıdaki havalı duran diyagramdan anlaşılamayacağı gibi 🙂 kategori teorisi basitçe ;
Birbiriyle ilişkili matematiksel nesne sınıflarıyla ilgilenir. Yani uzayı kategorilere bölerek ele alır ve kabaca nesnelerin birbirleriyle farklı biçimlerdeki morfizimleri üzerine kuruludur. Hem her bir ayrı kategorideki nesneleri birbirleriyle hem de ayrı kategorilerdeki morfizimleri birbirleriyle ilişkilendiren genel fonksiyonlar tanımlar.
Tek kelimeyle kategori teorisi tekil nesneleri analiz etmekle uğraşmaz tamamen ilişkilerle ilgilenir.
Mathematical objects are determined by–and understood by–the network of relationships they enjoy with all the other objects of their species.
– Barry Mazur
Tekrar müşteri analitiğine bağlarsak, saklı öznitelikler çıkararak müşterilerimizi matematiksel nesnelere dönüştürdük. Bunlar arasında mikro gruplar içerisinde ilişkiler ve kalıtımlar söz konusu. Dolayısıyla tüm müşteri uzayını anlamak ve üzerinde nesne özelinde sorgular yapabilmek için kategori teorisine ihtiyacımız var.
Müşterileri ilişkiler ağıyla tanımlayabilirsek daha sonra yapılması gereken eventlerin ortaya çıkmasını beklemek. Mesela alış veriş! Bir müşteri alış veriş yaptığında hemen onunla ilişkili müşterileri bulabiliriz ve bunların alış verişe en yakın müşteriler olduğunu söyleyebiliriz.