Ana içeriğe atla

Analytics karmaşası

İş zekası alanında çokça kullanılan analytics teriminin, BT dünyasında en çok kafa karışıklığına yol açan terimlerden birisi olduğunu düşünüyorum. Kısaca tanımı verip, sonrasında karışıklığın sebebini vereceğim.
Tanımla başlayacak olursak, analitiksel düşünce (analytical thinking) ,  bir problemi sebep sonuç ilişkisini gözeterek alt parçalara ayırma, analiz etme ve çözümleme yeteneğidir. Bu işlemin yazılan bir bilgisayar programı tarafından eldeki veri kullanılarak yapılmasına ve sonuç çıkarmaya ise analitik (analytics) denmektedir.
Bu tanıma uygun olarak, analytics kelimesi, bilişim dünyasında birkaç sene önceye kadar veri madenciliği ile uğraşanlar tarafından, veri madenciliğinde kullanılan istatistiksel ve makine öğrenmesi yöntemlerini tek kelimede ifade edebilmenin aracıydı. Daha sonraları özellikle Google analytics ürünü ile birlikte web dünyasında temel metrikleri ifade etmek için kullanılmaya başlandı. Bu açıdan bakıldığında, bir web ara yüzünden seçenekler seçilerek oluşturulan ve bu seçeneklerin arka tarafta bir sorgu diline dönüştürülmesi ile birlikte alınan sonuçların grafik bir arayüz ile kullanıcıya sunulduğu ortamların genel ifadesi olarak, iş zekası profesyonellerinin sıklıkla kullandığı bir terim haline geldi. İş zekası alanındaki ürün geliştiricilerin bu kelimeyi sevmesi ile de yaygınlaştı.
Bu şekilde iki ayrı kullanım alanı ile birlikte bir şekilde profesyonellerin bile karıştırabildikleri bir konu haline geldi. Bu sıkıntı, veri madenciliği ile uğraşan kesimin veri işleme dünyasında oran olarak küçük olması nedeni ile yakın zamana kadar çok dikkati çekmedi. Büyük verinin işlenmesi süreçlerinin, veri işleme dünyasına gittikçe daha çok yayıldığı bu günlerde, özellikle büyük verinin işlenmesinin analytics ile eş anlamlı olarak kullanılmaya başlanması, karmaşayı arttırdı. Özellikle in-memory-anaytics teknolojisi ile büyük verinin hızlı bir şekilde sorgulanmasını sağlayan ve verinin RAM üzerinde tutulmasına dayanan sorgulama tekniklerinin gelişmesi ile birlikte bu karmaşa daha da arttı.

Kullanım 1

Büyük veri işlenirken, makine öğrenmesi ve istatistik yöntemler içeren kütüphaneler kullanmadan yapılan analizler, kullanıcı dostu sorgulama olanağı veren araçlar ile yapılır. İş zekası alanında uzmanlaşanlar genelde bu konuda çalışırlar.

Kullanım 2

İstatistik ve makine öğrenmesi yöntemleri içeren kütüphaneler kullanılarak yapılan çalışmalar ise yeni popüler ismi ile veri bilimci (data scientist) lerin çalışma alanıdır. Veri madenciliği yani analytics know-how ı yanında, yazılım geliştirme ve veri işleme tecrübesi de gerektiren bu kullanım ilkine göre daha zordur.

Sonuç

Bu iki kullanımı birbirinden ayırd etmenin kolay yolu, "Hangi analitik (analytics) yöntemini kullandım?" sorusunu sormaktır. Bu soruya net bir cevap veremiyorsanız büyük ihtimal birinci kullanım, aksi durumda ikinci kullanım söz konusudur.

Yorumlar

Bu blogdaki popüler yayınlar

SAS Nedir?

Anthony Barr, James Goodnight, John Sall ve Jane Helwig isimli dört kişi tarafından 1976 yılında Statistical Analysis System i smi ile kurulan fakat yazılım alanında ürettiği ürünlerle bu sınırları aşan SAS (SAS Institute) günümüzde borsaya açık olmayan dünyanın en büyük yazılım şirketlerinin başında geliyor. Hiç kuşkusuz bu dörtlüden en önemlisi, Harvard Business School tarafından* 20 inci yüzyılın en önemli iş liderleri listesinde gösterilen ve aynı zamanda şirketin CEO su olan James "Jim" Goodnight dır. İstatistik alanında doktorası olan Goodnight ayrı bir yazı konusu olmayı hakeden renkli bir kişilik. SAS denince ilk akla gelen öncelikle istatistik ve iş zekası alanlarında marketin önemli oyuncularının başında gelen ve "Bilmenin gücü (Power to know)" nü uzun yıllardır müşterilerinin hizmetine sunan Amerika Kuzey Karolayna merkezli dev bir yazılım şirketi olduğudur. Detaylarda ise genetik, tarım, finans, telekom, uzay, ilaç, kimya, bankacılık gibi birçok farkl

Veri kalitesi işlemlerinde bulanık mantığın (Fuzzy logic) kullanılması

Bulanık mantık (Fuzzy Logic) üzerine 1995 yılında bitirdiğim yüksek lisans tezinde, bulanık mantık ile çalışan bir uzman sistem yapmıştım. O zamanlar bulanık mantık, bilişim teknolojileri alanında yeni yeni emekleme dönemindeydi. Özellikle veritabanlarında bilgi keşfi çalışmaları için kullanılması yönünde oldukça çok akademik çalışma yapılmaktaydı. Günümüzde Bilgi Teknolojileri (BT) sektöründe bulanık mantık dahil diğer bilgi belirsizliği modellerini, BT profesyonelleri "kullanıyor" dememiz zor. Fakat en zor alanlardan biri olan ve gün geçtikçe önemi artan veri kalitesinin arttırılması konusunda yapılan çalışmalarda, bulanık mantık terimi oldukça sık ismi geçen bir terim haline geldi. Bu nedenle yazımızın konusu bu terimin genel anlamından çok veri kalitesinde kullanımı konusunda olacak. Veri kalitesi çalışmalarında fuzzy logic kelimelerini ilk duyduğumda kelimelerin bulanık küme teorisinde kullanılması geldi. Örneğin; çok gürültülü kelimesinin bulanık kümesinin kurulmas

Veriden Bilgiye Dönüşüm Sürecinin Temelleri

Merhaba, Ağırlıklı olarak Telekom sektöründe uzun yıllardır çalışmakta olan birisi olarak, büyük şirketlerdeki verinin ilk çıkış noktalarından, raporlarda yer alması ve karar destek sistemlerinde görünmesine kadar giden süreçler hakkında önemli bir bilgi birikimim oldu. Bu bilgi birikimi farklı noktalardan bakışı gerektirir ve az sayıda profesyonel, bu bakışa sahip olma ayrıcalığını taşır. Sürekli değişen Bilgi Teknolojileri (BT)  araçları ve yüksek rekabet ortamı içinde bu bilgi ve tecrübeyi sürekli güncel tutmakta ayrı bir gayret gerektirir. Tabii ki bu tecrübede kullanılan araçların yeri yadsınamaz. Atalarımız alet işler el övünür derken haklı bir noktaya temas etmişler. Fakat bu bizde, aletin işin en önemli parçası olduğu şeklinde bir yanılsama yaratmasın. Peki, işin en önemli kısmı nedir öyleyse? Bu soruya yanıt vermeden önce sürece biraz yakından bakmakta fayda var. Gerçekte birbirine benzeyen büyük şirket yada kurumlarda (yazının devamında ikisi içinde büyük org