Ana içeriğe atla

Analytics karmaşası

İş zekası alanında çokça kullanılan analytics teriminin, BT dünyasında en çok kafa karışıklığına yol açan terimlerden birisi olduğunu düşünüyorum. Kısaca tanımı verip, sonrasında karışıklığın sebebini vereceğim.
Tanımla başlayacak olursak, analitiksel düşünce (analytical thinking) ,  bir problemi sebep sonuç ilişkisini gözeterek alt parçalara ayırma, analiz etme ve çözümleme yeteneğidir. Bu işlemin yazılan bir bilgisayar programı tarafından eldeki veri kullanılarak yapılmasına ve sonuç çıkarmaya ise analitik (analytics) denmektedir.
Bu tanıma uygun olarak, analytics kelimesi, bilişim dünyasında birkaç sene önceye kadar veri madenciliği ile uğraşanlar tarafından, veri madenciliğinde kullanılan istatistiksel ve makine öğrenmesi yöntemlerini tek kelimede ifade edebilmenin aracıydı. Daha sonraları özellikle Google analytics ürünü ile birlikte web dünyasında temel metrikleri ifade etmek için kullanılmaya başlandı. Bu açıdan bakıldığında, bir web ara yüzünden seçenekler seçilerek oluşturulan ve bu seçeneklerin arka tarafta bir sorgu diline dönüştürülmesi ile birlikte alınan sonuçların grafik bir arayüz ile kullanıcıya sunulduğu ortamların genel ifadesi olarak, iş zekası profesyonellerinin sıklıkla kullandığı bir terim haline geldi. İş zekası alanındaki ürün geliştiricilerin bu kelimeyi sevmesi ile de yaygınlaştı.
Bu şekilde iki ayrı kullanım alanı ile birlikte bir şekilde profesyonellerin bile karıştırabildikleri bir konu haline geldi. Bu sıkıntı, veri madenciliği ile uğraşan kesimin veri işleme dünyasında oran olarak küçük olması nedeni ile yakın zamana kadar çok dikkati çekmedi. Büyük verinin işlenmesi süreçlerinin, veri işleme dünyasına gittikçe daha çok yayıldığı bu günlerde, özellikle büyük verinin işlenmesinin analytics ile eş anlamlı olarak kullanılmaya başlanması, karmaşayı arttırdı. Özellikle in-memory-anaytics teknolojisi ile büyük verinin hızlı bir şekilde sorgulanmasını sağlayan ve verinin RAM üzerinde tutulmasına dayanan sorgulama tekniklerinin gelişmesi ile birlikte bu karmaşa daha da arttı.

Kullanım 1

Büyük veri işlenirken, makine öğrenmesi ve istatistik yöntemler içeren kütüphaneler kullanmadan yapılan analizler, kullanıcı dostu sorgulama olanağı veren araçlar ile yapılır. İş zekası alanında uzmanlaşanlar genelde bu konuda çalışırlar.

Kullanım 2

İstatistik ve makine öğrenmesi yöntemleri içeren kütüphaneler kullanılarak yapılan çalışmalar ise yeni popüler ismi ile veri bilimci (data scientist) lerin çalışma alanıdır. Veri madenciliği yani analytics know-how ı yanında, yazılım geliştirme ve veri işleme tecrübesi de gerektiren bu kullanım ilkine göre daha zordur.

Sonuç

Bu iki kullanımı birbirinden ayırd etmenin kolay yolu, "Hangi analitik (analytics) yöntemini kullandım?" sorusunu sormaktır. Bu soruya net bir cevap veremiyorsanız büyük ihtimal birinci kullanım, aksi durumda ikinci kullanım söz konusudur.

Yorumlar

Bu blogdaki popüler yayınlar

SAS Nedir?

Anthony Barr, James Goodnight, John Sall ve Jane Helwig isimli dört kişi tarafından 1976 yılında Statistical Analysis System i smi ile kurulan fakat yazılım alanında ürettiği ürünlerle bu sınırları aşan SAS (SAS Institute) günümüzde borsaya açık olmayan dünyanın en büyük yazılım şirketlerinin başında geliyor. Hiç kuşkusuz bu dörtlüden en önemlisi, Harvard Business School tarafından* 20 inci yüzyılın en önemli iş liderleri listesinde gösterilen ve aynı zamanda şirketin CEO su olan James "Jim" Goodnight dır. İstatistik alanında doktorası olan Goodnight ayrı bir yazı konusu olmayı hakeden renkli bir kişilik. SAS denince ilk akla gelen öncelikle istatistik ve iş zekası alanlarında marketin önemli oyuncularının başında gelen ve "Bilmenin gücü (Power to know)" nü uzun yıllardır müşterilerinin hizmetine sunan Amerika Kuzey Karolayna merkezli dev bir yazılım şirketi olduğudur. Detaylarda ise genetik, tarım, finans, telekom, uzay, ilaç, kimya, bankacılık gibi birçok farkl...

Veri kalitesi işlemlerinde bulanık mantığın (Fuzzy logic) kullanılması

Bulanık mantık (Fuzzy Logic) üzerine 1995 yılında bitirdiğim yüksek lisans tezinde, bulanık mantık ile çalışan bir uzman sistem yapmıştım. O zamanlar bulanık mantık, bilişim teknolojileri alanında yeni yeni emekleme dönemindeydi. Özellikle veritabanlarında bilgi keşfi çalışmaları için kullanılması yönünde oldukça çok akademik çalışma yapılmaktaydı. Günümüzde Bilgi Teknolojileri (BT) sektöründe bulanık mantık dahil diğer bilgi belirsizliği modellerini, BT profesyonelleri "kullanıyor" dememiz zor. Fakat en zor alanlardan biri olan ve gün geçtikçe önemi artan veri kalitesinin arttırılması konusunda yapılan çalışmalarda, bulanık mantık terimi oldukça sık ismi geçen bir terim haline geldi. Bu nedenle yazımızın konusu bu terimin genel anlamından çok veri kalitesinde kullanımı konusunda olacak. Veri kalitesi çalışmalarında fuzzy logic kelimelerini ilk duyduğumda kelimelerin bulanık küme teorisinde kullanılması geldi. Örneğin; çok gürültülü kelimesinin bulanık kümesinin kurulmas...

Katılımcı bir dünya

Bugün Devveri.com da okuduğum “ data driven kavramı ve II.faz ” yazısı, yazılım ile çözüm üretme anlayışındaki değişimi bir yönü ile ele alıyor. Ben de başka bir yönü ile aynı konuya bakıyorum ve Ayhan Demirci’nin çizdiği resmi biraz daha tamamladığımı düşünüyorum. Ayhan yazıda SAS ile ilgili örnekler verdiği için, ben de benzer şekilde ilerleyeceğim. İş dünyasının problem çözmede kullandığı temel araçlar olan bilgisayarların mimarisi 1990 lı yılların sonlarından itibaren inanılmaz bir değişim geçirdi. Sıradan bilgisayarların bile çok çekirdekli bir mimariye sahip olabilmesi, konvansiyonel programlama ile ulaşılan çözümlerin sonunu getirdi. Sebep basitti, iki çekirdek bir çekirdekten üstündü ve normal programlama dilleri ile üretilen çözümler tek çekirdeği kullanıyordu. Java gibi diller thread ler vasıtası ile paralel programlama  yapmayı sağlayarak diğer çekirdekleri de kullanmaya fırsat tanıyorlardı. Ne var ki çok zor bir programlama şekli olduğu için çok az...