Veri Dünyası

Kayıtlar

2014 tarihine ait yayınlar gösteriliyor

Büyük Veri İçindeki Benzer Öğeleri Bulmak

Büyük veri içindeki benzer öğeleri bulma, sıkça karşılaşılan ve çözülmesi kolay olmayan bir problem dizisi yaratmaktadır. Birbirine benzeyen bazı çözüm yolları içinden, biz bu yazıda çoğunlukla Mining of Massive Datasets [1] kitabının üçüncü bölümünde anlatılan çözümü temel alacağız. Bu çözümü anlamaya çalışan okuyucunun karşısına iki zorluk çıkmaktadır. Birincisi, çözüm temel olasılık, küme teorisi ve matris bilgisi gerektirdiğinden, bu konulara uzak olan ya da uzak kalmış kişiler için sıkıntı oluşturabilir. İkincisi, algoritma birden fazla alt algoritmadan oluşmakta ve bu algoritmaların birbiri ile olan ilişkisi çözümün anlaşılmasını zorlaştırmaktadır. Bu nedenle çözümü anlatırken, bu zorlukları aşmak adına araya bazı ek bilgiler girecek ve örneklemeler vereceğim. Umarım bu zor konuyu, daha anlaşılır yapabilirim. Problemin tanımı Büyük verilerin işlenmesi konusu kapsamında bakıldığında benzer öğeleri bulma problemi iki ana alt grupta toplanır. Bunlar benzerliğin;

Devamı