Sanırım Türkiye'de de defalarca gerçekleştirilen ama bir türlü istenilen noktaya getirilemeyen bir eylem arama motoru yapmak.

Bunun en büyük nedeni ikincil yolların tercih edilmesi. Big data oluşturma ve onu filtrelemek, işlemek yerine nedense kurumlar hep bunu depolayan firmaların yapılarını kullanıyor.

Mesela, Yaani bunlardan birisi, Yandex verilerini sunuyor bize. Her ne kadar biz yandex'ten veri almıyoruz, NTENT üzerinden işliyoruz dense de bu büyük bir yanılgı. Ntent bu verileri oradan alıp işliyor zaten. Yaani'nin tek olayı size farklı bir görünüm içinde sonuç vermek.

Biz geliştirdik şöyle akıllı gibi yorumların hepsi faso fiso.

Ben onun yerine verileri scrap eden gerekirse örümcek ağı olmayan elle eklenen siteleri tarayan bir sisteme bile razıydım. Yeterli onları ranklayıp belirli ranklara göre ön planda çıkarsın. Böyle bir şey yapsalardı ben gereken desteği verirdim. Ama yapmadılar.

Arama motorlarının big datayı kullanacağı kısmın yazılım dili farklı olabilir, php olsun nodejs olsun bu işleri görür, verileri scrap eden botlar için farklı sistemler kurulabilir. Önemli olan bu verilerin hangi önceliğe göre sunulacağı... Yani Google'un artık söylemediği o gizli rank sistemi.

X kelimesini arıyoruz ilgili 1000 site var. Bunları hangi sıraya göre dizeceğini rank sistemi belirler bunu kurdunuz mu arama motoru işi olur.

Tabi ikinci aşamada verilerin belirli güncelleme noktalarında tekrar alınması, frequency'lerin belirlenmesi. Tarama sıklığı. Unutmayın çok büyük bir data alacaksınız. Bot hiç durmadan veri toplayacak.

Bunları yaptıktan sonra Türkçe sitelere hizmet veren bir arama motoru neden olmasın. Olur mu tabi olur.

115 kez gösterildi.



Şeyma Subaşı'nın Kitabı Sadece Şeyma Hakkında