Öylemesine meraktan yapılmış minik bir proje. Tabi ki sub-ethadaki o efsane eksistats’in yerini tutamaz ama benim gibi gündem istatistiklerini merak edenlere bi nebze yardımcu olabilir.

Ekşisözlük yonetimiyle ya da sahipleriyle uzaktan yakindan alakam yok. Bu benim tamamen bos zamanlarimda ugrastigim bir proje. Herhangi bir geribildirim, sikayet ve/veya oneriyi reddit.com/r/eksistats’tan ya da [email protected]’dan bana aktarabilirsiniz. Kahve ismarlamak isterseniz de hayir demem hehe.

Metodoloji:

  • Sadece gundem basliklari goz onunde bulundurularak yapildi
  • Her basligin her entrysini cekmek imkansiza yakin ve eksisozluk.com’a gereksiz yuk bindirmeye gerek yok
  • Zamanla yeni istatistikler eklenecek (yersen)
  • Katkida bulunmak isteyenler kendi yazdiklari entryleri mail atabilirler: info[at]eksistats.co
  • Ve yine katkida bulunmak isteyenler icin kendi kullandigim chrome uzantisini paylasabilirim. Daha redditimsi bir hale ceviriyor.

Özel teşekkür

Zemberek kütüphanesini kendi yazdığım ekstra bir kütüphane ile birleştirerek kelime köklerini çıkarmak için kullanıyorum. Bu işin Türkçe’de ne kadar zor olduğunu okumak isteyenler için Zemberek makalesini buraya bırakıyorum.

Yol Haritasi

Istatistikler

  • Yazarlarin aylara ve gunlere uretkenlik dagilimi
  • Infografikimsi tivitler
  • Tivitte daha fazla bilgi - siteye girilmesine gerek kalmasin
  • Per yazar istatistikleri
  • Per yazar kac tane entry girildi
  • Yazarlar en aktif gun
  • yazar basina en cok fav alan 10 entry
  • gunun one cikan yazar - en cok fav almis yazarlar
  • En cok total fav kullanilmis basliklar
  • haftanin en iyi cikis yapan yazari vs

Uzun vade

  • Yazar bazinda filtreleme - dinamik bir siteye donusu gerektiriyor.

iletisim

  • Discord?

Teknik Altyapı

Planim sitenin butun kodlarini github’a koymak. Belki birine bir faydasi dokunur. Sorunum bu aralar pek vaktim olmamasi.

Site geliştirirken kullandığım teknolojiler (Meraklısına):

  • Frontend
    • Site full statik => Jekyll tabanli.
  • Analiz pipeline’i
    • Hesaplamalar
      • Pandas, numpy
    • Natural Language Processing
      • NLTK (veri temizligi, stemming)
      • gRPC uzerinden zemberek ile stemming (kok ayristirma)
      • Kendi yazdigim minik bi performansi les gibi redis tabanli stemming kutuphanesi.
    • Gorsellestirme
      • Python’un wordcloud kutuphanesi.
      • ImageMagick tabi ki.
  • Veri saklama
    • Mongodb + sqlite + baya bi json.
  • üçüncü parti veriler (daha eklemedik)
    • Twitter trending topics
    • Google Trends
  • Sosyal medya entegrasyonu
    • Twitter && Reddit API