Ana içeriğe atla

Erişilmesini İstemediğimiz Web Sitelerini Yapay Zekadan Yararlanarak Engellemek Mümkün Mü?

     “Bir web sitesi nasıl engellenir” başlıklı yazımızda erişilmesini istemediğimiz web adreslerini manuel olarak nasıl engelleyebileceğimizden birkaç yöntem ile bahsetmiştik. Bu işlemleri gerçekleştirirken aslında erişilmesine izin verdiğimiz web adreslerinin ve erişilmesini istemediğimiz web adreslerinin listesini yapıyoruz. Böylelikle çocuklara daha güvenli bir internet ortamı sağlayabiliyoruz. Peki gerçekten, zararlı olduğunu ya da genç yaştaki bir birey için uygun olmadığını düşündüğümüz web adreslerini manuel olarak tek tek girerek onları bu içeriklerden tamamen korumuş oluyor muyuz? Tabii ki hayır. Aktif olan milyonlarca web sitesinin varlığını düşündüğümüz zaman manuel olarak yapılan bu işlemin iyi bir çözüm olduğuna kanaat getirsek de yeterli olmayacağı aşikardır. Burada akla gelen sorulardan biri manuel olarak gerçekleştirilen bu işlemleri otomatikleştirmek mümkün mü? Yani: Bu işlemi gerçekleştirmek için yapay zekadan faydalanabilir miyiz? 

Konuyu web filtreleme (Web Filtering) olarak ele alacak olursak, bu alan günümüzde de hala güncelliğini korumakta ve her yıl bu alanda birçok makale yayınlanmaktadır. Bu alanda yazılmış makaleleri incelediğimiz zaman günümüze kadar birçok farklı yöntemin ele alındığını göreceğiz. Yazımızda kısaca bu yöntemlerden bahsedeceğiz. 

 

  1. URL Bazlı Filtreleme

 

Zararlı içeriğe sahip web sitelerini filtreleme yöntemlerinden biri URL tabanlı filtrelemedir. 

Önceden tanımlanmış web sitelerinin adresleri (URL) whitelist (Erişime izin verilen web sitelerinin listesi) ve blacklist (Erişimine izin verilmeyen web sitelerinin listesi) olarak mevcut yazılımlar tarafından kullanılmaktadır [1]. Bu tür yöntemler, yazının başında da bahsettiğimiz üzere, sürekli listenin güncellemesini gerektirdiğinden hem zaman hem de maliyet tüketimine neden olduğu için pek etkili değildir. 

 

  1. Anahtar Kelime Filtreleme (Keyword Filtering) 

 

Web filtrelemede sıklıkla kullanılan diğer yöntemlerden biri de anahtar kelime filtrelemedir. Bu yaklaşımda, istenmeyen içerikleri tespit etmek için önceden tanımlanmış, zararlı olduğu düşünülen anahtar kelimeler kullanılır. Test etmek istediğimiz web sitesini ele aldığımızda, bu web sitesinin içerisinde bulunan anahtar kelimeler (Anahtar kelimeler listesi ile karşılaştırılıp) sayılır ve önceden belirlen eşik sayısını aşması halinde web sitesi zararlı olduğu düşünülerek bloke edilir [2].

Bu tür çalışmalar metnin tamamını anlamsal olarak anlama becerisine sahip olmadığından yeterli olmayabilir. Ayrıca, anahtar kelime filtreleme sisteminden kaçmak isteyen zararlı içerik üreticisi, kelimeyi yanlış yazarak kolayca filtreden kurtulabilir.

 

  1. Makine Öğrenmesine Dayalı Filtreleme

 

Yukarıda bahsedilen yöntemlerin aksine yapay zekanın bir alt kümesi olan makine öğrenmesi kullanılarak web filtreleme alanında akıllı analizler yapmak mümkün. Eğer makine öğrenmesinden faydalanacaksak en önemli adımlardan biri ise makine öğrenmesi modelinin eğitilebilmesi için gerekli özniteliklerin çıkartılmasıdır. Makine öğrenmesine aşina değil iseniz öznitelik, her bir veri (Web sitesi) için ölçülebilir, ayırt edilebilir bir niteliktir aslında. Basit bir örnek vermek gerekirse: Ev fiyatlarını tahmin etmeye çalışan bir model geliştirelim. Her bir ev için oda sayısı, genişliği, bulunduğu semt birer özniteliktir. Biz bu özniteliklere bakarak her bir ev için fiyat tahmini yapmaktayız. Aynı durum web siteleri için de geçerli. Web sitelerinden çıkarılan öznitelikler baz alınarak web sitesinin zararlı olup olmadığı farklı makine öğrenmesi modelleri kullanılarak belirlenmeye çalışılır. Bizim örneğimize bakacak olursak, anahtar kelime sayısı, URL uzunluğu, kullanılan hyperlink (köprü) sayısı gibi her bir web sitesine özgü birçok öznitelik kullanılarak, bloke edilmesi gereken web siteleri makine öğrenmesi yardımıyla saptanmaya çalışılır [3]. 

 

  1. Derin Öğrenmeye Dayalı Filtreleme

 

Makine öğrenmesinin bir alt kümesi olan derin öğrenme, web filtreleme alanında oldukça kullanılmaktadır. Derin öğrenme modellerinin, geleneksel makine öğrenmesi modellerine kıyasla bu alanda daha çok tercih edilmesinin sebepleri web sitesi içeriklerinin metin (text) olması (derin öğrenme yaklaşımı metin sınıflandırmada makine öğrenmesine göre daha başarılı sonuçlar vermektedir) ve derin öğrenmenin öznitelik seçme ve çıkarma işlemlerini kendi başına yapmasıdır. Özellikle son yıllarda Doğal Dil İşleme (NLP) alanında kullanılan, derin öğrenme modeli olan, transformer modelleri yaygınlaşmaya başladı. Bu modellerin, metin sınıflandırmada, geleneksek derin öğrenme modellerine göre daha başarılı sonuçlar elde etmesiyle birlikte transformer modelleri web filtreleme alanında da kullanılmaya başlandı. 

 

 

 

REFERANSLAR

 

[1] F. Demirkıran, A. Çayır, U. Ünal and H. Dağ, "Website Category Classification Using Fine-tuned BERT Language Model," 2020 5th International Conference on Computer Science and Engineering (UBMK), Diyarbakır, Turkey, 2020, pp. 333-336,

[2] R. Rajalakshmi and C. Aravindan, ”Naive bayes approach for website classification,” in Information Technology and Mobile Communication. Springer Berlin Heidelberg, 2011, pp. 323-326.

[3] P. Y. Lee, S. C. Hui and A. C. M. Fong, “A Structural and Content- based Analysis for Web Filtering,” Internet Research: Electronic Net- working Applications and Policy, Vol. 13, No. 1, 2003, pp. 27-37.

[4] R. Du, R. Safavi-Naini, and W. Susilo, “Web Filtering Using Text Classification,” Proc. IEEE Int’l Conf. Networks, pp. 325-330, 2003.

Yorumlar

Bu blogdaki popüler yayınlar

Bir Web Sitesi Nasıl Engellenir?

     World Wide Web (WWW) üzerindeki içerikler gün geçtikçe artmakta, web kullanıcılarına zengin içerikler sunmaktadır. Bu durum aynı zamanda zararlı içeriklerin de aynı oranda artmasına sebep olmaktadır. Web üzerinde dolaşan 18 yaş altı gençleri de düşününce bu konuda ciddi adımlar atılması gerektiğini görmekteyiz. Örnek verecek olursak sosyal medya kullanımının oldukça faydalı olduğu zamanlar olsa da paylaşılan içerikler çocuklar üzerinde ciddi hasarlara neden olabilmektedir.  Bu sebeplerden ötürü erişilmesini istemediğimiz web sitelerine erişimi engelleyebilir böylece genç yaştaki insanlar için daha güvenli bir internet ortamı sağlayabiliriz.  Manuel olarak bir veya birden çok web sitesini engellemek istersek uygulayabileceğimiz birçok yöntem mevcut.    1)   Ebeveyn Denetimleri (Parental Controls)   Eğer bir Mac kullanıcısıysanız klavye üzerinden “cmd” ve “space” tuşlarına aynı anda basarak spotlight search arama kısmına Parental Controls yazarak ulaşabilirsiniz. Sistem Tercihl

Komplike Şifreler Sanıldığı Kadar Güvenli mi?

Hem kullanılabilir hem de güvenli bir parola oluşturabilmek için nelere dikkat etmeliyiz? Bilindiği üzere parolalar günlük hayatımızın büyük bir bölümünü oluşturuyor ve bizler genelde, daha sonrasında hatırlayamayacağımız komplike parolalar üretip kullanıyoruz. Peki bu parolalar gerçekten yeteri kadar güvenilir mi? Ya da başka bir deyişle kullanılabilirliği arttırıp, daha kolay hatırlanabilir parolalar oluşturmak mümkün mü?   Gelin bütün olasılıkları beraber inceleyelim ve aynı zamanda parolaları deşifre etmeye çalışan insanların hangi metotlara ihtiyaç duyduğuna bir göz atalım. Bir parolayı deşifre etmek için kullanılan belli başlı yöntemler vardır. Ben yazımda en sık kullanılanlardan bahsedeceğim. Bu konuda ufak bir hatırlatma yapmak istiyorum. Aranızda Mr. Robot izleyenler varsa bir sahnede Elliot, psikiyatristinin erkek arkadaşının sosyal medya hesabına ulaşmak istiyor ve bunu gerçekleştirebilmek için bir sosyal mühendislik uygulamasına başvuruyordu. Evcil hayvanının ism