Makine öğrenimi adı verilen bir yapay zeka dalı etrafımızda. Facebook tarafından içeriği düzenlemeye (ve bizi reklamlarla hedeflemeye) yardımcı olmak için kullanılıyor, Google bunu her gün milyonlarca spam mesajını filtrelemek için kullanıyor ve bu, OpenAI botunun geçen yıl üç maçtan ikisinde Dota 2 şampiyonlarını yenmesini sağlayan şeyin bir parçası. Görünüşte sonsuz kullanımlar var. Microsoft ve Intel, yığına bir tane daha ekleyerek, gri tonlamalı bir görüntü dönüştürme işlemi yoluyla kötü amaçlı yazılımları tespit etmede şaşırtıcı derecede doğru olan akıllı bir makine öğrenimi çerçevesi geliştirdiler.
Microsoft, Statik Görüntü Kötü Amaçlı Yazılım Ağ Taraması veya STAMINA adını verdiği bir blog gönderisinde (ZDNet aracılığıyla) teknolojiyi ayrıntılı olarak anlattı. Üç aşamalı bir süreçten oluşur. Basitçe söylemek gerekirse, makine öğrenimi projesi, ikili dosyaları alarak ve bunları iki boyutlu görüntülere dönüştürerek başlar.
Görüntüler daha sonra çerçeveye tanıtılır. Bu ikinci adım, temel olarak algoritmanın mevcut bilgisi üzerine inşa etmesine yardımcı olan ve aynı zamanda görüntüleri mevcut eğitimiyle karşılaştıran transfer öğrenme adı verilen bir süreçtir.
Son olarak, sürecin kötü amaçlı yazılım örneklerini tespit etmede ne kadar etkili olduğunu, kaç tanesini kaçırdıklarını ve ne kadar hatalı bir şekilde kötü amaçlı yazılım olarak sınıflandırıldıklarını (yanlış pozitifler olarak adlandırılır) görmek için sonuçlar analiz edilir.
Çalışmanın bir parçası olarak Microsoft ve Intel, 2,2 milyon dosyadan oluşan bir veri kümesini örnekledi. Bunların yüzde 60’ı algoritmayı eğitmek için kullanılan bilinen kötü amaçlı dosyalardı ve yüzde 20’si onu doğrulamak için kullanıldı. Kalan yüzde 20, programın gerçek etkinliğini test etmek için kullanıldı.
Microsoft, dosyalara STAMINA uygulayarak, yöntemin kötü amaçlı dosyaların %99,07’sini doğru bir şekilde tespit ettiğini ve sınıflandırdığını ve %2,58’lik yanlış pozitiflik oranıyla iddia ediyor. Bunlar harika sonuçlar.
“Sonuçlar kesinlikle kötü amaçlı yazılım sınıflandırma amaçları için derin aktarım öğreniminin kullanımını teşvik ediyor. Bu, süreçte zamandan ve hesaplama kaynaklarından tasarruf sağlayan optimal hiperparametreler ve mimari aramaları için aramayı atlayarak eğitimi hızlandırır, ”diye açıklıyor Microsoft.
STAMINA sınırsız değildir. Sürecin bir kısmı, bunun gibi bir uygulama için piksel sayısını yönetilebilir hale getirmek için görüntüleri yeniden boyutlandırmayı içerir. Bununla birlikte, daha fazla analiz ve daha büyük uygulamalar için Microsoft, yöntemin “milyarlarca pikseli JPEG görüntülerine dönüştürme ve ardından yeniden boyutlandırma sınırlamaları nedeniyle daha az verimli hale geldiğini” söylüyor.
Başka bir deyişle, STAMINA, dosyaları laboratuvarda test etmek için harika çalışıyor, ancak daha büyük bir kapasitede kullanılmadan önce biraz ince ayar yapılması gerekiyor. Bu, muhtemelen Windows Defender’ın STAMINA’dan hemen faydalanmayacağı anlamına gelir, ancak belki bir noktada faydalanacaktır.