• Can Duru

Deepfake’i Ayırt Edebilir misiniz?

Kendi yüzünüzün ve hatta sesinizin bir teknolojik kopyasının olmasını ister miydiniz? Deepfake olarak adlandırılan ve Türkçesiyle “Derin Sahte” olan yapay zekâ teknolojisi, ilk olarak 2017 yılındaReddit’deki bir kullanıcının ünlüleri içeren yetişkin içerikli videolar yayınlanmasıyla ortaya çıktı. Tüm dünyaya damgasını vuran bu videoların kısa süre içerisinde içeriğindeki ünlülere ait olmadığı ortaya çıktı. Videolar, ünlü kişilere ait suratların Deepfake teknolojisi sayesinde tamamen farklı bir vücuda yerleştirilmesi sonucunda oluşturulmuştu ve teknolojinin bu gücü birçok kişiyi hayrete düşürmüştü.


Birkaç ay sonra, ilginç bir Deepfake çalışması daha gündeme bomba gibi düştü. Amerika’da yer alan Washington Üniversitesi’ndeki araştırmacılar, Amerika’nın eski başkanı Barack Obama‘nın Deepfake videosunu hazırlamıştı. Bu şekilde, Başkan Obama’nın Deepfake videosu üzerinde istedikleri şekilde oynamalar yaparak Obama’ya akıllarına gelen her şeyi söyletebildiler. Bu durum zaman geçtikçe daha da tehlikeli olmaya başladı. Sadece politikacıların değil; Tom Cruise, Emma Watson, Taylor Swift, Katy Perry, Scarlett Johansson gibi dünyaca ünlü yıldızların da Deepfake videoları hızla yayıldı.

Barack Obama’nın Deepfake ile oluşturulan bir videosu, fark etmek neredeyse imkansız değil mi?


Deepfake; ünlülerin sahte pornografik videolarında, sahte haberlerde, dolandırıcılıkta ve finansal sahtekarlıklarda kullanıldığı için yoğun ilgi görüyor. Bu tarz kullanımların tespiti ve sınırlandırılması adına yeterince aksiyon alınmamasına karşı çok farklı kesimlerden tepkiler yükseliyor.


İlk olarak Deepfake Nedir?

Deepfake ve Reklamcılığın Geleceği adlı içeriğimizde bahsettiğimiz üzere Deepfake gelecekte reklamcılık, film yapımcılığı gibi birçok alanda kullanılabilecek teknolojilerden biri olabilir. Deepfake; mevcut bir görüntü veya videoda yer alan bir kişinin, yapay sinir ağları kullanılarak bir başka kişinin görüntüsü ile değiştirildiği bir medya türü olarak biliniyor. Bu algoritmalar sıklıkla, otomatik kodlayıcılar ve üretken çekişmeli ağlar (GAN’lar) olarak bilinen makine öğrenme tekniklerini kullanıyor ve değiştirilecek medyanın kaynak medya üzerinde birleştirilerek üst üste konması ile üretiliyor.


Peki GAN Ne Anlama Geliyor?

GAN’lar yukarıda belirttiğimiz üzere bir tür derin öğrenme teknolojisini kullanıyor. Sistemde, insan kafalarının ve yüzlerinin nasıl göründüğünü öğrenmek için görüntüler üzerinde bir sinir ağı eğitiliyor ve bu şekilde kaynak görüntüdeki yüzler tespit ediliyor. Bu görüntüleri tespit ettikten sonra algoritma, veri tabanındaki bütün yüzleri kullanarak sıfırdan benzersiz yeni yüzler oluşturabiliyor. Çıktı, ağın incelediği tüm insanların ortalama görünümü olarak düşünülebilir.


Oluşturulan yüz daha sonra gerçek mi yoksa sahte mi olduğunu belirlemeye çalışan başka bir yapay zekâ algoritmasına gönderiliyor. Bu aşamada sahte olduğu anlaşılan görüntüler revize edilmek üzere geri gönderiliyor. Revize etme süreci birkaç kez kendini tekrar ederek ortaya çıkan görüntüleri giderek daha gerçekçi hale getiriyor.

GAN’ın çalışma mekanizması
GAN’ın çalışma mekanizması

Geliştirilen hiçbir yapay zekâ sistemi kusursuz değil. Bu sayede insanların varlığını taklit eden bu görüntüleri algılamak elbette mümkün olabilir. Nasıl mı?


GAN Görüntüsü Nasıl Gerçek Görüntüden Ayırt Edilir?

Amerika’da bulunan New York Eyalet Üniversitesi ve yazılım şirketi Keya Medical’dan oluşan bir araştırmacı ekibi arXiv’de yayınlanan bir makaleye göre, bilgisayar tarafından oluşturulan yüzleri tanımlayabilecekleri ortak bir kusur buldu.


Araştırmacılar, çoğu durumda, kullanıcıların gerçek olmadığından şüphelendikleri bir kişinin gözlerini yakınlaştırarak düzensizliklerini tespit edebildiklerini belirtiyor. Buna ek olarak, bu tür hataları tespit etmek için yazılım geliştirmenin ve sosyal medya sitelerinin bu tür içerikleri kaldırmak için bu yazılımları kullanmasının zor olmayacağını belirtiyor.


Öte yandan, GAN algoritmalarını geliştiren kişiler de bu düzensizliklerden kaynaklanan hataların giderilmesi ve gözlerin daha yuvarlak olmasını sağlamak için basit bir özellik eklenebileceğini belirtiyor.

Gerçek bir insanın fotoğrafı ile GAN algoritması ile geliştirilmiş bir Deepfake fotoğrafına baktığımız zaman aradaki farkı rahat bir şekilde görebiliyoruz.
Gerçek bir insanın fotoğrafı ile GAN algoritması ile geliştirilmiş bir Deepfake fotoğrafına baktığımız zaman aradaki farkı rahat bir şekilde görebiliyoruz.

GAN’lar genellikle insanları taklit etmede iyi bir başarı yakalasa da bazı yüz özellikleri hala sistemler için sorun çıkarıyor ve yapay olarak oluşturulmuş birçok portrede dişlerin, gözlerin ve kulakların etrafında hatalar oluşuyor. Araştırmacılar, insanların Deepfake fotoğraflarını daha rahat fark edebilmesi için bu hataları 4 kategoriye sokuyor:


  • Bulanık ve Gerçekçi Olmayan Arka Planlar

Bulanık, gerçeküstü arka planlar sayesinde birçok insan fotoğrafın gerçek olup olmadığını anlayabiliyor ve bu hatanın en belirgin hata olduğunu söyleyebiliriz. Kişinin arkasına konulan bulanık nesnelere ek olarak pencerenin yamuk yerleştirilmesi gibi hatalar ile Deepfake kendini açığa çıkarıyor.

  • Farklı Kıyafetlerin Birleştirilmesi

GAN’lar kişilere uygun ve uyumlu kıyafet bulmakta zorlanıyor. Birçok gözlük asimetrik çerçevelere sahip olabilir ve buna ek olarak küpeler de çok nadiren eşleşebilir.

  • Diş Sorunları

GAN’lar tarafından oluşturulan ağızlar genellikle şekilsiz görünüyor ve ağızda normalden fazla sayıda diş bulunabiliyor.

  • Saç, Göz ve Cilt

Algoritmaların oluşturduğu sahte görsellerde kıllar alından, kulaktan veya boyunlardan çıkabilir. Başka bir GAN bozukluğu ise su damlası benzeri damlalar cildin belirli noktalarında, özellikle diş bölgesinde, oluşabiliyor. Bu şekilde görselde bir bulanıklık oluşuyor ve bu alan sayesinde Deepfake ile gerçek görseli ayırt edebiliyoruz.

Deepfake tarafından oluşturulan bu görsele baktığımızda, ağzının sağ tarafındaki dişinde bir damla oluştuğunu ve dişlerinin düzensiz olduğunu görebiliriz. Bu düzensizliklerden de anlayabileceğimiz üzere Deepfake henüz tam olarak mükemmel insanı oluşturamıyor.
Deepfake tarafından oluşturulan bu görsele baktığımızda, ağzının sağ tarafındaki dişinde bir damla oluştuğunu ve dişlerinin düzensiz olduğunu görebiliriz. Bu düzensizliklerden de anlayabileceğimiz üzere Deepfake henüz tam olarak mükemmel insanı oluşturamıyor.

Üzerinden sadece 4 yıl geçtiğini göz önüne aldığımızda, Deepfake’in teknolojik açıdan çok iyi bir seviyede olduğunu söyleyebiliriz. Birçok insan, gerçek bir fotoğraf ile Deepfake’i ayıramıyor. Bu içeriğimizde bahsettiğimiz ayırt etme yöntemlerine karşın halen sahte görselleri anlayabilmek farkındalık ve deneyim gerektiriyor. Teknolojinin bu şekilde ilerlemesiyle birlikte belki de yakın bir gelecekte sadece Deepfake ile oluşturulmuş bir film izleyebiliriz. Hatta belki de kendimiz bile en çok sevdiğimiz filmde başrol oyuncusu olabiliriz. Sahtelikle dolu bir dijital dünya bizi bekliyor.

Kaynak: TechXplore, Reuters Graphics



Bu içerik Can Duru tarafından gelecekburada.net için hazırlanmıştır ve basılı veya çevrim içi yayınlarda dağıtımı konusunda hakları elinde tutar. Kaynak göstererek (ve link vererek) paylaşabilirsiniz.