25 Aralık 2023 Pazartesi

Açık kaynak zekası ve yapay zeka: GELSI literatürünün sistematik bir incelemesi

Günümüzde açık kaynak istihbaratı (OSINT), yani kamuya açık kaynaklardan elde edilen bilgiler, Batı'daki Kolluk Kuvvetleri (LEA) ve istihbarat servisleri tarafından yürütülen tüm istihbarat faaliyetlerinin yüzde 80 ila 90'ını oluşturmaktadır. Veri madenciliği, makine öğrenimi, görsel adli tıp alanındaki gelişmeler ve en önemlisi ticari kullanım için mevcut olan artan bilgi işlem gücü, OSINT uygulayıcılarının istihbarat toplama ve analizini hızlandırmalarını ve hatta bazen otomatikleştirmelerini ve daha doğru sonuçları daha hızlı elde etmelerini sağlamıştır. İnfosfer sürekli artan çevrimiçi varlığı barındıracak şekilde genişledikçe, eyleme geçirilebilir OSINT havuzu da genişlemektedir. Bu gelişmeler, yönetişim, etik, yasal ve sosyal etkiler (GELSI) açısından önemli endişeleri gündeme getirmektedir. Daha gelişmiş veri analiz araçlarından bazıları çok az denetim gerektirdiğinden veya hiç denetim gerektirmediğinden, standart gizlilik endişelerinin yanı sıra yeni ve önemli gözetim endişeleri ortaya çıkmaktadır. Bu makale, ilgili literatürün sistematik bir incelemesini sunmaktadır. GELSI çerçevesi ile ilgili olarak yapay zeka destekli OSINT kullanımı (ve OSINT yazılımının geliştirilmesi) hakkındaki literatürün mevcut durumunu değerlendirmek, potansiyel boşlukları vurgulamak ve yeni araştırma yönleri önermek için 571 yayını analiz etmektedir.

1. Giriş

İstihbarat çalışmalarıyla ilgili literatür, açık kaynak istihbaratının (OSINT), yani kamuya açık kaynaklardan elde edilen istihbaratın, tüm çağdaş istihbarat materyallerinin yüzde 70 ila 90'ını oluşturduğunu iddia etmektedir (Hulnick 2002, 566; Ünver 2018, 5). Açık kaynaklı bilgiler arttıkça ve bilgisayar bilimi, veri bilimi ve istatistikten daha verimli teknikler geliştirilerek toplama ve analiz kolaylaştırıldıkça bu tahmin şaşırtıcı değildir. Yapay zekâ (YZ) sistemlerinin gelişmesiyle birlikte yetenekler arttıkça, performans OSINT analistleri tarafından kullanılan teknik araçların kalitesiyle ayrılmaz bir şekilde bağlantılı hale gelmektedir. Sonuç olarak, bu gelişmelerin yönetişimiyle ilgili önemli konular hem akademik hem de uygulamalı alanlarda ortaya çıkmaktadır. Gerçekten de, OSINT döngüsünün her aşamasıyla (yönlendirme, toplama, işleme, analiz, yayma ve entegrasyon ve geri bildirim) etkileşime giren YZ sistemlerinin artan karmaşıklığının ortaya çıkardığı zorlukların üstesinden gelmek için uygun yasal, etik ve düzenleyici çerçevelerin tasarlanması çok önemli hale gelmiştir (Savunma Teknik Bilgi Merkezi (DTIC)-Savunma Bakanlığı 2013). [Dipnot1] Bu eğilimi dikkate alan bazı önceki çalışmalar, uygulamalı literatürde OSINT analizi için YZ algoritmalarının kullanımına genel bir bakış sağlarken (Evangelista vd. 2021), diğer yazarlar Genel Veri Koruma Yönetmeliği'nin (GDPR) OSINT'in toplanması ve analizi üzerindeki etkisine odaklanmıştır (Shere 2020b). Bununla birlikte, şimdiye kadar, OSINT'e uygulanan Yönetişim, Etik, Yasal ve Sosyal Etkiler (GELSI)[Dipnot2] çerçevesinin kapsamlı bir incelemesi hala eksiktir. Bu makale, Grant ve Booth'ta (2009, 102) tanımlandığı üzere OSINT-GELSI literatürünün sistematik bir incelemesini, yani ilgili literatürün sistematik bir şekilde araştırılmasını ve analiz edilmesini sağlayarak bu boşluğu doldurmayı amaçlamaktadır. Bu, OSINT makalelerinin bibliyografik veri setinin toplanması ve daha sonra GELSI çerçevesi ile ilgili makalelerin belirlenmesi için incelenmesi ile gerçekleştirilmektedir. Daha sonra mevcut araştırma, altında yatan ana temalara göre özetlenmekte ve bazı yeni araştırma yönleri önerilmektedir.

Makale aşağıdaki şekilde yapılandırılmıştır. İkinci bölüm OSINT'in daha detaylı tanımlarını sunmakta ve yıllar içerisinde kapsamı ve uygulamalarına ilişkin kısa bir tarihsel genel bakış sunmaktadır. Dijital devrim sayesinde, OSINT yeteneklerinin veri kullanılabilirliği ve hesaplama gücü açısından büyük ölçüde arttığını savunuyoruz. Ayrıca, GELSI çerçevesinin çalışma tanımını ve YZ denetimi ve düzenlemesi üzerine mevcut araştırmalarla nasıl ilişkili olduğunu da sunuyoruz. Üçüncü bölüm, bibliyografik veri setini elde etmek için kullanılan metodolojiyi detaylandırmakta ve OSINT literatürünün farklı kolları üzerinde yürütülen bibliyometrik bir analizin sonuçlarını sunmaktadır. Yayınlardaki büyük artışa rağmen, GELSI çerçevesi ile ilgilenen makalelerin hala daha geniş akademik çalışmaların küçük bir alt kümesi olduğunu ve OSINT toplama ve analizi ile ilgilenen teknik makalelerin en büyük grup olduğunu göstermektedir. Bununla birlikte, düşük yayın sayıları hesaba katıldığında, GELSI makalelerinin hem atıf sayıları hem de arama motorlarındaki sıralama açısından yıllar içinde giderek daha etkili hale geldiğini de göstermektedir. Dördüncü ila altıncı bölümler, GELSI açısından ilgili literatürün sistematik bir incelemesini sunmakta ve incelenen materyallerin çoğunun temelini oluşturan ana temaları vurgulamaktadır. Yedinci bölümde, yapay zeka destekli OSINT sistemlerinin rolü ile ilgili gelecekteki araştırma yönleri önerilmektedir. Son olarak, sekizinci bölüm ana bulguları özetlemekte ve makaleyi sonlandırmaktadır.

2 Açık kaynak zekası, yapay zeka ve GELSI çerçevesi

OSINT ile ilgili literatürün büyük bir kısmı, OSINT için uygun bir tanım bulmaya adanmıştır. Bu kolay değildir, çünkü istihbarat analizi kavramı ilgili literatürde hala tartışmalıdır (Ish vd. 2021), farklı yazarlar ve kurumlar farklı tanımlar sunmaktadır ve OSINT'in herhangi bir tanımının, istihbarat toplama ve analiz yeteneklerini sürekli olarak genişleten bilgisayar ve veri bilimi ve yapay zekadaki gelişmeleri içermesi gerekmektedir. En eski tanımlardan biri, istihbarat kurumları arasında açık kaynaklı bilgi farkındalığını artırmayı amaçlayan bir belge olan 301 sayılı İstihbarat Topluluğu Direktifinde bulunmaktadır. Direktif 301, OSINT tanımını 109-163 sayılı Kamu Yasası'ndan (ya da 2006 tarihli Ulusal Savunma Yetkilendirme Yasası'ndan) ödünç almış ve şunu belirtmiştir:

Açık kaynak istihbaratı (OSINT), kamuya açık bilgilerden üretilen ve belirli bir istihbarat ihtiyacını ele almak amacıyla toplanan, kullanılan ve uygun bir kitleye zamanında dağıtılan istihbarattır

(Kamu Hukuku 109-163 2006, Bölüm A, Başlık IX, Alt Başlık D, Bölüm 931)

Bu tanım oldukça geniştir ve OSINT uygulamalarının geniş yelpazesini detaylandırmamaktadır. Gerçekten de, erken tarihinin büyük bir bölümünde OSINT, düşmanın niyetleri hakkında stratejik bilgi edinmek için Mihver yayınlarını dinlemek, tercüme etmek ve analiz etmekle görevli olan Amerika Birleşik Devletleri (ABD) Yabancı Yayın Bilgi Servisi (FBIS) gibi ofisler tarafından yabancı medyanın fiziksel olarak alınması ve analiz edilmesiyle sınırlı kalmıştır (Mercado 2001). Bu, ana görevleri belge alma ve çeviri olan ve toplanan materyal üzerinde bazı içerik analizleri dışında çok az analitik çalışma gerektiren birinci nesil OSINT'ti (Williams ve Blum 2018, 40).

Yüzyılın başında manzara dramatik bir şekilde değişti. ABD'de FBIS'in yerini alan Açık Kaynak Merkezi'nin (OSC) 2005 yılında kurulması, önemli yenilikleri esas olarak dijital devrim tarafından mümkün kılınan ikinci nesil OSINT'in başlangıcına işaret etmektedir. Ünver (2018) tarafından gözlemlendiği üzere, "klasik" OSINT'ten "dijital" OSINT'e geçiş, kabaca dilbilimsel ve metin tabanlı, jeo-uzamsal, ağ tabanlı ve görsel adli tıp olmak üzere dört ana gruba ayrılabilecek güçlü ve daha önce düşünülemeyen araçların kilidini açmıştır.

Dilbilimsel araçlar metinsel verilerin elde edilmesi ve analizi ile ilgilidir ve OSINT'in birinci ve ikinci nesilleri arasında açık bir köprü oluşturmaktadır. İlkinde analistler değerli bilgileri tespit etmek ve yönetici özetleri üretmek için belgeleri elden geçirirken, ikincisinde bilgisayar algoritmaları anahtar kelimeleri çıkarmak ve bağlamlarını belirlemek için dijitalleştirilmiş belgeleri taramaktadır. Doğal Dil İşleme (NLP), dilbilim ve yapay zekanın kesiştiği noktada yer alan ve farklı alanlardaki metinsel verilerin analiziyle ilgilenen bir disiplindir. Makine öğreniminde konu keşfi, varlık tanıma ve otomatik metin özetleme gibi çok çeşitli sorunları çözmek için tasarlanan birçok algoritma (Ünver 2018, 8), bilgi erişim algoritmalarıyla birlikte çevrimiçi gazetelerden ve sosyal medyadan toplanan açık kaynaklı bilgileri analiz etmek için uygulanmıştır. Bu sayede araştırmacılar büyük veri havuzlarını hızlı bir şekilde sıralayarak anlamsal kalıpları tespit edebilmiş, uzun belgeleri tercüme edip özetleyebilmiş ve duygu analizi yoluyla davranış değişikliklerini tespit edebilmiştir (Chen 2011; Neri vd. 2012; Asghar vd. 2015). 

Jeo-uzamsal araçlar, açık kaynaklı bilgilerin doğrudan veya dolaylı olarak bir aktörü veya bir grup aktörü uzayda konumlandırdığı herhangi bir yöntemi ifade eder. Ticari uydu görüntülerinin ve diğer uzaktan algılama araçlarının ortaya çıkması, jeo-uzamsal OSINT'i artık web'den çıkarılan konumları uydu görüntüleriyle üst üste bindirebilen, zaman içindeki hareketleri ve konumlar arasındaki bağlantıları görselleştirebilen analistler arasında çok popüler hale getirmiştir (Ünver 2018, 11). Jeo-uzamsal OSINT uygulamaları arasında coğrafi konum belirleme, coğrafi çıkarım, yani açık coğrafi etiketleme bilgisi olmadan kullanıcıların konumlarını alma ve coğrafi referanslama, yani coğrafi nesneleri benzersiz bir şekilde tanımlama yer almaktadır (Williams ve Blum 2018, 33).

Ağ tabanlı araçlar, varlıklar arasındaki ikili ilişkileri inceleyen bir disiplin olan ağ biliminden ödünç alınan önlemlerin kullanılmasını içerir. Sosyal ağ verileri, ilişkiler kolayca toplanıp haritalandırılabildiği ve aktörler arasındaki ilişkilerin gücü tespit edilebildiği için harika bir OSINT kaynağı oluşturmaktadır (Ünver 2018, 12). Merkezilik ölçütleri daha sonra bir ağdaki varlıklar için hesaplanabilir ve analistlerin grup içindeki bilgi akışını düzenlemede her bir birimin göreceli önemini ölçmesine olanak tanır. Bu araçlar terörist ağların incelenmesinde önemli uygulamalar bulmuştur (Wiil 2011) ve daha doğru tahminler elde etmek için muazzam miktardaki çevrimiçi sosyal ağ verilerinden giderek daha fazla yararlanmaktadırlar.

Son olarak, görsel adli tıp araçları, görüntü ve video dosyalarından değerli bilgilerin çıkarılmasına yönelik tekniklerdir (Ünver 2018, 13-14). Örneğin, dijital kameralarda ve akıllı telefonlarda Değiştirilebilir Görüntü Dosyası Formatı (EXIF) altında depolanan meta veriler, dosyanın oluşturulduğu tarih, saat ve konum gibi önemli bilgiler sağlayabilir. Ayrıca, üzerinde oynanmış görüntüleri tespit etmeye ve fotogrametrik analiz (fotoğraflardan ve videolardan ölçümler elde etme) yapmaya yönelik araçlar da OSINT analistinin kullanımına sunulmuştur.

Toplama ve analiz sürecinin çoğunu otomatikleştirmek için yapay zekaya artan güven, analistin gözetiminden ziyade bilgisayar algoritmalarına ve otomatik muhakemeye daha fazla bağımlı olan üçüncü nesil bir OSINT'in ortaya çıkmasını öngörmektedir (Williams ve Blum 2018, 39-40).

Yukarıdaki tarihsel alıntı, OSINT'in birleşik bir tanımını yapmanın ne kadar zor hale geldiğini göstermektedir. Gerçekten de, diğer istihbarat toplama disiplinlerinden farklı olarak, OSINT dijital dünyadaki gelişmelerden destek almakta ve etki alanı bu gelişmelerle birlikte genişlemektedir. Yeni veri kaynakları yaygın olarak kullanılabilir hale geldikçe, bunlardan daha önce gizli kalmış yeni örüntüler öğrenilebilmekte ve farklı istihbarat uygulamaları arasındaki çizgiler daha da bulanıklaşmaktadır [örneğin, Williams ve Blum'da (2018) OSINT'in artırılmış gerçeklik alanına olası bir genişlemesine ilişkin tartışmaya bakınız].

Yine de, bu zorluklara rağmen, yukarıdaki sunum OSINT'in geniş kapsamlı olanaklarını göstermek ve çalışmamızı tanıtmak için yeterlidir. İlerleyen sayfalarda, ikinci ve üçüncü nesil OSINT'in GELSI'si ile ilgili literatürü gözden geçireceğiz. GELSI çerçevesinin resmi bir tanımı henüz formüle edilmemiş olsa da, geniş bir yaklaşım benimsiyoruz (üçüncü bölümdeki anahtar kelime spesifikasyonunun gösterdiği gibi) ve yapay zeka destekli OSINT kullanımının getirdiği anlamlı değişiklikleri veya potansiyel zararları ele alan her türlü makaleyi, bu tür sorunlara önerilen çözümlerle birlikte GELSI ile ilgili literatür olarak kabul ediyoruz. Aşağıdaki bölüm nasıl ilerlediğimizi açıklamaktadır.

3. Metodoloji

Bibliyografik veri setimizi oluşturmak için, araştırmacıların birden fazla akademik veri tabanını sorgulamasına ve analiz yapmak için ortaya çıkan referans listesini dışa aktarmasına olanak tanıyan bir yazılım olan Publish or Perish (PoP, Harzing 1997) kullandık. İki ana akademik veritabanı olan Google Scholar ve Scopus'u sorguladık. Mümkün olduğunca çok materyali dahil etmek için, makalenin başlığında yalnızca "Açık Kaynak İstihbaratı" ifadesini veya kısaltması olan "OSINT" ifadesini istedik. Ayrı bir aramada, aynı kriteri "Açık Kaynak Bilgisi" ifadesi ve kısaltması "OSINF" için de belirledik. Her iki veritabanında da aynı iki sorguyu çalıştırdık ve toplamda dört sorgu elde ettik. Tablo 1, PoP tarafından sağlanan sonuçların sayısı ile birlikte bu aramanın sonuçlarını özetlemektedir. Veri kümeleri dışa aktarıldıktan sonra, bunlar birleştirildi ve hem platform içi hem de platformlar arası kopyaları ve mevcut analizle ilgisiz olduğu düşünülen çalışmaları kaldırmak için tarandı. Bunlar arasında yüksek lisans tezleri, konferans konuşmaları, yönetici özetleri ve arama terimlerini içeren ancak farklı, ilgisiz bir bağlamda yer alan diğer makaleler gibi belgeler yer almaktadır.

Sağ sütunlarda görülebileceği gibi, her iki veri tabanında da sonunda çıkarılan girişlerin sayısı yüksektir. Elendikten sonra geriye 571 makale ya da orijinal veri setinin yaklaşık %55'i kalmıştır. Veri temizleme ve toplama sürecinin son adımı olarak, makalelerin özetleri için web'de tarama yaptık. PoP, bibliyografik dosyalarında bir özet girişi sağlar, ancak özetler yalnızca Google Scholar'dan alınan girişler için mevcuttur ve yalnızca arama sonuçları sayfasından indirilen önizlemelerdir. Bu nedenle, her bir makalenin Dijital Nesne Tanımlayıcısına (DOI) dayalı olarak özetlerin metnini almak için bir ayrıştırma betiği tasarlanmıştır. DOI'lerin açılış sayfalarının HTML yapıları oldukça çeşitli olduğundan, betik yalnızca %43,87'lik bir erişim hassasiyeti elde etmiştir. Bu nedenle, hiçbir özet taranamadığında veya DOI eksik olduğunda, bunun yerine PoP özeti saklanmıştır.

İlk veri temizleme adımlarından sonra, veri kümesini farklı literatür gruplarına ayırmak için bir anahtar kelime arama rutini gerçekleştirdik. İlk olarak, Dijital OSINT'e özel bir odaklanma ile OSINT toplama, analiz ve yorumlamanın pratik yönleriyle ilgilenen çalışmalar olarak tanımladığımız Uygulayıcı Literatürüne ait olanları belirlemek için her girdinin başlığını, özetini ve dergi adını yineledik. Bu belgeler, OSINT toplama için verimli veri madenciliği tekniklerinin geliştirilmesi, sosyal medya istihbaratı için OSINT platformlarının oluşturulması, varlık sıralaması ve tanımlaması için NLP algoritmalarının optimizasyonu veya OSINT verilerinden siber tehdit sınıflandırması için derin öğrenme modellerinin kullanılması gibi çok çeşitli konuları kapsamaktadır. Bununla birlikte, OSINT döngüsünün her aşamasında ortaya çıkan sorunlar için algoritmik çözümlere odaklanan araştırmalarının uygulamalı doğası ortaktır.

Uygulayıcı literatürü veri setimizden çıkarıldıktan sonra, elimizde istihbarat literatürü olarak tanımladığımız, yani OSINT'i bir disiplin olarak ele alan belgeler kalmıştır. Bir kez daha, bu, diğer konuların yanı sıra, disiplinin ortaya çıkışı ve evrimine ilişkin tarihsel anlatımlar, OSINT uygulamalarına ilişkin vaka çalışmaları ve OSINT'i standart istihbarata göre kullanmanın avantaj ve dezavantajlarına ilişkin teorik incelemeleri içeren geniş bir kategorizasyondur. OSINT literatürünün bu alanından, GELSI çerçevesi ile ilgili herhangi bir makaleyi çıkarmaya çalıştık. Bunu yapmak için, makalelerin başlıkları, özetleri ve dergi isimleri üzerinde ikinci bir anahtar kelime araması gerçekleştirdik. Her bir başlığı tanımlamak için kullanılan anahtar kelimelerin listesi, konumları ile birlikte Tablo 2'de verilmiştir. Kullanılan anahtar kelimelerin bazıları çok spesifiktir (anahtar kelime aramasından önce belirlenen belirli makaleleri hedeflemektedir). Ancak, çoğu geneldir ve OSINT külliyatının dışında da uygulanabilir. Bu yaklaşım sorunsuz değildir. Gerçekten de, bazı makaleler herhangi bir alanda belirtilen anahtar kelimelerden herhangi birine sahip olmayabilir, bu nedenle diğer ikisinden birine aitken İstihbarat kategorisine girebilir. Dahası, bazı girdiler, içerikleri yukarıdaki kategorilerden hiçbirine tam olarak uymadığı için zor sınıflandırılabilir. Bununla birlikte, ortaya çıkan veri kümesi girişlerinin doğrudan ve dikkatli bir şekilde incelenmesi, makalelerin yalnızca küçük bir kısmının yanlış sınıflandırıldığını ortaya koymuştur. Bu hata düzeltilmiştir. Sorunların çoğu, mevcut incelemenin odak noktası olmayan Uygulayıcı ve İstihbarat başlıkları arasında sadece bazı küçük çakışmalarla ilgilidir.

Anahtar kelimeler belirlendikten ve literatür dizileri döndürüldükten sonra, bunların yüzde dağılımını Şekil 1'de çizdik.


GELSI temalı makaleler tüm külliyatın yalnızca yaklaşık %12'sini oluştururken, geri kalan makaleler uygulayıcı ve istihbarat alanları arasında eşit olarak bölünmüştür. Şekil 2'de, OSINT literatürünün son otuz yıldaki evrimini görselleştiriyoruz.

Yayınlanan makalelerin sayısı 1990'ların başından bu yana ve özellikle son on yılda önemli ölçüde artmıştır. Uygulayıcı literatürü en yüksek artışa tanıklık ederken, GELSI bursu da son yıllarda önemli ölçüde büyümüştür. Bu, sürekli artan OSINT veri havuzuyla başa çıkmak için güncel pratik araçlar geliştirmenin algılanan önemini ve bu tür araçlarla başa çıkmak için uygulanabilir etik ve yasal çerçevelere duyulan ihtiyacı göstermektedir. Yukarıdaki grafiklere bakıldığında, bu ihtiyacın yalnızca kısmen ele alındığı görülmektedir. Gerçekten de, GELSI bursu, yayın sayısı bakımından daha geniş OSINT literatürünün yalnızca küçük bir alt alanı gibi görünmektedir. Bununla birlikte, her bir yayının diğerleri üzerinde ne kadar etkili olduğunu kontrol etmek de ilgi çekici olabilir. Şekil 3, atıf sayısının yayından bu yana geçen yıl sayısına bölünmesiyle elde edilen, her bir makalenin yıl başına aldığı atıf sayısını göstermektedir. Uygulayıcı ve istihbarat literatüründeki çok etkili birkaç aykırı değer dışında, çoğu makale araştırma alanından bağımsız olarak her yıl aynı atıf performansı etrafında kümelenmektedir. Son birkaç yılda, yayın sayısındaki genel artışla uyumlu hafif bir yükseliş eğilimi tespit edilebilir.


Bunun yerine, her bir literatür alanını ayrı bir külliyat olarak ele alırsak, yani atıf oranlarını her yıl aynı alandaki yayın sayısına göre normalize edersek, resmi olarak şu şekilde tanımladığımız yıllık ortalama atıf oranlarını elde ederiz:

Z(t,f): = \frac{1}{N(t,f)}\sum\limits_{i = 1}^{N(t,f)} {c_{i} (t,f),}

Bu şekilde, belirli makalelerin göreceli önemi yerine, her bir alanın göreceli önemi ve yıllar içindeki evrimi hakkında kabaca bir tahmin elde ederiz. Grafikte tespit edilebilen net bir eğilim olmamasına rağmen, GELSI makalelerinin OSINT külliyatının yalnızca %12'sini oluşturmasına rağmen aniden nasıl öne çıktığını ve bazen diğer alanlardaki makalelerden bile daha etkili olduğunu görebiliyoruz.

Son olarak, her bir alanın göreceli etkisini ölçmede yararlı olan bir başka ölçüt de Google Scholar sıralaması, yani her bir makalenin Google Scholar sorgularındaki konumudur. Şekil 5, her bir alt alan için Google Scholar sıralamalarının frekans dağılımını göstermektedir. Bu sıralamaların Tablo 1'deki her bir sorgudan sonra PoP tarafından otomatik olarak kaydedildiğini ve bu nedenle daha sonraki anahtar kelime aramalarından etkilenmediğini unutmayın.


Gerçekten de, teknik ve istihbarat makaleleri neredeyse örtüşen sıra dağılımlarına sahipken, GELSI makaleleri değerlerinin çoğunu en üstte yoğunlaştırmakta ve kısa süre sonra azalmaktadır. Anlaşıldığı üzere, GELSI makalelerinin %72'si ilk 200 sonuç içinde bulunurken, bu oran geri kalan literatür alanları için yaklaşık %54'e düşmektedir. Olasılık oranını hesapladığımızda, GELSI makalelerinin 1 ile 200 arasında bir sıralamaya sahip olma olasılığının diğer alanlara ait makalelere göre iki kat daha fazla olduğunu keşfediyoruz (p < 0.01).

Atıf sayılarının Google Scholar'ın sıralama algoritmasında önemli bir rol oynadığı gösterilmiştir (Beel ve Gipp 2009). Ancak, yukarıdaki grafik ve hesaplamaların gösterdiği gibi, her bir makalenin sıralaması hesaplanırken dikkate alınan tek ölçüt bu değildir. Aslında, makalenin yazarı ve dergisi gibi diğer değişkenler de sıralamayı etkilemektedir. OSINT külliyatının etik, yasal ve sosyal sonuçlarıyla ilgilenen küçük bir alt kümesinin, en önde gelen akademik arama motorlarından biri tarafından geri kalan daha geniş literatürden daha üst sıralarda yer alma olasılığının daha yüksek olması, düşük yayın sayısına rağmen bu alanın alaka düzeyini kanıtlamaktadır. Bu nedenle, OSINT-GELSI literatürünün derinlemesine araştırılması ve araştırmacıların bunu nasıl daha da geliştirebilecekleri konusunda rehberlik sağlanması son derece önemlidir.


İnceleme boyunca, burada açıklanan bibliyografik veri kümesine ait olmayan makalelere de atıfta bulunuyoruz, çünkü ya sorguların gerekliliklerinden herhangi birine uymuyorlar ya da tartışılan konulara gerekli bağlamı sağlamaya yardımcı oldukları tespit edildi. Aslında, diğer, hatta belki de gevşek bir şekilde ilgili alanlarda ortaya konan konular, modern OSINT uygulamaları için normatif bir çerçeve açısından kazanılacak çok şeyle birlikte OSINT ortamına kolayca uygulanabilir. Aşağıdaki bölümler analizin sonuçlarını sunmaktadır.

4. OSINT-GELSI literatürünün gözden geçirilmesi

İlgili literatürün analizinin ardından, Şekil 6, daha kapsamlı OSINT külliyatı bağlamında GELSI bursunun önerilen bir taksonomisini ve her alan için en öne çıkan temalardan bazılarını sunmaktadır. Anlaşıldığı üzere, iki ana analiz seviyesini ayırt edebiliriz.


Mikro düzey, OSINT döngüsünün ortaya çıkardığı yasal ve etik zorluklara, özellikle de toplama aşamasında ortaya çıkan gizlilik sorunlarına odaklanarak OSINT'in bireyler ve kuruluşlar üzerindeki etkisini ele almaktadır. Bu konuları ele alan makaleleri Bölüm 5'te analiz ediyoruz.

Makro düzey, OSINT'in genel olarak toplum üzerindeki etkisi ile ilgilidir. Bu makaleler, vatandaş aktivizminin ortaya çıkışı ve OSINT veri ve tekniklerinin yaygınlaşmasıyla tetiklenen kullanıcıların çevrimiçi alışkanlıklarındaki değişiklikler gibi konuları ele alarak açık kaynaklı bilginin sosyal, yönetişimsel ve hatta davranışsal sonuçlarına odaklanmaktadır. Bölüm 6'da bu temaları inceliyor ve bu makalelerde öne sürülen ana argümanları vurguluyoruz.

Son olarak, Bölüm 7'de, OSINT analistleri tarafından YZ algoritmalarına giderek artan güven göz önüne alındığında, OSINT-GELSI literatürünün nasıl gelişeceğini ele alıyoruz. Mikro düzeyde, ortaya çıkan bu eğilimler, OSINT döngüsünün işleme ve yayma aşamalarında YZ algoritmalarının denetlenmesini içerirken, makro düzeyde asimetrik teknolojik avantaj ve kurumsal hesap verebilirlik konuları etrafında dönmektedir. Ayrıca, Glassman ve Kang'ı (2012) takip ederek, OSINT'i bir problem çözme stratejisi olarak ele alıyor, kullanıcıların bilgiye yaklaşımını değiştiriyor ve YZ'nin bu süreci nasıl etkileyebileceğine odaklanıyoruz.

5. Mikro düzeyde OSINT'in GELSI'si

GELSI literatüründeki ilk ve en belirgin tema, ikinci ve üçüncü nesil OSINT'in mikro sonuçlarıyla ilgilidir. Bu literatür temel olarak açık kaynaklı veri toplama ve analizinin yasal ve etik yönlerini incelemektedir. Koops (2013) bazı bilgilerin kamuya açık olmasının mahremiyet kaygılarının tamamen göz ardı edilmesi gerektiği anlamına gelmediğini savunmaktadır. Dahası, modern OSINT teknikleri çeşitli bilgi parçalarını bir araya getirebilmekte ve her bir unsur anonim kaynaklardan gelse bile fiziksel kişileri tanımlayabilmektedir (profilleme). Bu nedenle, OSINT'in bireysel haklar üzerindeki etkisini ele almak için bir çerçeveye duyulan ihtiyaç literatürde oldukça belirgindir (Rahman ve Ivens 2020). Öyle ki, OSINT soruşturmalarında mahremiyet konusunu ele alan birkaç Avrupa projesi yıllar içinde finanse edilmiştir.[Dipnot3] Bu projeler, gelişen Avrupa veri koruma çerçevesini takip ederek, farklı polislik bağlamlarında Kolluk Kuvvetleri (LEA) arasında OSINT'in alınması, analizi, yönetimi ve yayılması için platform çözümleri geliştirmeyi amaçlamıştır (Cuijpers 2013; Casanovas ve ark. 2014).

Sonuç olarak, uygulayıcı (Dupont vd. 2011; Amardeilh vd. 2013; Ortiz-Arroyo 2015) ve GELSI alanlarında çok sayıda literatür üretilmiştir. İkincisi esas olarak Avrupa araştırma projelerinin bir parçası olarak geliştirilen belirli OSINT yazılım araçlarına odaklansa da, temel etik ve yasal kaygılar da ortaya konmaktadır. En önemli konu, OSINT araştırmalarının bireylerin mahremiyeti üzerindeki etkisidir ve bu endişeleri gidermek için başvurulan çerçeve Tasarım Yoluyla Mahremiyettir (PbD). Cavoukian ve Borking tarafından 1990'larda yaygınlaştırılan (Hustinx 2010, 253) ve daha sonra veri koruma mevzuatında benimsenen (örneğin bkz. GDPR 2016, Madde 25) bir kavram olan PbD, veri analiz yazılımı ve platformlarının tasarımı sırasında bireysel mahremiyeti korumayı amaçlayan Mahremiyet Artırıcı Teknolojilerin (PET'ler) oluşturulmasıyla bağlantılıdır (Cuijpers 2013). Bu davranışı varsayılan olarak gerçekleştirmek için çeşitli ilkeler önerilmiştir. Colesky ve diğerleri (2016) bunları PbD stratejilerine rehberlik etmesi gereken sekiz taktikte özetlemektedir: en aza indir, gizle, soyutla, ayır, bilgilendir, kontrol et, uygula ve göster. Bu taktikler hem veri toplama hem de kullanma aşamalarını kapsamakta ve şifreleme, anonimleştirme, veri birleştirme, bilgilendirilmiş onay ve denetim stratejileri gibi temel araçları içermektedir.

Ek olarak, Koops ve diğerleri (2013) PbD ilkelerini OSINT platformlarına doğrudan dahil etmenin iki yolunu önermektedir: geri alınabilir gizlilik ve kurumsal gizlilik politikaları. Bunlardan ilki, kişisel verilere "yalnızca önceden tanımlanmış bir koşul karşılandığında" erişime izin vererek veri minimizasyonu stratejisini uygulamayı amaçlamaktadır (Koops vd. 2013, 681). Bu, ya sorumluluğu yayarak, yani koşul(lar)ın gerçekleşip gerçekleşmediğini doğrulamak ve ilgili verileri serbest bırakmak için üçüncü bir tarafa güvenerek ya da kendi kendini uygulayan bir mimari, yani bazı ön koşullar tarafından tetiklendiğinde ilgili verilere otomatik olarak erişim sağlayacak bir dizi sabit kodlu kural aracılığıyla gerçekleştirilebilir.

Kurumsal gizlilik politikaları, gizlilik kurallarını uygulamak için teknolojinin kendisini kullanır. Özellikle, gerekli veri yönetimi ve erişim kurallarını tanımlamak için bir politika biçimlendirme diline ihtiyaç duyarlar (Koops vd. 2013, 683). Bu şekilde, daha sofistike yasal uyumluluk mekanizmaları makine kodunun içine gömülebilir.

OSINT platformlarının yasal etkileri düşünüldüğünde bir diğer kritik husus, analizin belge özetleme veya varlık çıkarma gibi kısımlarını otomatikleştirmek için tasarlanmış özel ontolojilerin oluşturulması ve sürdürülmesidir. Bu ontolojilerin kurumlar arasında birlikte çalışabilir olması için doğru bir şekilde belirtilmesi ve gelişen düzenleyici çerçevelere ayak uydurmak için sık sık güncellenmesi gerekir. Ontolojiler resmi olarak "(meta)veri şemaları olarak tanımlanır ve her biri açıkça tanımlanmış ve makine tarafından işlenebilir bir semantiğe sahip kontrollü bir kavram sözlüğü sağlar" (Maedche ve Staab 2001). Normları, kuralları ve etik ilkeleri makine tarafından okunabilir düzenlemelere kodlayan ve daha sonra farklı kuruluşlar ve ülkeler arasında uygulanabilen Anlamsal Web Düzenleme Modellerinin (SWRM) tasarlanmasında önemli bir rol oynamaktadırlar (Casanovas 2015). Bununla birlikte, OSINT söz konusu olduğunda ontoloji düzenlemesi yalnızca kısmen ele alınmaktadır. Casanovas ve diğerlerinin (2014) belirttiği gibi, "tarafsız ontolojiler yoktur. Bir amaçları ve belirli bir şekilleri vardır ve düzenli olarak güncellenmeleri gerekir". Bu nedenle, özellikle OSINT kaynaklarının çeşitli doğası ve rakibin bunu potansiyel olarak aldatıcı bir şekilde kullanabileceği göz önüne alındığında, GELSI literatüründe OSINT analizi için ontolojilerin tanımlanması (ve sürdürülmesi) için pratik bir çerçeveye ihtiyaç duyulmaktadır.

Diğer yazarlar, bilginin serbestçe erişilebilir olması (özel olmaması) ama aynı zamanda bazen son derece hassas ve kişisel olması (dolayısıyla özel olması) şeklindeki OSINT "mahremiyet paradoksunu" ele almak için odağı PET'lerden diğer yasal araçlara kaydırmaktadır. Literatürde sunulan varsayımsal bir çözüm Nissenbaum'dan (2004) alınmıştır. Mahremiyeti bağlamsal bir bütünlük olarak ele alır, yani hayatın hiçbir alanının mahremiyet beklentilerinden muaf olmadığı ve her durumun, ihlal edilmesi halinde mahremiyet ihlaline yol açan açık ve hatta örtük normlarla düzenlenen bağlamlara sahip olduğu fikridir. Bu fikir, ev kavramının her kullanıcının kendi "kişisel siber alanına" kimin erişebileceğine karar verebileceği dijital alana genişletilmesiyle birleştiğinde, mahremiyetin kişisel verilerin kötü niyetli kullanımına karşı en azından kısmen korunmasını sağlayacaktır (Ten Hulsen 2020).

Gerçekten de, şu anda, OSINT'in deneyimsiz (veya kötü niyetli) aktivistlere açık olması, özel bilgilerin çevrimiçi olarak paylaşılması veya yasadışı faaliyetlere karışan kişilerin yanlış tanımlanması gibi etik olmayan ve hatta muhtemelen yasadışı davranışlara yol açabilir (Belghith ve ark. 2022). OSINT topluluğunu çevreleyen etik kuralların ihlali kamu güvenliği ve ulusal güvenlik açısından ciddi sonuçlar doğurabileceğinden, bu durum kuruluşlar ve aktivist ağlar için bir endişe kaynağı olmalıdır. Dahası, Shere'nin (2020a) yakın zamanda OSINT analistleriyle yaptığı bir ankette savunduğu gibi, Genel Veri Koruma Yönetmeliği (GDPR) OSINT toplama yeteneklerinde önemli bir değişiklik sağlayamamıştır ve anlamlı bir değişiklik yalnızca sosyal medya şirketleri tarafından gizlilik ayarlarının güncellenmesinden kaynaklanmaktadır. OSINT soruşturmalarında yer alan bireyler ve gruplar için bu ve diğer endişe unsurları Hu (2016) tarafından OSINT uygulamasının beş temel etik kaygısında özetlenmiştir. Bunlar arasında, sonuçta ortaya çıkan analizi saptırabilecekleri için dikkatle incelenmesi gereken kaynakların kökeni ve amacı (ilerleyen bölümlerde bu yanlış bilgilendirme konusuna daha fazla değinilecektir); ilgili kişilere zarar verebilecek sınıflandırılmamış ancak yine de hassas bilgilerin dağıtımı; ve kontrol edilmediği takdirde hatalara yol açabilecek otomatik analize aşırı güvenilmesi yer almaktadır. Ayrıca, farklı veri kaynaklarının entegre edilmesiyle veri öznelerinin tespit edilebildiği mozaik etkisi ve başarılı OSINT soruşturmalarının yarattığı aşırı tanıtım da analist için endişe kaynağıdır.

Bu hususlar aynı zamanda hukuki alana da girmektedir. Aslında, istihbarat olarak OSINT ile cezai bir işlemde kanıt olarak kullanılan OSINT arasında bir fark vardır (Sampson 2016). Belirli bir amaca hizmet ettiğinde hemen hemen her bilgi istihbarat olarak kabul edilebilirken, ikinci durumda, kanıt niteliğindeki materyalin kabul edilebilirlik ve ağırlık sorularına daha fazla cevap vermesi gerekmektedir. Özellikle, kanıtın söz konusu gerçekle ilgili olduğu kanıtlanmalı ve kabul edilmeden önce güvenilirliği ortaya konmalıdır. Avrupa İnsan Hakları Sözleşmesi'ni (AİHS) imzalayan ülkelerin genel durumuna bakıldığında, Sampson (2017) OSINT'in delil olarak kullanılmasında, özellikle AİHS'de yer alan adalet ilkeleri ile ilgili bazı usuli sorunları tespit etmektedir. Genel olarak, ülkeye özgü mevzuat bir yana, ceza yargılamalarında delillerin sanıklara açıklanması beklenmektedir. Dahası, birçok OSINT materyalinin kulaktan dolma niteliği, mahkemede reddedilmelerine yol açabilir. Yazara göre, OSINT verilerinin ceza davalarında delil olarak kabul edilebilirliğini üç ana faktör belirlemektedir. İlk olarak, materyalin kaynağı, veri kaynağının açıkça tanımlanmasını ve toplama prosedürünün yasal olmasını gerektirmektedir. Veriler kolayca tahrif edilebiliyorsa [örneğin Koenig'deki (2019) derin sahtecilik vakasına bakınız], kabul edilebilirliği ve ağırlığı söz konusu olacaktır. Dikkate alınması gereken son husus, kanıtı sağlayan yazarın güvenilirliğidir. Materyal anonim bir kaynaktan geliyorsa veya yazar kanıtları doğrulayamıyorsa, veriler muhtemelen yargılama sırasında reddedilecektir (Sampson 2017).

Mikro düzeydeki çalışmaların çoğu veri özneleri ve haklarının uygun şekilde nasıl korunacağı ile ilgiliyken, analiz yapan OSINT uygulayıcılarının karşılaşabileceği potansiyel zararları ele alan bir başka önemli araştırma alanı daha bulunmaktadır. Ana risklerden biri dolaylı travma, yani şiddeti tasvir eden materyallerle uğraşmanın neden olduğu psikolojik travma olarak bilinmektedir. Sesin kaldırılması ve video çözünürlüğünün azaltılması gibi dolaylı travmanın etkisini azaltmaya yönelik güvenlik prosedürleri ve önerileri OSINT topluluğunda uzun süredir mevcut olsa da (Parry 2017), potansiyel olarak hassas dijital içeriği tanımlamak ve etiketlemek için otomatik çerçeveler de önerilmiştir (Breton vd. 2021).

6. Makro düzeyde OSINT'in GELSI'si

Makro analiz düzeyinde, odak noktası bireylerden, yazılım çözümlerinden ve kuruluşlardan OSINT'in sosyal ve politik etkileri hakkında daha geniş tartışmalara kaymaktadır. Burada, OSINT'i daha soyut bir anlamda ele alan, istihbarat çalışmaları alanıyla sınırlı olmayan, ancak daha geniş sosyal bilim literatürünü kapsayan makaleler buluyoruz. Bu literatür kısmen açık kaynaklı bilgisayar korsanlığı topluluklarının deneyimlerinin bir yansıması olarak ortaya çıkmıştır. "Şeffaflık, doğruluk ve güven" (Steele 2012) gibi ortak bir değer etrafında doğan ve beslenen bu topluluklar internetin ilk yıllarında gelişti. İşletim sistemlerinden web sunucularına kadar birçok açık kaynaklı projenin geliştirilmesinden sorumluydular. Güvenilir kullanıcı sistemi sayesinde, geniş bir programcı topluluğu iyi tanımlanmış bir proje üzerinde çalışırken neredeyse gerçek zamanlı olarak kodu güncelleyebilmiş ve bilgi paylaşabilmiş, böylece İnternet'in "birbirine bağlı fikirlerin yeni bir ekolojisi" olduğu fikri pekişmiştir (Glassman 2013, 682).

Yazılım analoğu olarak Açık Kaynak İstihbaratı, bilgiye erişimi demokratikleştirmenin ve yurttaş aktivizmini teşvik etmenin, herhangi bir aracıyı ortadan kaldırmanın ve gerçeğin işbirliğine dayalı bir şekilde aranmasına izin vermenin bir yolu olarak sunulmuştur. OSINT uygulayıcıları arasında "şeffaflık ve hesap verebilirliğe öncelik veren, hile kullanımını hoş görmeyen ve soruşturmaları pasif keşifle sınırlayan" (Belghith vd. 2022, 2) ortak bir ahlaki kod sayesinde, tekno-özgürlükçü uçtaki bazıları OSINT'in gizli hükümet faaliyetleri üzerindeki gözetimi artırabileceğini ve dolayısıyla güvenlik kurumlarının istilacı erişimini azaltabileceğini ve nihayetinde "Her Şey Açık Kaynak" toplumuna yol açacağını savunmaktadır (Steele 2012).

İlginç bir şekilde, bu fikir insan bilişinin doğası ve evrimi hakkında uzun süredir devam eden bir tartışmayla bağlantılıdır. Glassman ve Kang (2012) OSINT'i Horn ve Cattell (1967) tarafından tanımlanan iki zeka kategorisi arasında bir köprü olarak yorumlamaktadır: akışkan zeka ve kristalize zeka. İlki, çocuklukta görüldüğü gibi soyutlama ve örüntü tespitine dayalı problem çözmeye yönelik daha sezgisel bir yaklaşımı temsil ederken, ikincisi zekayı halihazırda deneyim yoluyla öğrenilmiş yöntem ve araçları uygulayarak problem çözme yeteneği olarak tanımlar ve bu nedenle insan gelişiminin sonraki aşamalarında daha belirgindir. Dolayısıyla, kristalize zeka tipik olarak bilinen sorunlara uygulanmakta ve iyi bilinen ve kültürel olarak paylaşılan sorun çözme stratejilerini kullanırken, akışkan zeka soyut düşünme ve zihinsel esneklik gerektiren yeni sorunlarla karşılaşıldığında güvenilmektedir. Yazarlara göre OSINT, akışkan zekadan gelen içgörüleri ve yaratıcılığı daha kodlanmış ve topluluk temelli bir kültürel zeka alanına taşıyabilir. Bu süreç, web'e ücretsiz erişim ve açık kaynaklı bilginin yatay doğası sayesinde mümkün olmakta ve (sanal) topluluk genelinde kitle kaynaklı araştırma çalışmalarına yönelik yeni yaklaşımlara olanak tanımaktadır. Yazarların da belirttiği gibi:

OSINT, odaklanmış problem çözme ile birlikte yeni ve farklı bağlantılara ve olasılıklara açık olan kontrollü bir keşiftir. OSINT, sosyal ve kültürel sınırları aşabilen hedefe yönelik faaliyeti teşvik eder (Glassman ve Kang 2012, 677, vurgu metinde)
Kültürel sınırları aşma becerisi, vatandaş/analist için mevcut olan filtrelenmemiş bilginin sürekli akışı ile sağlanır ve Robert David Steele'in sözleriyle Akıllı Ulus yaratmada ileriye doğru bir adım teşkil eder:

Her vatandaşı yasal, etik, açık kaynaklı istihbaratın toplayıcısı, üreticisi ve tüketicisi olması ve aynı zamanda bir bütün olarak birbirine bağlı, bir bütün olarak düşünen, bir bütün olarak hareket eden insanlığın otantik istihbarat topluluğunun canlı bir üyesi olması için eğitir ve sağlar (Steele 2012).
Akıllı uluslar topluluğu daha sonra küresel bir noosfere, "çok uluslu bilgi paylaşımı ve anlam yaratmaya" dayalı dünya çapında bir topluluğa doğru inşa edilecektir (Steele 2012). Böylesi radikal bir toplumsal dönüşüm, anlamlı toplumsal değişimin devlet ve devlet dışı aktörler arasında dinamik bir diyalog yoluyla sağlandığı akıllı yönetişim literatüründe önemli paralellikler bulmaktadır (Willke 2007). Bu senaryoda, OSINT, oyun alanını düzleştirmede ve bu diyaloğa elverişli bir şeffaflık derecesi sağlamada kritik bir araç olarak görülmektedir.

Yukarıdaki makaleler OSINT'in doğasının onu demokratik gözetim için nasıl önemli bir araç haline getirdiğini vurgularken, bu doğa aynı zamanda yetkililer onu sosyal kontrolü artırmak için kullandığında vatandaşların haklarına yönelik bir tehdit olarak da görülebilir (Wells 2016). Artan devlet gözetimi ve profilleme ile ilgili endişeler, devlet yetkilileri ve özel şirketler tarafından yapılan analiz ve OSINT temelli karar alma süreçlerindeki opaklıkla birlikte literatürde uzun süredir dile getirilmektedir (Eijkman ve Weggemans 2012). Gerçekten de, devlet gözetim uygulamaları ve fişleme korkusu hakkında artan kamu farkındalığının, kullanıcıları çevrimiçi paylaşılan kişisel bilgileri saklamayı ve hatta tahrif etmeyi düşünmeye sevk edebileceği de gösterilmiştir (Bayerl ve Akhgar 2015). Benzer şekilde, OSINT araçları ve yetenekleri konusundaki farkındalık, BT profesyonellerinde daha sağlam güvenlik davranışlarıyla ilişkilendirilmiştir (Daniels 2016). Sonuç olarak, kullanıcıları çevrimiçi faaliyetlerinin sonuçları hakkında eğitmeye yönelik çabalar ortaya çıkmıştır ve bu eğilimi güçlendirmesi muhtemeldir (Parry 2017; Young ve ark. 2018).

Bu durum, ulusal ve uluslararası ilişkilerde dezenformasyon stratejilerinin yaygınlaşmasıyla birleştiğinde, OSINT sularının bulanıklaşmasına katkıda bulunmakta ve soruşturmalar sırasında toplanan OSINT verilerinin güvenilirliği üzerinde bariz etkileri olmaktadır (Miller 2018; Olaru ve Ştefan 2018). OSINT söz konusu olduğunda da "açık" eşittir "doğru" değildir ve tahrif edilmiş bilgileri tespit etmek ve filtrelemek için ortak bir standardın yokluğunda, her analist şimdiye kadar toplanan istihbaratı doğrulamak için kendi sektörel deneyimlerine güvenmiştir. McKeown ve diğerlerinin (2014) belirttiği gibi, bu durum analistler arasında raporlama doğruluğunda önemli farklılıklara yol açabilir, çünkü bazıları bir kaynağı güvenilir bulurken diğerleri bulmayabilir. Bu durum, OSINT kaynaklarının güvenilir olmayan bilgilerle giderek daha fazla kirletildiği bir güvensizlik kısır döngüsüne yol açabilir ve bu durum, derhal tespit edilmediği takdirde, karar alma sürecini etkileyebilir.

7. Gelecekteki araştırma yönleri: YZ ve OSINT'in GELSI'si

Şekil 6'nın alt kısmında, mikro ve makro seviyelerde OSINT ve YZ arasındaki etkileşim üzerine gelecekteki araştırmalar için birkaç öneri listelenmiştir. Bunlar, YZ algoritmaları günlük OSINT uygulamalarıyla yakından iç içe geçtikçe, gelecekteki OSINT literatüründe meydana gelme olasılığını en yüksek bulduğumuz gelişmelerdir.

Mikro düzeyde, OSINT-GELSI bursu şimdiye kadar OSINT boru hattının bilgi alma ve yönetim yönleriyle ilgilenmiştir. Bununla birlikte, mevcut mevzuat, makine tarafından toplanan OSINT'in analiz ve kullanım aşamalarına çok az önem vermektedir. Broeders ve diğerlerinin (2017) ve YZ denetim literatüründeki diğerlerinin çalışmalarına dayanarak, veri analizi aşamasında algoritmik performansı etkileyebilecek hususları (örn. değişken seçimi, model ağırlıkları, optimizasyon algoritmaları vb.) düzenlemek için teorik bir çerçeve geliştirmeye yönelik daha fazla çaba sarf edilmelidir.

Dahası, algoritmik şeffaflık üzerine daha kapsamlı çalışmalar, OSINT ve YZ üzerine gelecekteki literatürü bilgilendirebilir. Burrell (2016), YZ algoritmalarının nasıl kullanıldığına dair genel şeffaflık eksikliğine katkıda bulunan üç ana kaynak tanımlamaktadır. Bunlardan ilki olan kurumsal gizlilik, şirketlerin ürünlerini korumak için algoritmaların iç işleyişini kasıtlı olarak gizlemesiyle ilgilidir. Önerilen çözümler çoğunlukla yasama tarafındadır ve güvenilir üçüncü tarafların kodu gözden geçirmek ve uygun etik standartların karşılanmasını sağlamakla görevlendirileceği ifşa ve denetim çerçevelerinin geliştirilmesini içerir (Pasquale 2015; Lu 2020). İkinci opaklık kaynağı olan teknik okuryazarlık, bilgisayar kodu yazmanın ve okumanın uzmanlaşmış doğasına atıfta bulunur ve bu da son kullanıcıların ve düzenleyicilerin YZ algoritmalarının mekaniğini ve sonuçlarını tam olarak anlamasını zorlaştırır. Sivil toplumun kritik kesimleri arasında bilgisayar okuryazarlığının ve "hesaplamalı düşünmenin" (Lee ve ark. 2011) artırılması, bu opaklık kaynağına karşı koymada önemli bir adım olarak görülmektedir. Son olarak, birçok makine öğrenimi modelinin kara kutu yapısı, uygulayıcılar için bile sonuçların doğru yorumlanmasını zorlaştırmaktadır. Çok bileşenli sistemlere olan bağımlılık, genel altyapının karmaşıklığını artırarak denetim için gereken zaman ve çabayı daha da artırmaktadır. Bu karmaşıklıkla başa çıkmak için farklı çözümler önerilmiştir. Bunlar temel olarak verilerin boyutsallığını azaltabilecek, algoritmaların adilliğini değerlendirebilecek metrikler oluşturabilecek ve analize yardımcı olmak için temel değişkenler arasındaki ilişkilerin grafiksel görselleştirmelerini sağlayabilecek teknik araçlara odaklanmaktadır (Dwork vd. 2012; Paudyal ve William Wong 2018).

OSINT verileri söz konusu olduğunda şeffaflık daha da önemlidir. Aslında, birçok denetim stratejisi tüm veri türleri için geçerli olsa da, açık kaynak verileri daha katı geçerlilik gereksinimlerini karşılamalı ve düzenleyici stratejiler geliştirilirken özellikle öncelikli olarak hedeflenmelidir. Dahası, makine öğrenimi algoritmaları aracılığıyla doğruluk değerlendirmesi son yıllarda artmakta olduğundan (Manzoor ve Singla 2019), yanlış bilgi tespitine ilişkin uygulamalı literatürün, ilgisiz verileri filtrelemek için stratejiler tasarlamada önemli bir rol oynaması ve böylece analiz sırasında önyargılı sonuçları önlemesi veya en azından azaltması da muhtemeldir. Açık kaynak bilgilerinin otomatik doğruluk değerlendirmeleri için çerçeveler tasarlamaya yönelik bazı girişimler zaten olmuştur (örneğin bkz. Lozano ve ark. 2015). Bununla birlikte, verileri doğrulamak için YZ kullanmak, Lozano ve diğerlerinin (2020) işaret ettiği gibi, büyük ölçüde cevapsız bırakılan önemli etik soruları da gündeme getirmektedir. Bu sorulardan bazıları, verilerin yanlış etiketlenmesi durumunda sorumlulukların dağıtılması ve ilk etapta doğruluğu belirlemek için en uygun prosedürlerle ilgilidir.

Orijinal Açık Kaynak hareketi ethosu göz önünde bulundurulduğunda, kendileri de açık kaynak olan gözetim mekanizmaları öngörülebilir. Örneğin, çevrimiçi soruşturmalar sırasında kullanılan algoritmaların kaynak kodunun, güncellenmiş veri setleri ve ilgili doğruluk değerlendirmeleri ile birlikte yayınlanması. Ancak, çoğu OSINT soruşturmasının gizli doğası göz önüne alındığında, bu sadece son derece olası değildir. Devlet yetkilileri tarafından yayınlanan veriler, düşmanın altyapısına saldırmakla ilgilenen aktörler tarafından istihbarat olarak kullanılabileceğinden, ters etki de yaratabilir.

Daha geniş gizlilik endişelerine gelince, YZ algoritmaları Bölüm 5'te özetlenen PbD taktiklerini ve bağlamsal bütünlük yaklaşımları gibi diğer çözümleri, özellikle de veri saklama ve minimize etme ilkelerini tehdit edebilir. Görünüşe göre, analistler, özellikle bugün işe yaramaz görünen veriler gelecekte alakalı olabileceğinden, kullanıcıların bilgilerini veritabanlarında saklamak için cazip olabilirler. Literatürde işlev kayması olarak bilinen bu olgu (Koops 2021) OSINT soruşturmalarında halihazırda gözlemlenmiştir (Trottier 2015) ve artan bilgi işlem gücü YZ algoritmalarının muazzam sayıda özelliği işlemesine olanak tanıdıkça daha belirgin hale gelmesi muhtemeldir.

YZ araçlarının veri toplama ve analiz rutinlerine entegre edilmesi, istihbarat toplamadan kanıt sunumuna geçerken yasal zorluklar da ortaya çıkarmaktadır. Bilişsel ve teknik önyargıların, analistin sorgusuna veya arama motorunun sonuç sıralamasına göre arama alanını daraltarak dijital OSINT toplamayı nasıl etkilediği zaten gözlemlenmiştir (McDermott vd. 2021, 92-93). Dolayısıyla, otomatik toplama ve analize güvenmek bu önyargıları güçlendirebilir ve istihbaratın ceza davalarında kanıt olarak kullanılması durumunda kabul edilebilirlikle ilgili soruları gündeme getirebilir.

Makro düzeyde, OSINT'in GELSI'sine ilişkin araştırmalar, YZ destekli OSINT'in kamuya açık bilgilerin gözetim potansiyelini (Açık Kaynak hareketinin iddia ettiği gibi) nasıl geçersiz kılabileceğini ele almalıdır. Gerçekten de, YZ algoritmalarının kullanılabilirliği veri işleme yeteneklerini (ve daha az ölçüde dezenformasyon tespitini) artırmakta ve bunu asimetrik olarak yapmaktadır. Standart OSINT toplama ve analiz yöntemleri uygun veri kaynaklarının seçilmesine odaklanmakta ve teknolojik çözümlerin sadece sınırlı bir şekilde kavranmasını gerektirmektedir. Ancak, toplama ve analizin otomatikleştirilmesi yapay zeka algoritmalarının çok daha derinlemesine anlaşılmasını gerektirmektedir. Bu bilgi, potansiyel OSINT kullanıcıları arasında eşit olmayan bir şekilde dağılmıştır ve daha büyük bilgi işlem gücüne ve daha iyi uzmanlığa erişimi olanların lehinedir. Halka açık ticari çözümlerin çoğu (ister ücretsiz ister abonelik tabanlı olsun), istihbarat toplamayı otomatikleştiren web tarayıcılarını yoğun bir şekilde kullanmaktadır (Pastor-Galindo vd. 2020). Bununla birlikte, şu anda mevcut olan yazılım, ayrı olarak kodlanması gereken analiz aşamasında yapay zeka algoritmaları sağlamamaktadır. Bu nedenle, gelecekte, açık kaynak verilerini analiz etmek için yapay zeka çözümlerine erişimi olan aktörler, çok daha fazla miktarda veriyi çok daha kısa sürede işleyebilecek ve sınıflandırabilecek şekilde diğerlerine göre karşılaştırmalı bir teknolojik avantaja sahip olacaktır. Bu çatışma, farklı devlet ve devlet dışı aktörler arasında eş zamanlı olarak ortaya çıkabilir ve OSINT verilerinin gözetim rolünü tehdit ederek gözetim ve sosyal kontrol yönlerini daha da kötüleştirebilir. Dahası, istihbaratın özel şirketlere yaptırılması yönündeki hakim eğilim, Bean'de (2011) daha önce belirtildiği gibi, daha iyi algoritmalar daha iyi (istihbarat) ürünler ortaya çıkardığında, kamu ve özel sektör arasında daha da fazla sürtüşme yaratabilir.

OSINT-GELSI literatüründe ele alınması gereken bir diğer önemli konu da yapay zekanın OSINT'in akışkan ve kristalize istihbarat arasındaki dengeyi korumasını engelleyip engellemeyeceğidir. OSINT'in akışkan zeka özellikleri sayesinde analistleri kristalize bilgi tarafından belirlenen geleneksel soruşturma rotalarının ötesine itebileceği doğru olsa da, mevcut YZ sistemlerinin kristalize zeka ile yakından ilişkili problem çözme stratejileri izlediği de doğrudur. Denetimli makine öğrenimi, bilgisayar algoritmasının görünmeyen verilerdeki benzer örüntüleri tanımlamak için onaylanmış bir bilgi bütününden (etiketli veriler) değişken bağımlılıkları öğrenmesine izin verecek şekilde oluşturulmuştur. Gerçekten de, soyut akıl yürütme için yeni öğrenme modelleri geliştirmeye yönelik birçok girişime rağmen, YZ algoritmalarının yalnızca belirli bir görevin (veya sınırlı bir görev kümesinin) üstesinden gelmek üzere tasarlandıkları ve bilgilerini daha önce görülmemiş sorunlara genelleyemedikleri için kristalize zekaya ulaşabildikleri iddia edilmiştir (Davidson ve Walker 2019; van der Maas vd. 2021, 5). Örneğin dijital medya örneğini ele alalım. Dijital bir açık kaynaktan düşman savaşçıları tespit etmek için bir algoritmayı eğitmek mümkün olsa da, aynı algoritmanın, bu verileri tanımak için eğitilmemişse, coğrafi konum verileri gibi diğer önemli istihbaratı çıkarması pek olası değildir. Aynı zamanda, özel bir eğitim olmadan, medya verilerinin bağlamını değerlendirmek ve örneğin bunun bir filmden alıntı mı yoksa dezenformasyon amacıyla yayılan ilgisiz bir askeri tatbikattan görüntüler mi olduğunu belirlemek neredeyse imkansız olacaktır. Bu nedenle, YZ algoritmaları tarafından desteklenen herhangi bir OSINT analizi, büyük ölçüde kristalize bir istihbarat yaklaşımına dayanır ve bir görev "daha yüksek düzeyde davranışsal esneklik ve uyarlanabilirlik" gerektirdiğinde, akışkan bileşeninin soyut sezgisinin bir kısmını kaybetme riski taşır (Schilling vd. 2019). Dahası, Bölüm 5'te bahsedildiği gibi OSINT yazılımlarına aşırı güvenmek muhtemelen bu durumu daha da kötüleştirecektir. Gerçekten de, OSINT verileri otomatik olarak tarandığında ve analiz edildiğinde, analist sorguları aracılığıyla yalnızca önemli eşleşmeler döndürülür ve bazı önemli ayrıntılar tamamen gözden kaçabilir. Bu sorun literatürde zaten ortaya çıkmıştır ve baskın olmaya devam edecektir (Odom 2008, 325). Eldridge ve diğerleri (2018), OSINT analizinin insan bileşeninden asla kurtulmaması gerektiğini ve "ortak bilişsel sistemlerin" (Eldridge vd. 2018, 22) analistler ve algoritmalar arasında en uygun dengeyi sağlayacak şekilde tasarlanması gerektiğini savunmaktadır.

8. Sonuçlar

Bu makale, OSINT üzerine GELSI literatürünün sistematik bir incelemesini sunmaktadır. OSINT-GELSI çalışmaları genel olarak mikro ve makro analiz seviyeleri olmak üzere iki ana kategoriye ayrılabilir. Mikro düzeyde, yazarlar OSINT'in bireyler ve kuruluşlar üzerindeki etkisine bakmakta, OSINT kaynaklarının kullanımı için yazılım geliştirilmesinde gizlilik konularını ve gözetim mekanizmalarını ele almaktadır. Makro düzeyde, ana odak noktası OSINT verilerinin üretimi ve kullanılabilirliğinin sosyal ve politik sonuçları üzerinedir. Bazı makaleler, OSINT araçları ve yetenekleri hakkında artan farkındalığın çevrimiçi alışkanlıkları nasıl değiştirdiğini, birçok kullanıcının daha az kişisel bilgi paylaşmaya karar verdiğini veya çevrimiçi maruziyetlerini sınırlamak için anonimliğe yöneldiğini analiz etmektedir. Bu arada, diğer makaleler daha geniş açık kaynak hareketi literatürüne bağlanarak, OSINT'in akışkan ve kristalize istihbarat arasındaki ilişkideki rolünü yansıtmakta, istihbaratın artan demokratikleşmesine ve daha şeffaf toplumların yaratılmasına yol açmaktadır.

YZ algoritmaları ile güçlendirilmiş OSINT ile ilgili araştırmalar ortaya çıkmaktadır ve muhtemelen gelecekteki OSINT-GELSI çalışmalarında baskın hale gelecektir. Mikro düzeyde, YZ-denetim literatürüne daha fazla vurgu yapılmalıdır. Özellikle, veri madenciliği ve makine öğrenimi teknikleri aracılığıyla gerçekleştirilen bilgi toplama ve analiz süreçlerini denetlemek ve yönlendirmek için düzenleyici stratejilerle ilgilenmek için daha fazla araştırmaya ihtiyaç vardır. Daha fazla veri toplandıkça, işlendikçe ve daha sonra kullanılmak üzere otomatik olarak etiketlendikçe bu konu giderek daha fazla önem kazanmaktadır. Birçok güvenilirlik sorunu nedeniyle, OSINT verilerine özel dikkat gösterilmelidir. Hedeflenmesi gereken kilit özelliklerden biri, OSINT'in kasıtlı dezenformasyon için kullanılmasıdır; bu durum daha sofistike algoritmaları bile kolayca etkileyebilir ve onları eğitmek için kullanılan veri kümelerini kirletebilir. Bu sorunun üstesinden gelmek ve hataları en aza indirmek için etkili teşhis teknikleri tasarlanmalı, böylece OSINT soruşturma sonuçlarına önyargı ekleme riski azaltılmalıdır (Lozano vd. 2020).

Makro düzeyde, OSINT-GELSI literatürü OSINT ve toplum arasındaki ilişkiyi şekillendirmede YZ'nin rolüne bakmalıdır. Örneğin, OSINT'in kristalize ve akışkan zeka arasında bir köprü oluşturduğuna inanılırken, makine öğrenimi algoritmalarının doğası YZ'yi ilk gruba yerleştirmektedir. Bu, insan merkezli analizden ziyade otomatikleştirilmiş analize dayanan OSINT araçlarına YZ'nin artan entegrasyonunun, dengeyi OSINT sorunlarına kristalize bir yaklaşıma doğru kaydırabileceği anlamına gelmektedir. Makro düzeyde dikkate alınması gereken bir diğer kritik sonuç ise, kamu ve özel kullanım için özel istihbarat sağlayıcıları haline gelen OSINT araçlarının sahiplerinin değişen doğasıdır.

Genel bir öneri olarak, OSINT-GELSI bursu, ortaya çıkan eğilimleri kavramak ve bunların ortaya çıkardığı potansiyel etik zorluklara anında tepki verebilmek için OSINT uygulayıcı literatürünün sonuçlarından daha fazla haberdar olmalıdır. Önceki bölümlerde tartıştığımız gibi, OSINT sadece teknoloji ile gelişmemektedir. Yeni bilgi kaynakları kamuya açık hale geldikçe kapsamı da genişlemektedir. Bununla birlikte, veriler ne kadar karmaşık olursa (ve veri havuzu ne kadar büyük olursa), toplama ve analiz de o kadar karmaşık hale gelecektir. Sonuç olarak, yeterli bilgisayar gücüne ve doğru uzmanlığa erişimi olan devlet ve devlet dışı aktörler diğerlerine göre karşılaştırmalı bir teknolojik avantaja sahip olacaktır. Bu nedenle, OSINT araç ve tekniklerine ilişkin kapsamlı bir GELSI analizi, uygulamalı literatürdeki en son eğilimleri göz ardı edemez ve aynı sorunların halihazırda ortaya çıktığı diğer alanlara bakarak bunları öngörmeye çalışmalıdır. GELSI ve uygulamalı alanlar arasında artan entegrasyon sadece arzu edilen bir durum değil, aynı zamanda mevcut ve gelecekteki etik sorunların ele alınması için de gereklidir.

Dipnotlar:

1- Intelligence cycles are modeled in different ways by different intelligence organization, in this article we follow the model proposed in the US Joint Intelligence report (Defense Technical Information Center (DTIC)—Department of Defense 2013).

2- The acronym GELSI expands another acronym, ELSI (Ethical, Legal and Social Implications), which originated in the fields of biotechnology and genetics. This research field “addresses the relationship between the new and emerging techno-sciences and society” (Zwart and Nelis 2009) and involves predicting and possibly proposing solutions to new challenges posed by their interaction.

3- Projects like the Versatile InfoRmation Toolkit for end-Users oriented Open Sources explOitation (VIRTUOSO, 2010–2013), the Collaborative information, Acquisition, Processing, Exploitation and Reporting for the prevention of organized crime (CAPER, 2011–2014) and the Maritime Integrated Surveillance Awareness (MARISA, 2017–2020) are some of the most prominent examples.


Hiç yorum yok:

Yorum Gönder