Türkiye’de uzun zamandır erişime kapalı olan Discord platformunda dikkat çekici bir araştırma ve veri paylaşımı gerçekleştirildi
404 Media’nın raporuna göre, dünyanın en popüler iletişim platformlarından biri olan Discord’da, Minas Gerais Federal Üniversitesi’nden bir ekip, toplamda yaklaşık 2 milyar mesajı toplayıp online olarak kamuoyuyla paylaştı. Bu gelişme, platformda aktif olan ve erişime açık olan tüm kullanıcılar için oldukça çarpıcı bir durum olarak kayıtlara geçti. Eğer son on yılda herhangi bir Discord sunucusunun üyesiyseniz, sizin de bu büyük veri kümesinin parçası olmanız ihtimal dahilinde.
Teklif Formu
Bu çalışma, arxiv.org üzerinde “Discord’un Açığa Çıkması: Kamuya Açık İletişim Verilerinin Kapsamlı Analizi (2015-2024)” başlığıyla yayımlandı ve araştırmacılar, 2015 yılından 2024’e kadar olan dönemde 3.167’den fazla açık sunucudan toplamda 2.052.206.308 mesaj ve 4.735.057 kullanıcıdan alınan veriyi derleyip analiz etti.
Veri Setinin Kapsamı ve Katılımcı Profili
Bu büyük veri seti, toplam aktif kullanıcıların yaklaşık %10’unu temsil ediyor. Araştırmacılar, toplamda 4 milyon 735 bin 57 kullanıcıdan gelen mesajları topladıklarını ve bu sayıların, platformdaki toplam kamuya açık sunucu sayısına göre oldukça geniş bir örneklem oluşturduğunu belirtiyorlar.
Çalışmanın Amacı ve Potansiyel Uygulamalar
Bu devasa veri setinin paylaşılma amacı, bilim insanlarına ve araştırmacılara, insanların dijital platformlarda sergilediği çeşitli davranışları inceleme imkânı sağlamak. Özellikle, sosyal medya ve dijital iletişim ortamlarının mental sağlık üzerindeki etkisi, yapay zekâ algoritmalarının eğitimi ve geliştirilmesi gibi alanlarda kullanılacak büyük veri kaynakları oluşturmak hedefleniyor.
Yapılan açıklamalarda, “Veri setimiz, araştırmacıların dijital platformlarda siyasi söylem, yanlış bilgi yayılımı ve bu ortamlarda etkili moderasyon stratejilerinin geliştirilmesi gibi konuları derinlemesine incelemesine olanak tanıyor” ifadeleri yer alıyor.
Teklif Formu
Discord’un Yaklaşımı ve Gizlilik Endişeleri
Elbette, bu kadar büyük veri setinin paylaşılması ve kullanılması, gizlilik ve etik kaygıları da beraberinde getiriyor. Araştırmacılar, toplanan mesajların anonimleştirildiğini ve kullanıcıların kimlik bilgilerinin gizlendiğini söylüyor. Ancak, içerik bazlı tespitlerin ve analizlerin yapılabilmesi nedeniyle, veri setinin gizlilik açısından ne kadar güvenli olduğu konusunda endişeler de söz konusu.
Ayrıca, mesajların içeriklerine göre kullanıcıların tanımlanma ihtimali ve bu verilerin kullanıcıların onayı olmadan toplanması, etik açıdan tartışmalara yol açıyor. 404 Media’nın raporuna göre, Discord’un resmi kurallarına göre, açık sunuculardan veri toplama işleminin şirket politikasıyla uyumlu olup olmadığı belirsizliğini koruyor. 2020 yılında güncellenen politikalar, verilerin kopyalanmasını ve kullanımı yasaklıyor.
Bir Discord sözcüsü, konuya ilişkin yaptığı açıklamada, “İzin alınmadan veri toplama işlemi gerçekleşmiş olup, durum titizlikle araştırılmaktadır” diyerek, kural ihlali ve yasa dışı veri kullanımı iddialarını doğruladı. Ayrıca, şirketin, bu duruma karşı gerekli yasal ve idari adımları atmakta kararlı olduğu da belirtildi. Dolayısıyla, bu gelişmeler ışığında, verilerin yasal çerçevede kullanımı ve gizliliğin korunması konusu önümüzdeki dönemde daha da önemli hale gelecek.
Sonuç ve Gelecek Beklentileri
Bu olay, hem dijital iletişim platformlarının gizlilik ve güvenlik politikalarını yeniden gözden geçirmeye hem de yapay zekâ ve veri bilimi alanında yeni araştırma alanlarının oluşmasına zemin hazırlıyor. Zamanla, hem şirketlerin hem de araştırmacıların bu konuda nasıl adımlar atacağı ve hukuki düzenlemelerin nasıl şekilleneceği, merak konusu olmaya devam edecek.