Yapay zeka sohbet robotları haberleri nasıl çarpıtıyor?
Aralarında Deutsche Welle’nin (DW) de bulunduğu 22 kamu yayın kuruluşunun ortak yürüttüğü kapsamlı bir araştırma, en yaygın dört yapay zeka asistanının haber içeriklerini çoğu zaman yanlış aktardığını ortaya koydu.
Bulgulara göre bu hatalar, dil veya bölgeden bağımsız olarak yanıtların yaklaşık yüzde 45’inde görülüyor. BBC (İngiltere), NPR (ABD) gibi kamu yayın kuruluşunda görevli gazeteciler ChatGPT, Microsoft Copilot, Google Gemini ve Perplexity AI adlı dört asistanın yanıtlarını değerlendirdi.
Araştırma kapsamında doğruluk, kaynak kullanımı, bağlamı koruma, editoryal ifade yeteneği ve olgularla görüşleri ayırt etme becerisi gibi ölçütler incelendi.
Ciddi hatalar tespit edildi
Sonuçlar çarpıcı: Yanıtların neredeyse yarısında en az bir ciddi sorun ya da hata bulundu.
Katılımcılar, yanıtların yüzde 31’inde belirgin kaynak hataları, yüzde 20’sinde ise olgusal yanlışlar tespit etti.
Yapay zeka asistanlarının DW editörlerinin sorulara verdiği yanıtların yüzde 53’ü ciddi sorunlar içeriyordu. Bu yanıtların yüzde 29’unda doğrudan doğruluk hatalarına rastlandı.

Alman dış yayın kuruluşu Deutsche Welle (DW) de yapay zeka üzerine yapılan medya araştırmasının katılımcıları arasında yer aldıFotoğraf: Monika Skolimowska/dpa/picture alliance
DW’nin sorularına verilen hatalı yanıtlardan biri, Almanya Başbakanı olarak hâlâ Olaf Scholz’un anılmasıydı. Oysa bu görevi Scholz’den 6 Mayıs 2025 tarihinde Friedrich Merz devraldı. Bir başka örnekte ise NATO Genel Sekreteri olarak Jens Stoltenberg anıldı. Bu makamda ise geçen Haziran ayınan bu yana Mark Rutte bulunuyor.
Yaygın ve giderek büyüyen bir sorun
Dünya genelinde insanlar bilgiye ulaşmak için giderek daha fazla yapay zeka asistanlarına başvuruyor.
Reuters Enstitüsü Dijital Haber Raporu 2025’e göre, çevrim içi haber tüketicilerinin yüzde 7’si haberleri bu tür sohbet robotlarından alıyor. Bu oran, 25 yaş altı kullanıcılar arasında yüzde 15’e kadar çıkıyor.
Araştırmayı yürüten kuruluşlar için tablo endişe verici. Çalışmanın “istisnaî tekil hataları değil, sistematik bir sorunun varlığını” ortaya koyduğunu vurgulayan Avrupa Yayın Birliği (EBU) Genel Müdür Yardımcısı Jean Philip De Tender, DW’ye yaptığı açıklamada şunları söylüyor:
“Bu hatalar sistematik, ulusötesi ve çok dilli. Bu durum kamu güvenini zedeliyor. İnsanlar kime güveneceklerini bilmediklerinde sonunda hiç kimseye güvenmemeye başlıyorlar. Bu da demokratik katılımı tehlikeye atıyor.”
Emsalsiz kapsamda bir çalışma
“Dijital Haber Raporu 2025” adı verilen çalışma, türünün en kapsamlı araştırmalarından biri ve Şubat 2025’te İngiliz yayın kurumu BBC tarafından yürütülen benzer bir çalışmanın devamı niteliğinde. BBC’nin o dönemki bulguları da incelenen yapay zeka yanıtlarının yarısından fazlasında ciddi hatalar bulunduğunu göstermişti. Yeni çalışmada 18 ülkeden medya kuruluşları, BBC’nin metodolojisini izleyerek dört yapay zeka asistanına toplam 3 bin haber sorusu yöneltti.

İngiliz Yayın Kurumu BBC, sekiz ay önce benzer bir araştırma yayınlamıştıFotoğraf: Vuk Valcic/SOPA Images/Sipa USA/picture alliance
Sorular arasında “Ukrayna maden anlaşması nedir?” veya “Trump üçüncü dönem için aday olabilir mi?” gibi örnekler yer aldı. Gazeteciler, hangi asistanın yanıt verdiğini bilmeden cevapları profesyonel kaynaklarla karşılaştırdı. Sekiz ay önceki BBC araştırmasına kıyasla bazı iyileşmeler gözlense de hata oranı hâlâ yüksek.
BBC’nin “Üretken Yapay Zeka” Program Direktörü Peter Archer, DW’ye şu değerlendirmeyi yaptı:
“Yapay zekadan heyecan duyuyoruz ve bunun izleyicilere daha fazla değer sunmamıza nasıl yardımcı olabileceğini görüyoruz. Ancak insanlar okudukları ve izlediklerine güvenebilmelidir. Bazı ilerlemelere rağmen bu asistanlarda hala ciddi sorunlar olduğu açık.”
En zayıf halka Gemini
Dört sohbet robotu arasında en zayıf performansı Google Gemini gösterdi. Yanıtların yüzde 72’sinde kaynak gösterimiyle ilgili ciddi eksikler bulundu. BBC’nin Şubat ayındaki çalışmasında da Microsoft Copilot ve Gemini en zayıf iki sistem olarak öne çıkmıştı.

Yapay zeka sohbet robotları arasında haber konusunda en büyük hata oranı Gemini’de görüldüFotoğraf: Jaque Silva/NurPhoto/picture alliance
Ancak her iki araştırma da tüm asistanlarda benzer sorunların bulunduğunu ortaya koyuyor.
OpenAI sözcüsü de Şubat ayında BBC’ye şu değerlendirmeyi yaptı:
“Haftalık 300 milyon ChatGPT kullanıcısına özetler, alıntılar, doğrudan bağlantılar ve kaynak gösterimleri aracılığıyla kaliteli içerikleri keşfetmelerine yardımcı oluyoruz.”
Araştırmacılardan çağrı: Düzenleme şart
Araştırmayı yürüten yayın kuruluşları ve medya örgütleri, ulusal hükümetleri düzenleme yapmaya çağırıyor. Avrupa Yayın Birliği (EBU), üyelerinin “bilgi bütünlüğü, dijital hizmetler ve medya çoğulculuğuna ilişkin mevcut yasaların uygulanması için AB ve ulusal düzenleyicilere baskı yapacağını” duyurdu. Kuruluş ayrıca, hızla gelişen yeni yapay zeka modelleri karşısında bağımsız denetimin öncelik haline gelmesi gerektiğini vurguladı.

EBU, medya alanında yapay zekaya daha sıkı standartlar getirilmesini talep ediyorFotoğraf: Supatman/La Nacion/ZUMA/picture alliance
EBU, diğer uluslararası yayın ve medya gruplarıyla birlikte “Facts In: Facts Out” (Gerçekler Giriş: Gerçekler Çıkış) adlı ortak bir kampanya başlattı. Kampanya, yapay zeka şirketlerini haberlerin işlenmesi ve yayılması konusunda daha fazla sorumluluk almaya davet ediyor.
Kampanya organizatörleri açıklamalarında şunları kaydetti:
“Bu sistemler güvenilir haberleri çarpıttığında yanlış aktardığında veya bağlamından kopardığında kamu güvenini zedeler. Talebimiz çok basit: Gerçekler giriyorsa, gerçekler de çıkmalı. Yapay zeka araçları, kullandıkları haberlerin bütünlüğünü tehlikeye atmamalıdır.”