İş ve Girişim
Pazartesi, Haziran 2, 2025
  • Anasayfa
  • Ekonomi / Finans
  • İş Dünyası
  • Girişimcilik
  • Teknoloji
  • Sürdürülebilirlik
  • Röportaj / Söyleşi
  • Köşe Yazıları
Sonuç Bulunamadı
Tüm Sonuçları Göster
  • Anasayfa
  • Ekonomi / Finans
  • İş Dünyası
  • Girişimcilik
  • Teknoloji
  • Sürdürülebilirlik
  • Röportaj / Söyleşi
  • Köşe Yazıları
Sonuç Bulunamadı
Tüm Sonuçları Göster
İş ve Girişim
Sonuç Bulunamadı
Tüm Sonuçları Göster
Anasayfa Teknoloji

Üretken Yapay Zeka Modellerinin Haber Arama Performansındaki Doğruluk Sorunları

isvegirisim Yazar : isvegirisim
17/03/2025
Kategori : Teknoloji
Okuma Süresi : 2 dakika
A A
0
Üretken Yapay Zeka Modellerinin Haber Arama Performansındaki Doğruluk Sorunları
Facebook'ta PaylaşTwitter'da Paylaş

Üretken Yapay Zeka Modellerinin Haber Arama Performansı: Ciddi Doğruluk Sorunları

Columbia Journalism Review’un Tow Center for Digital Journalism’i tarafından gerçekleştirilen kapsamlı bir araştırma, üretken yapay zeka (YZ) modellerinin haber arama işlevinde ciddi doğruluk sorunları yaşadığını gün yüzüne çıkardı. Araştırmada, canlı arama işlevine sahip sekiz farklı YZ destekli arama aracı incelendi ve bu araçların, haber kaynakları ile ilgili kullanıcıların verdiği istemlerin %60’ından fazlasına yanlış yanıtlar ürettiği belirlendi.

Araştırmacılar, şu anda Amerikalıların dörtte birinden fazlasının yapay zeka modellerini geleneksel arama motorlarına alternatif olarak kullandığını belirterek, bu durumun hataların etkisini daha da ciddi hale getirdiğine dikkat çektiler.

Araştırma Sonuçları ve Doğruluk Oranları

Farklı YZ modellerinin doğruluk oranlarında belirgin farklılıklar gözlemlendi. Örneğin, Perplexity platformu, verilen istemlerin %37’sinde yanlış bilgi sunarken, ChatGPT Search bu oranı %67’ye çıkardı. Dikkat çeken diğer bir sonuç ise, Grok 3‘ün %94 gibi çarpıcı bir hata oranıyla en düşük performansı sergilemesiydi.

Test Süreci

Araştırmacılar, bu modellerin gerçek haber makaleleri ile ne kadar güvenilir olduğunu test etmek amacıyla çeşitli istemler verdiler. İstemlerde, haber makalesinin başlığını, orijinal yayımcısını, yayım tarihini ve URL’sini doğru bir şekilde tespit etmeleri istendi. Toplamda 1.600’den fazla istem kullanılarak yapılan testlerde, modellerin güvenilir bilgiye sahip olmadıkları durumlarda yanıt vermektense, gerçekçi görünümlü ama hatalı ya da tahmine dayalı yanıtlar vermeleri dikkat çekti. Bu durum, incelenen tüm YZ modellerinde yaygın bir sorun olarak öne çıktı.

Ücretli Modeller, Ücretsiz Sürümlerden Daha mı Kötü?

Araştırma, bazı ücretli hizmetlerin beklenenden daha kötü performans sergileyebileceğini gösterdi. Örneğin, aylık 20 dolarlık Perplexity Pro ve 40 dolarlık Grok 3 Premium hizmetleri, ücretsiz sürümlerine kıyasla daha sık ve daha kendinden emin hatalar üretti. Bu modeller, daha fazla sayıda isteme yanıt verme eğiliminde olsalar da, yanıtlarını reddetmemeleri hata oranlarını artırdı.

Ayrıca araştırmacılar, bazı YZ araçlarının yetkisiz erişimi önlemeye yönelik ayarları dikkate almadığını da fark ettiler. Örneğin, Perplexity‘nin ücretsiz sürümü, National Geographic’in açık bir şekilde izin vermemesine rağmen, ücretli içeriklerden 10 tanesini doğru bir şekilde tanımlamayı başardı. Sıkça karşılaşılan diğer sorunlar arasında, alıntı yapılan yazılarda orijinal kaynağı göstermek yerine Yahoo News gibi başka sitelere bağlantı verme ve hatalı ya da geçersiz bağlantılar sağlama yer aldı.

Etiketler : araştırma sonuçlarıbilgi güvenilirliğiChatGPTColumbia Journalism Reviewdoğruluk sorunlarıGrok 3haber aramaPerplexityüretken yapay zekaYZ modelleri
PaylaşTweetPaylaş
Önceki Haber

Dünya Hava Kalitesi Raporu: Sağlıksız Hava Kirliliği Alarm Veriyor

Sonraki Haber

Gündem, Ekonomi ve Diplomasi: Öne Çıkan Gelişmeler

İlgili Haberler

Yapay Zeka ve ChatGPT: Günümüzün En Yenilikçi Dijital Asistanı

Yapay Zeka ve ChatGPT: Günümüzün En Yenilikçi Dijital Asistanı

31/05/2025
Yapay Zeka ve Robotların Gelecekteki Tehditleri: Bir Korku Senaryosu

Yapay Zeka ve Robotların Gelecekteki Tehditleri: Bir Korku Senaryosu

28/05/2025
Yapay Zeka Sistemlerinin Güvenlik Açıkları ve Sınırları

Yapay Zeka Sistemlerinin Güvenlik Açıkları ve Sınırları

27/05/2025
Apple’a Karşı Avrupa Birliği ve Mahkeme Kararlarıyla Gelen Büyük Değişim

Apple’a Karşı Avrupa Birliği ve Mahkeme Kararlarıyla Gelen Büyük Değişim

22/05/2025
Yapay Zekanın İnsan İlişkilerinde Beklenmedik Sonuçları: Yunanistan’da Bir Olayın Perde Arkası

Yapay Zekanın İnsan İlişkilerinde Beklenmedik Sonuçları: Yunanistan’da Bir Olayın Perde Arkası

19/05/2025
OpenAI GPT-4.1 Güncellemesi ve Yeni Özellikler

OpenAI GPT-4.1 Güncellemesi ve Yeni Özellikler

15/05/2025
Sonraki Haber
Gündem, Ekonomi ve Diplomasi: Öne Çıkan Gelişmeler

Gündem, Ekonomi ve Diplomasi: Öne Çıkan Gelişmeler

Son Eklenenler

Türkiye E-Ticaret Ekosistemi Raporu 2024: Dijital Dönüşüm ve Yeni Trendler

Türkiye E-Ticaret Ekosistemi Raporu 2024: Dijital Dönüşüm ve Yeni Trendler

02/06/2025
Turkcell’den Yenilikçi Dijital Kumbaraya Büyük İlgi: Tumbara Uygulaması

Turkcell’den Yenilikçi Dijital Kumbaraya Büyük İlgi: Tumbara Uygulaması

02/06/2025
Türkiye Finans’ta Üst Düzey Yönetim Değişiklikleri ve Yeni Atamalar

Türkiye Finans’ta Üst Düzey Yönetim Değişiklikleri ve Yeni Atamalar

02/06/2025
Akbank Wings Kredi Kartı Programı 2024 Yılında Çığır Açtı

Akbank Wings Kredi Kartı Programı 2024 Yılında Çığır Açtı

02/06/2025
Şengün Sigorta

Köşe Yazarları

  • Birgi Kuzumoğlu
  • Çağatay Pancaroğlu
  • Sevil Öge
  • Hakkımızda
  • Künye
  • Gizlilik Politikası
  • Çerez Politikası
  • Kullanım Koşulları
  • Bize Ulaşın

© 2022 İş ve Girişim | Web Tasarım : Paragon Tasarım

Sonuç Bulunamadı
Tüm Sonuçları Göster
  • Anasayfa
  • Ekonomi / Finans
  • İş Dünyası
  • Girişimcilik
  • Teknoloji
  • Sürdürülebilirlik
  • Röportaj / Söyleşi
  • Köşe Yazıları

© 2022 İş ve Girişim | Web Tasarım : Paragon Tasarım