İş ve Girişim
Pazar, Temmuz 20, 2025
  • Anasayfa
  • Ekonomi / Finans
  • İş Dünyası
  • Girişimcilik
  • Teknoloji
  • Sürdürülebilirlik
  • Röportaj / Söyleşi
  • Köşe Yazıları
Sonuç Bulunamadı
Tüm Sonuçları Göster
  • Anasayfa
  • Ekonomi / Finans
  • İş Dünyası
  • Girişimcilik
  • Teknoloji
  • Sürdürülebilirlik
  • Röportaj / Söyleşi
  • Köşe Yazıları
Sonuç Bulunamadı
Tüm Sonuçları Göster
İş ve Girişim
Sonuç Bulunamadı
Tüm Sonuçları Göster
Anasayfa Teknoloji

Yapay Zeka ve Temel Görevlerdeki Zorluklar: Saat Okuma ve Takvim Anlama

isvegirisim Yazar : isvegirisim
19/03/2025
Kategori : Teknoloji
Okuma Süresi : 3 dakika
A A
0
Yapay Zeka ve Temel Görevlerdeki Zorluklar: Saat Okuma ve Takvim Anlama
Facebook'ta PaylaşTwitter'da Paylaş

Yapay Zeka ve Temel Görevlerdeki Zorlukları

Yapay zeka, son yıllarda eşsiz yetenekler sergileyerek hikaye yazmaktan protein yapılarını tahmin etmeye, gerçekçi görseller yaratmaktan ev ödevlerini çözmeye kadar geniş bir yelpazede kullanılmaya başlandı. Ancak, her şey göründüğü kadar kusursuz değil. Yeni bir araştırma, yapay zekanın bazı basit görevlerde – örneğin analog bir saati okuma gibi – neredeyse komik denebilecek ölçüde zorlandığını ortaya koydu.

Edinburgh Üniversitesi’nden bir grup araştırmacı, çeşitli ortamları yorumlayabilen ve içerik üretebilen yedi çok modlu büyük dil modelini (MLLM) test etti. Çalışmalarını Nisan ayında yayınlamayı planlayan ekip, bu modellerin saat ya da takvim gibi görseller üzerinden zamanla ilgili soruları ne kadar doğru yanıtlayabildiğini inceledi. Araştırma sonuçları, yapay zekanın bu temel görevlerde beklenenden çok daha düşük bir başarı gösterdiğini ortaya koydu. Araştırmacılar, makalelerinde bu sorunun önemini şöyle açıklıyor: “Görsel girdilerden zamanı yorumlama ve akıl yürütme yeteneği, olay planlamasından otonom sistemlere kadar birçok gerçek dünya uygulaması için kritik bir rol oynar.”

Ancak mevcut teknolojiler daha çok nesne algılama, görüntü başlığı veya sahne analizi gibi alanlarda yoğunlaşmış durumda. Zamansal çıkarımlara yönelik araştırmalar ise hala yetersiz. Ekip, ünlü modeller arasında yer alan OpenAI’nin GPT-4o ve GPT-o1’ini, Google DeepMind’ın Gemini 2.0’ını, Anthropic’in Claude 3.5 Sonnet’ini, Meta’nın Llama 3.2-11B-Vision-Instruct’unu, Alibaba’nın Qwen2-VL7B-Instruct’unu ve ModelBest’in MiniCPM-V-2.6’sını test etti.

Modeller, farklı analog saat görselleri (örneğin, Roma rakamları, farklı tasarımlar ve bazılarında saniye kolu olmayan saatler) ile karşı karşıya bırakıldı. Ayrıca on yıllık bir takvim görüntüsü üzerinden zamanla ilgili daha karmaşık sorular soruldu; örneğin, “Yeni yıl haftanın hangi gününe denk geliyor?” veya “Yılın 153’üncü günü hangisidir?” gibi. Araştırmacılar, bu görevlerin yalnızca görsel tanıma değil, aynı zamanda sayısal akıl yürütme yeteneğini de gerektirdiğini vurguladı.

Şaşırtan Sonuçlar

Yapay zeka modelleri, özellikle analog saatleri okuma görevinde büyük zorluklar yaşadı. Bu görevde genel doğruluk oranı %25’in altında kaldı. Roma rakamları ve stilize kollar taşıyan saatlerde, hatta saniye kolu olmayan modellerde bile benzer şekilde kötü performans sergilendi. Araştırmacılar, bu başarısızlığın saat kollarını algılamak ve saat yüzündeki açıları yorumlamakla ilgili sorunlardan kaynaklandığını düşünüyor.

Google’ın Gemini 2.0 modeli, saat okuma testinde en yüksek puanı alırken, OpenAI’nin GPT-o1 modeli takvim görevlerinde rakiplerinden daha iyi performans göstererek %80 doğruluğa ulaştı. Ancak bu oran bile, en başarılı modelin hala %20 oranında hata yaptığını göstermektedir.

Bu araştırma, yapay zekanın etkileyici yeteneklerine rağmen bazı temel görevlerde hala ciddi sınırlamaları olduğunu ortaya koyuyor. Saat okuma ve takvim anlama gibi görsel ve bilişsel olarak basit görünen görevlerdeki bu başarısızlık, yapay zekanın insan akıl yürütmesinden ne kadar uzak olduğunu bir kez daha hatırlatıyor. Gelecekteki iyileştirmelerle bu eksiklerin giderilip giderilmeyeceğini ise zaman gösterecek.

Etiketler : analog saataraştırma sonuçlarıClaude 3.5dil modelleriEdinburgh ÜniversitesiGemini 2.0görsel algılamaGPT-4oLlama 3.2MiniCPM-V-2.6takvimYapay Zekâyapay zeka zorlukları
PaylaşTweetPaylaş
Önceki Haber

Dünya Denizlerinin Derinliklerinde Yaşamın Gizemleri

Sonraki Haber

Akdeniz’deki Plastik Kirliliği Tehlikesi

İlgili Haberler

Euromoney Ödülleriyle İş Bankası Dijitalleştirilmenin Zirvesinde

Euromoney Ödülleriyle İş Bankası Dijitalleştirilmenin Zirvesinde

18/07/2025
Türkiye’nin Dijital Finansal Geleceğine Yönelik Stratejik İş Birliği

Türkiye’nin Dijital Finansal Geleceğine Yönelik Stratejik İş Birliği

16/07/2025
Revo Capital, VIRGOSOL’a 3,5 Milyon Dolarlık Yatırım Yapıyor

Revo Capital, VIRGOSOL’a 3,5 Milyon Dolarlık Yatırım Yapıyor

16/07/2025
Lonca Girişimcilik Merkezi’nin Yeni Dönem ve Girişimler Programı

Lonca Girişimcilik Merkezi’nin Yeni Dönem ve Girişimler Programı

16/07/2025
ING Türkiye’nin Yapay Zeka Temelli Operasyonel Dönüşüm Başarısı

ING Türkiye’nin Yapay Zeka Temelli Operasyonel Dönüşüm Başarısı

16/07/2025
Garanti BBVA Partners Tech 2025 Dönemi Girişim Seçimi ve Program Detayları

Garanti BBVA Partners Tech 2025 Dönemi Girişim Seçimi ve Program Detayları

14/07/2025
Sonraki Haber
Akdeniz’deki Plastik Kirliliği Tehlikesi

Akdeniz'deki Plastik Kirliliği Tehlikesi

Son Eklenenler

TEB, Uluslararası Mükemmellik Ödülleriyle Bir Kez Daha Tanındı

TEB, Uluslararası Mükemmellik Ödülleriyle Bir Kez Daha Tanındı

20/07/2025
Albaraka Türk ve TMKŞ İş Birliğiyle Katılım Bankacılığı İlkleri Yeniden Yazılıyor

Albaraka Türk ve TMKŞ İş Birliğiyle Katılım Bankacılığı İlkleri Yeniden Yazılıyor

20/07/2025
Euromoney Ödülleriyle İş Bankası Dijitalleştirilmenin Zirvesinde

Euromoney Ödülleriyle İş Bankası Dijitalleştirilmenin Zirvesinde

18/07/2025
Garanti BBVA’dan Tüzel Müşterilere Dijital Kasko Çözümü

Garanti BBVA’dan Tüzel Müşterilere Dijital Kasko Çözümü

18/07/2025
Şengün Sigorta

Köşe Yazarları

  • Birgi Kuzumoğlu
  • Çağatay Pancaroğlu
  • Sevil Öge
  • Hakkımızda
  • Künye
  • Gizlilik Politikası
  • Çerez Politikası
  • Kullanım Koşulları
  • Bize Ulaşın

© 2022 İş ve Girişim | Web Tasarım : Paragon Tasarım

Sonuç Bulunamadı
Tüm Sonuçları Göster
  • Anasayfa
  • Ekonomi / Finans
  • İş Dünyası
  • Girişimcilik
  • Teknoloji
  • Sürdürülebilirlik
  • Röportaj / Söyleşi
  • Köşe Yazıları

© 2022 İş ve Girişim | Web Tasarım : Paragon Tasarım