Gemini, ChatGPT ve Grok test edildi: Basit matematikte hangi yapay zekâ sohbet botu en iyisi?
ORCA Kıyaslaması’na göre, hiçbir YZ modeli gündelik matematikte yüzde 63’ün üzerine çıkamadı. En yüksek puanı alan Gemini yüzde 63 doğruluk oranına ulaşırken, bu da neredeyse her 10 sorudan 4’ünü yanlış yaptığı anlamına geliyor. Grok yüzde 62,8 ile hemen arkasından geliyor. DeepSeek yüzde 52 ile üçüncü sırada yer alırken, ChatGPT yüzde 49,4’te kaldı. Claude ise yüzde 45,2 ile listenin sonunda yer aldı.
Araştırma, yapay zekânın hesaplama alanında giderek daha yaygın kullanılmasına rağmen, özellikle gündelik matematik işlemlerinde sonuçların mutlaka kontrol edilmesi gerektiğini ortaya koyuyor.
Haberin Tamamını Kaynağında Oku
Kaynak Adı
https://tr.euronews.com/next/2025/12/30/gemini-chatgpt-ve-grok-test-edildi-basit-matematikte-hangi-yapay-zeka-sohbet-botu-en-iyisi