Mistral AI, Cihaz İçi Ses Tanıma Modeli "Voxtral Transcribe 2"yi Yayınladı

Fransız yapay zeka girişimi Mistral AI, ses teknolojilerinde ezber bozan yeni modeli Voxtral Transcribe 2'yi açık kaynak (open-source) olarak yayınladı. Özellikle gizlilik odaklı ve cihaz içi (on-device) kullanımlar için optimize edilen bu model, sesin metne dönüştürülmesi (speech-to-text) süreçlerinde bulut zorunluluğunu ortadan kaldırıyor.

Voxtral 2, 200 milisaniyenin altındaki ultra düşük gecikme süresiyle (latency) dikkat çekiyor; bu da onu gerçek zamanlı çeviri cihazları, akıllı asistanlar ve toplantı notu uygulamaları için ideal kılıyor. Mistral'in Apache 2.0 lisansı ile sunduğu model, geliştiricilerin kendi donanımları üzerinde (Edge AI) çalıştırabilmesine olanak tanıyor. Bu sayede hassas veriler (örneğin hukuk veya sağlık kayıtları) üçüncü parti sunuculara gönderilmeden işlenebiliyor. Modelin FLEURS testlerinde %4'lük kelime hata oranıyla (WER) sektör lideri doğruluk seviyesine ulaştığı belirtiliyor.

Anam, Cara-3 Yüz Üretim Modelini Tanıttı: Araştırma İnteraktif Avatarları Tercih Ediyor

xAI, Grok 4.2 Açık Beta Sürümünü Yayınladı: Haftalık İyileştirmeler Planlanıyor

Anthropic, Kodlama, Ajanlar, Mantıksal Düşünme ve Tasarım İçin Claude Sonnet 4.6 Güncellemesini Tanıttı

Claude API'ye Web Araması İçin Dinamik Filtreleme Eklendi: %11 Daha Yüksek Doğruluk, %24 Daha Az Token

Mistral AI, Cihaz İçi Ses Tanıma Modeli "Voxtral Transcribe 2"yi Yayınladı

Anam, Cara-3 Yüz Üretim Modelini Tanıttı: Araştırma İnteraktif Avatarları Tercih Ediyor

xAI, Grok 4.2 Açık Beta Sürümünü Yayınladı: Haftalık İyileştirmeler Planlanıyor

Anthropic, Kodlama, Ajanlar, Mantıksal Düşünme ve Tasarım İçin Claude Sonnet 4.6 Güncellemesini Tanıttı

Claude API'ye Web Araması İçin Dinamik Filtreleme Eklendi: %11 Daha Yüksek Doğruluk, %24 Daha Az Token