Mistral AI, Cihaz İçi Ses Tanıma Modeli "Voxtral Transcribe 2"yi Yayınladı
Fransız yapay zeka girişimi Mistral AI, ses teknolojilerinde ezber bozan yeni modeli Voxtral Transcribe 2'yi açık kaynak (open-source) olarak yayınladı. Özellikle gizlilik odaklı ve cihaz içi (on-device) kullanımlar için optimize edilen bu model, sesin metne dönüştürülmesi (speech-to-text) süreçlerinde bulut zorunluluğunu ortadan kaldırıyor.
Voxtral 2, 200 milisaniyenin altındaki ultra düşük gecikme süresiyle (latency) dikkat çekiyor; bu da onu gerçek zamanlı çeviri cihazları, akıllı asistanlar ve toplantı notu uygulamaları için ideal kılıyor. Mistral'in Apache 2.0 lisansı ile sunduğu model, geliştiricilerin kendi donanımları üzerinde (Edge AI) çalıştırabilmesine olanak tanıyor. Bu sayede hassas veriler (örneğin hukuk veya sağlık kayıtları) üçüncü parti sunuculara gönderilmeden işlenebiliyor. Modelin FLEURS testlerinde %4'lük kelime hata oranıyla (WER) sektör lideri doğruluk seviyesine ulaştığı belirtiliyor.
Haberin Tamamını Kaynağında Oku
Kaynak Adı
https://mistral.ai/news/voxtral-transcribe-2