VBART: Türkçe İçin İlk Yapay Zeka Büyük Dil Modeli ile Tanışın

VBART, Türk mühendisler tarafından tasarlanan ve Türkçe için sıfırdan eğitilmiş ilk büyük dil modeli.

VNGRS VBART

Türkçe Doğal Dil İşleme (NLP) alanında büyük bir adım atıldı. VBART, Türkçe için sıfırdan eğitilmiş ilk büyük dil (yapay zeka) modelleri olarak sahneye çıktı. VNGRS tarafından geliştirilen VBART, BART ve mBART modellerinden esinlenerek oluşturulmuş, Large ve XLarge olarak iki boyutta sunulmuştur.

VBART, Türk mühendisler tarafından tasarlanan ve Türkçe için sıfırdan eğitilmiş ilk büyük dil modeli (yapay zeka) olarak öne çıkıyor. Bu model, geniş bir yelpazede Türkçe LLM uygulamaları için doğru ve içeriğe duyarlı anlam sağlamayı hedefliyor. VBART modelleri, metin özetleme, başlık oluşturma, metin paraflama, soru yanıtlama ve soru oluşturma gibi görevlerde en son teknoloji yapay zeka ürünlerini bile geride bırakıyor. Bu modeller, çok dilli modellere kıyasla 3 kat daha iyi performans gösteriyor ve Türkçe için özel olarak eğitilmiş monolingual tokenizer, çok dilli tokenizarlardan 11 kat daha verimli.

VBART, gelecekteki metin üretim görevleri ve veri setleri için ince ayar yapma imkanı sunarak Türkçe NLP araştırmalarında yeni bir yol açıyor.

VBART modelleri, 135 GB’lık temizlenmiş Türkçe veri üzerinde 2.7 milyon adım boyunca eğitildi ve 708 milyar tokena maruz kaldı. Bu süreç, modellerin Türkçe dilini derinlemesine öğrenmesini ve metin üretiminde yüksek doğruluk ve bağlam farkındalığı sağlamasını mümkün kıldı.

VBART modelleri, tokenizer ve temizlenmiş vngrs-web-corpus, araştırmacıların ve geliştiricilerin erişimine açık olarak sunulmuştur. Bu, Türkçe NLP alanında daha fazla araştırma ve geliştirme yapılmasına olanak tanıyacak önemli bir adımdır.

VBART, Türkçe Doğal Dil İşleme alanında devrim niteliğinde bir gelişme olarak öne çıkıyor. Performans ve verimlilikte sağladığı üstün başarılar, gelecekteki araştırmalar için sunduğu imkanlar ve kamuya açık kaynakları ile Türkçe NLP araştırmalarında yeni bir dönemin kapılarını aralıyor.

VBART modelleri ve ilgili kaynaklar, Hugging Face platformunda mevcuttur. Aşağıdaki bağlantılardan daha fazla bilgiye ulaşabilirsiniz:

yuzde100yerli.com'un kurucusu, gönüllü yazar, yerli malı hastası, 2 çocuk babası. Teknolojiyi, yerli ve milli projeleri takip etmekten keyif alıyorum. Yeni bir yerli ürün ve yeni bir girişim görmek beni mutlu ediyor bu nedenle 2006 yılında yuzde100yerli.com'u yayına alma kararı aldım. Yazılım sektöründe 20+ yıldır çalışıyorum Türkiye'nin kurumsal firmalarında çalıştım ve hala yazılım sektöründe çalışmaya da devam ediyorum.