← Sözlük
Sözlük · Yapay Zekâ

Quantization nedir?

Yapay zeka modellerini daha hafif ve hızlı hale getirmek için yapılan boyut küçültme işlemidir.

Tanım

Kuantizasyon, devasa yapay zeka modellerinin içindeki sayısal verilerin hassasiyetini azaltarak boyutlarını küçültme işlemidir. Bu sayede modeller, çok daha az bellek kullanarak daha düşük donanımlı cihazlarda çalışabilir.

Şöyle düşünün: Çok yüksek çözünürlüklü bir fotoğrafı, görüntü kalitesini gözle görülür şekilde bozmadan dosya boyutunu küçültmek için sıkıştırmaya benzer. Detaylardan biraz ödün vererek hız kazanırsınız.

Nasıl çalışır?

Modeldeki ağırlıklar genellikle yüksek hassasiyetli ondalıklı sayılardır. Kuantizasyon bunları daha basit tam sayılara yuvarlar. Bu işlem, modelin kapladığı alanı ciddi oranda düşürürken zekasında çok küçük bir kayba neden olur.

Nerede kullanılır?

Büyük modellerin cep telefonlarında veya kişisel bilgisayarlarda (self-hosting) çalıştırılabilmesi için kullanılır.

Sık karıştırılanlar

Modeli eğitmekle karıştırılır, ancak bu eğitim sonrası yapılan bir optimizasyon işlemidir.

Sıkça sorulanlar

Modelin zekası düşer mi?

Çok az düşer ancak hız ve verimlilikteki kazanç genellikle buna değer.

Her model kuantize edilebilir mi?

Evet, hemen hemen tüm büyük dil modelleri üzerinde uygulanabilir.

İlgili terimler

Bu açıklama TreScout için sade dille hazırlandı · yanlış ya da eksik gördüğünüz bir şey olursa hello@trescout.com. TreScout her gün GitHub, Hacker News ve HuggingFace trendlerini Türkçe özetler.