Keşif · GitHub · Heretic🚀 Bir günde +211 yıldız
Dil Modellerinde Güvenlik Sınırlarını Aşın
Heretic, transformer tabanlı dil modellerinden güvenlik hizalaması (safety alignment) kısıtlarını, pahalı yeniden eğitim süreçlerine gerek kalmadan kaldıran teknik bir araçtır. 'Abliteration' tekniğini kullanan bu çözüm, ileri düzey ve araştırma odaklı bir yapıdadır.
Kimin içinML araştırmacıları / ileri düzey kullanıcılar
Zorlukİleri · model ağırlıklarıyla çalışma bilgisi
Ne yaparModelden güvenlik kısıtlarını kaldırma
ÜcretÜcretsiz · açık kaynak (AGPL-3.0)
LisansAGPL-3.0 · ayrıntı aşağıda
Ne yapar?
- 'Abliteration' tekniğiyle modeldeki kısıtları kaldırır.
- Pahalı yeniden eğitim gerektirmez.
- Yöntem açık kaynak ve otomatiktir.
Sorumluluk notu
Bu araç modelin güvenlik korumalarını kaldırır. Üretilecek çıktıların yasal ve etik sorumluluğu tamamen kullanıcıya aittir; zararlı veya yasa dışı kullanım önerilmez. Araştırma/ileri düzey amaçlıdır.
Lisans: AGPL-3.0 · kullanımı serbest; ancak kodu değiştirip dağıtır ya da bir servis olarak sunarsanız kendi kaynağınızı da açmanız gerekir (copyleft).
Bağlantılar
İlgili sözlük terimleri
TreScout bu aracı geliştirmedi · GitHub trendlerinde keşfedip Türkçe tanıttı. Yıldız ve sayılar keşif tarihindeki değerlerdir.