← Keşif
Keşif · GitHub · VoxCPM🚀 Bir günde +658 yıldız

Belirteçsiz Çok Dilli Ses Tasarımı

VoxCPM; çok dilli konuşma üretimi, yaratıcı ses tasarımı ve gerçekçi ses kopyalama (voice cloning) işlemleri için geliştirilmiş, belirteçsiz (tokenizer-free) açık kaynak bir TTS modelidir.

Kimin içinSes/TTS geliştiren geliştiriciler, araştırmacılar
Zorlukİleri · ML/model bilgisi
Ne sunarÇok dilli TTS + ses tasarımı + klonlama
ÜcretÜcretsiz · açık kaynak (Apache-2.0)
LisansApache-2.0 · ayrıntı aşağıda

Ne sunar?

  • Çok dilli ve doğal konuşma üretimi.
  • Yaratıcı ve özgün ses tasarımı.
  • Yüksek doğrulukta ses kopyalama (voice cloning).

Sorumluluk notu

Nasıl kurulur, nasıl kullanılır?

🤖 Kod bilmiyorsanız · yapay zekâ ajanınıza (Claude Code · Codex · Antigravity) yapıştırın

VoxCPM metinden konuşma aracını kurmak için 'pip install voxcpm' komutunu çalıştır, sonra 'voxcpm design --text "Merhaba dünya" --output out.wav' komutuyla bir ses dosyası üret; istersem referans bir ses dosyasıyla 'voxcpm clone' kullanarak o sesi klonla.

pip ile kurulum
pip install voxcpm
Sesli tasarım (referans gerektirmez)
voxcpm design --text "VoxCPM2 brings studio-quality multilingual speech synthesis." --output out.wav
Ses klonlama (referans sesle)
voxcpm clone --text "This is a voice cloning demo." --reference-audio path/to/voice.wav --output out.wav
Ses kopyalama (voice cloning) içerir. Bir kişinin sesini izni olmadan taklit etmek yasal ve etik sorun yaratır; sorumluluk kullanıcıya aittir.
Lisans: Apache-2.0 · kod özgürce kullanılabilir/ticari. Model çıktısı ve ses kopyalama için yasal/etik sorumluluk size aittir.

Bağlantılar

İlgili sözlük terimleri

TreScout bu aracı geliştirmedi · GitHub trendlerinde keşfedip Türkçe tanıttı. Yıldız ve sayılar keşif tarihindeki değerlerdir.