Keşif · GitHub · PaddleOCR
Belgeleri yapay zekâ ile dijitalleştirin
PaddlePaddle tarafından geliştirilen PaddleOCR, PDF ve görsel belgeleri büyük dil modelleri (large language models) için yapılandırılmış veriye dönüştüren hafif bir optik karakter tanıma (optical character recognition) aracıdır. 100'den fazla dili destekleyen bu kütüphane, görsel içerikler ile yapay zekâ modelleri arasındaki veri akışını standartlaştırmaktadır.
Ne kazandırır?
- PDF ve görselleri LLM uyumlu Markdown veya JSON formatına dönüştürür.
- 100'den fazla dili destekleyen çok dilli metin tanıma yeteneği sunar.
- Düşük kaynak kullanımıyla yüksek doğrulukta belge ayrıştırma sağlar.
Kurulum
Python (pip)
pip install paddleocrKaynak: PyPI · paddleocr (resmî paket)
Kimin içinBelge tabanlı yapay zekâ uygulamaları, RAG sistemleri veya veri otomasyonu geliştiren yazılımcılar ve veri bilimciler için uygundur.
LisansApache-2.0
Bağlantılar
İlgili sözlük terimleri
TreScout bu aracı geliştirmedi · GitHub trendlerinde keşfedip Türkçe tanıttı. Yıldız ve sayılar keşif tarihindeki değerlerdir.