← Keşif
Keşif · GitHub · PaddleOCR

Belgeleri yapay zekâ ile dijitalleştirin

PaddlePaddle tarafından geliştirilen PaddleOCR, PDF ve görsel belgeleri büyük dil modelleri (large language models) için yapılandırılmış veriye dönüştüren hafif bir optik karakter tanıma (optical character recognition) aracıdır. 100'den fazla dili destekleyen bu kütüphane, görsel içerikler ile yapay zekâ modelleri arasındaki veri akışını standartlaştırmaktadır.

Ne kazandırır?

  • PDF ve görselleri LLM uyumlu Markdown veya JSON formatına dönüştürür.
  • 100'den fazla dili destekleyen çok dilli metin tanıma yeteneği sunar.
  • Düşük kaynak kullanımıyla yüksek doğrulukta belge ayrıştırma sağlar.

Kurulum

Python (pip)
pip install paddleocr

Kaynak: PyPI · paddleocr (resmî paket)

Kimin içinBelge tabanlı yapay zekâ uygulamaları, RAG sistemleri veya veri otomasyonu geliştiren yazılımcılar ve veri bilimciler için uygundur.
LisansApache-2.0

Bağlantılar

İlgili sözlük terimleri

TreScout bu aracı geliştirmedi · GitHub trendlerinde keşfedip Türkçe tanıttı. Yıldız ve sayılar keşif tarihindeki değerlerdir.