Keşif · GitHub · PaddleOCR

Belgeleri yapay zekâ ile dijitalleştirin

PaddlePaddle tarafından geliştirilen PaddleOCR, PDF ve görsel belgeleri büyük dil modelleri (large language models) için yapılandırılmış veriye dönüştüren hafif bir optik karakter tanıma (optical character recognition) aracıdır. 100'den fazla dili destekleyen bu kütüphane, görsel içerikler ile yapay zekâ modelleri arasındaki veri akışını standartlaştırmaktadır.

★ 80.160
GitHub Trending · 2026-06-05

Ne kazandırır?

PDF ve görselleri LLM uyumlu Markdown veya JSON formatına dönüştürür.
100'den fazla dili destekleyen çok dilli metin tanıma yeteneği sunar.
Düşük kaynak kullanımıyla yüksek doğrulukta belge ayrıştırma sağlar.

Kurulum

Python (pip)

pip install paddleocr

Kaynak: PyPI · paddleocr (resmî paket)

Kimin içinBelge tabanlı yapay zekâ uygulamaları, RAG sistemleri veya veri otomasyonu geliştiren yazılımcılar ve veri bilimciler için uygundur.

LisansApache-2.0

Bağlantılar

GitHub deposu →

İlgili sözlük terimleri

TreScout bu aracı geliştirmedi · GitHub trendlerinde keşfedip Türkçe tanıttı. Yıldız ve sayılar keşif tarihindeki değerlerdir.