← Sözlük
Sözlük · Veri & Altyapı

Web Scraping nedir?

Web Kazıma

İnternet sitelerindeki verileri otomatik yöntemlerle toplayıp kaydeden yazılım süreci.

Tanım

Web kazıma, internet sitelerinde bulunan verilerin otomatik yazılımlar tarafından çekilerek yapılandırılmış bir formatta kaydedilmesi işlemidir. Manuel olarak kopyalayıp yapıştırmanın imkansız olduğu büyük verileri toplamak için kullanılır.

Şöyle düşünün: Bir kütüphanedeki binlerce kitabın içindeki bilgileri tek tek elle not almak yerine, bir robotun saniyeler içinde tüm sayfaları tarayıp bir tabloya dönüştürmesi gibidir.

Nasıl çalışır?

Bir yazılım, hedef web sitesine bir tarayıcı gibi bağlanır, sayfanın kodlarını okur ve içindeki istediğiniz verileri (fiyatlar, başlıklar vb.) ayıklayıp bir dosyaya aktarır.

Nerede kullanılır?

Fiyat karşılaştırma siteleri, pazar araştırmaları ve yapay zeka modellerini eğitmek için gereken veri setlerinin toplanmasında kullanılır.

Sık karıştırılanlar

Web tarama (crawling) ile karıştırılır ancak tarama siteleri dizine eklemek için kullanılırken, kazıma spesifik veriyi çekip anlamlandırmak için yapılır.

Sıkça sorulanlar

Her site kazınabilir mi?

Teknik olarak evet, ancak sitelerin kullanım koşullarına ve robot engelleme dosyalarına (robots.txt) dikkat etmek etik ve yasal açıdan önemlidir.

Web kazıma zor mu?

Basit siteler için oldukça kolaydır, ancak modern ve güvenlikli siteler için gelişmiş teknik bilgi gerektirir.

İlgili terimler

İlgili araçlar

Bu açıklama TreScout için sade dille hazırlandı · yanlış ya da eksik gördüğünüz bir şey olursa hello@trescout.com. TreScout her gün GitHub, Hacker News ve HuggingFace trendlerini Türkçe özetler.