Saf Python ile Veri Kazıma (Web Scraping)

Standard

Merhaba,

Web üzerinde veri kazıma işlemleri için birçok yöntem bulunmakta. Tabii ki python‘un bu konudaki güçlü çatılarından birisi olan Scrapy bu iş için biçilmiş kaftan konumunda. Ancak işi programlama olmayan, ancak site ya da siteler üzerindeki verileri python ile alabileceğinin bilincinde olan kişi sayısı da günden güne artmakta. Bu da karşımızda, “acaba kapsamlı bir proje değilde basitçe bir site üzerindeki belirli bilgileri çekmek istiyorsak, en az gereksinimle bunu nasıl yapabiliriz?” sorusunu çıkarıyor.

Aslında yakın zamanda yayınlayacağım bir projemin temellerini araştırırken denk geldiğim güzel bir kütüphaneyi kullanarak bu işi yapabileceğimi farketmem, bu makaleyi oluşturmama sebep oldu. Python 3’ün “requests-html” kütüphanesi, bir site üzerindeki xpath ya da CSS desenlerini takip ederek veri elde etmenize imkan tanıyor. Bunun yanında da birçok imkanla beraber sitedeki verileri de indirmenizi mümkün kılıyor.

Okumaya Devam Edeyim Bari…