3 Teknik Web Scraping

1.HTML Parsing
HTML parsing merupakan salah satu teknik yang sering digunakan dalam proses parsing atau penguraian data. Teknik ini dilakukan menggunakan Javascript dan menargetkan halaman HTML linear atau nested. Teknik ini dapat mengekstraksi data dengan cepat dan mudah. Beberapa data yang dapat seperti tulisan, link, screen, dan lain-lain.

2.DOM Parsing
DOM atau Document Object Model menentukan gaya, struktur serta konten yang terkandung dalam file XML. Teknik DOM parsing biasanya digunakan ketika ingin mendapatkan informasi lebih mendalam mengenai struktur halaman website. Kalian dapat menggunakan DOM parser untuk mengumpulkan node yang berisi informasi dan mengekstrak data di dalamnya menggunakan sebuah alat seperti XPath.

3.Google Sheets
Google sheet sebenarnya dapat digunakan sebagai alat web scraping dasar. Kalian dapat menggunakan formula khusus untuk mengekstrak data dari halaman web, kemudian mengimpornya langsung ke dalam Google sheet. Beberapa formula sheet yang dapat digunakan untuk web scraping di Google Sheet adalah ImportXML, ImportHTML, ImportFEED, dan ImportDATA.


Di tulis oleh: