Sadržaj:
- Prikupljanje podataka
- Šabloni
- Kreiranje zadataka
- Čuvanje i izmena podešavanja zadataka
- Prikazivanje zadataka i upravljanje
- Dodatni alati
- Izvoz podataka
- Proksi serveri
- Blokiranje reklama
- Oblačne usluge
- Lekcije o korišćenju
- Tehnička podrška
- Prednosti
- Nedostaci
- Preuzmite probnu verziju Octoparse
- Pitanja i odgovori: 1
Prikupljanje podataka
Octoparse – to je sveobuhvatno softversko rešenje za masovno i automatizovano prikupljanje (vеб-скрейпинг), strukturiranje i analizu podataka, za čiju upotrebu nisu potrebne veštine programiranja. Pomoću njega možete pretvoriti bilo koje nestrukturirane veb podatke u gotovu informativnu bazu za marketing, istraživanja, prodaju, promociju i rešavanje mnogih drugih poslovnih zadataka.

U zavisnosti od toga na kojim sajtovima će se koristiti softver, mogu se dobiti podaci i/ili sadržaj sledećih tipova: cene i informacije o proizvodima (za trgovačke platforme); postovi, publikacije, komentari (društvene mreže); cene, ocene, recenzije (buking, nekretnine); oglasi za posao i plate (posao) itd.

Razmatrani softver funkcioniše pod upravom jedinstvenog algoritma, u osnovi kojeg leži veštačka inteligencija, što omogućava automatsko pronalaženje i izvlačenje podataka sa veb stranica prema unapred navedenim ili šablonskim parametrima.

Šabloni
Servis pruža više od 200 gotovih šablona za prikupljanje podataka sa sajtova iz sledećih kategorija:
- Popularne veb usluge;
- Internet prodavnice i trgovačke platforme (Amazon, eBay, Walmart itd.);
- Hoteli i putovanja (Airbnb, Booking, Tripadvisor itd.);
- Društvene mreže i mediji (Facebook, Instagram, Twitter, YouTube itd.);
- Pretraživači (Google, Yahoo);
- Oglasi (Crunchbase, Yellow Pages, Yelp itd.);
- Kartaške usluge (Google);
- Recenzije;
- Pretraga posla;
- Nekretnine;
- Školsko obrazovanje;
- Finansije;
- Uloge.













Kreiranje zadataka
Pored šablonskih, u Octoparse možete kreirati svoje vlastite zadatke za ekstrakciju podataka sa veba. Ova procedura se sprovodi u tri jednostavna koraka: navođenje URL adrese stranice sa koje je potrebno prikupiti podatke, izbor cilja i zatim pokretanje i neposredna ekstrakcija.
Procedura je izuzetno jednostavna i automatizovana – sistem prepoznaje ključne elemente na veb stranicama i ističe ih, što ne samo da obezbeđuje dodatnu udobnost u interakciji, već i štedi vreme. Još važnije je to što ovakav pristup isključuje potrebu za poznavanjem i korišćenjem XPath jezika za samostalno kreiranje XML upita.

Čuvanje i izmena podešavanja zadataka
Tokom automatske ekstrakcije informacija i na osnovu sadržaja otkrivenog na sajtu, Octoparse kreira svoja podešavanja koja se mogu sačuvati kao šablonska i spremna za dalju upotrebu, ili izmeniti po sopstvenoj želji, na primer, isključivanjem jedne kategorije i dodavanjem druge ili jednostavno menjajući njihov redosled.

Očigledno je da potreba za izmenom osnovnih podešavanja, koja određuju konačno predstavljanje prikupljenih podataka, nastaje prilično često. Prvobitno se prikazuju u obliku pregledne tabele sa automatski definisanim kategorijama i redosledom, čije kolone se mogu menjati, a nepotrebne jednostavno ukloniti.

Pored toga, često je potrebno samostalno navesti takve parametre kao što su broj stranica na sajtu i interval pristupa njima.

Nakon automatskog ili samostalnog određivanja podešavanja, pokretanja i završetka neposrednog procesa ekstrakcije, kreira se radni šablon (workflow) koji se sastoji od nekoliko blokova – uređivih elemenata, čiji konačni izgled definiše kako će zadatak izgledati kao rezultat.

Predstavljanje zadataka i upravljanje
Gotovi zadaci se dodaju na kontrolnu tablu (dostupna iz gornjeg i bočnog menija), odakle se mogu izvoditi akcije kao što su pokretanje i zaustavljanje procesa ekstrakcije, deljenje sa kolegama, eksportovanje, pregled lokalnih podataka i onih koji se čuvaju u oblaku.

Za lakše pretraživanje i upravljanje preporučuje se kreiranje grupa, a po potrebi se mogu premestiti zadaci iz jedne kategorije u drugu.

Dodatni alati
U okviru aktuelne (beta) verzije Oktoparse postoje dva dodatna alata koja proširuju funkcionalne mogućnosti ovog programa i omogućavaju efikasnije interakcije sa podacima. Tako, RegEx alat pruža mogućnost čišćenja prikupljenih informacija, dok Database Auto Export alat omogućava postavljanje sopstvenog rasporeda za izvoz u lokalnu bazu.

Izvoz podataka
Podaci prikupljeni pomoću Octoparse mogu se, po potrebi, sačuvati u formatima XLSX, CSV, JSON itd. za dalju obradu u spoljnim softverima, kao što su Excel ili Ajax. Takođe, postoji mogućnost izvoza u baze podataka.

Proxy serveri
Razmatrani program omogućava korišćenje sopstvenog proxy servera u procesu prikupljanja podataka. Na taj način se može sakriti ili automatski zameniti svoj IP adresu, kako bi se izbeglo stavljanje na crnu listu obrađivanih veb resursa.
Блокирање реклама
Octoparse садржи у свом саставу средства за блокирање реклама, захваљујући чему се смањује време учитавања страница и обраћања њима и, сходно томе, оптимизује и убрзава решавање основних радних задатака.
Облачне услуге
За обезбеђивање безбедности и поузданости процеса веб-скрејпинга, Octoparse користи напредне технологије облачних рачунара сопствене производње, као и пружа приступ својим услугама и серверима, чија је брзина рада до 20 пута већа него код локалних аналога.

Уроци за коришћење
На званичном сајту Octoparse представљена је исцрпна библиотека образовних материјала, захваљујући којима се у кратком року могу савладати све функционалне могућности овог софтвера, како би се максимално ефикасно користио за организацију радних процеса и решавање пословних задатака. Могуће је приступити њима и из интерфејса програма, његовог главног прозора.

Техничка подршка
У случају настанка било каквих потешкоћа у коришћењу и/или проблема у раду, Octoparse се увек може обратити служби техничке подршке сервиса за веб-скрејпинг података. Доступни су следећи канали комуникације: електронска пошта, форум и заједница, друштвене мреже и живи чет (доступан само у платном тарифу). При томе, вреди напоменути да је за добијање одговора на одређена питања често довољно обратити се представљеној на сајту бази знања или већ поменутим образовним материјалима.

Prednosti
- Postojanje 14-dnevne besplatne probne verzije;
- Jednostavno i praktično, intuitivno razumljiv interfejs;
- Nema potrebe za poznavanjem programerskih veština;
- Mogućnost korišćenja cloud servisa kompanije-razvijača;
- Postojanje obrazovnih materijala za korišćenje softvera;
- Tehnička podrška sa više kanala komunikacije;
- Velika biblioteka gotovih šablona koje je moguće prilagoditi svojim potrebama;
- Podrška za najpopularnije veb sajtove i servise različitih pravaca i tema.
Nedostaci
- Nema rusifikacije;
- Nema šablona za domaće sajtove;
- U trenutku pisanja pregleda, aktuelne verzije Octoparse za Windows i macOS dostupne su samo u beta verziji. Prethodna (stabilna) se razlikuje od nje po interfejsu i funkcionalnosti.