Web Crawler

Webový prehľadávač, známy tiež ako pavúk, je automatizovaný program alebo robot, ktorý systematicky prehľadáva internet a hľadá nový alebo aktualizovaný obsah. Účelom webového prehľadávača je zhromažďovať informácie, napríklad text, obrázky a odkazy, a potom tieto informácie indexovať v databáze pre neskoršie použitie vyhľadávacím nástrojom alebo inými aplikáciami.

Web Crawlers pracujú začatím na konkrétnej webovej stránke a potom sledujú odkazy na iné stránky na rovnakom webe a potom na iné stránky. Používajú algoritmy na určenie, ktoré stránky na prehľadávanie a ako často, a môžu byť nakonfigurované na rešpektovanie súborov robots.txt, ktoré používajú webové stránky na kontrolu, ktoré stránky sú prehľadávané a indexované.

Webové prehľadávače používajú vyhľadávacie nástroje ako Google a Bing na indexovanie obsahu webových stránok a na ich vyhľadávanie. Spoločnosti ich tiež používajú na zhromažďovanie informácií o svojich konkurentoch, na sledovaní správania zákazníkov a monitorovaní online zmienok o svojej značke.

Webové prehľadávače môžu byť výkonnými nástrojmi, ale môžu spôsobiť problémy, ak sa nepoužívajú zodpovedne. Môžu zaťažiť webové servery a môžu sa dokonca použiť na škodlivé účely, ako je škrabanie osobných údajov alebo pokus o preniknutie do systémov.

Celkovo sú webové prehľadávače dôležitou súčasťou moderného internetového ekosystému, ktoré pomáhajú udržiavať vyhľadávacie nástroje aktuálne a poskytovať cenné údaje pre podnikom aj výskumným pracovníkom. Je však dôležité ich používať zodpovedne a s ohľadom na práva vlastníkov webových stránok a obavy súkromia.

 

Späť do slovníka pojmov

 

Poznáte tiež...?

 

IPv6 je nastupujúcej protokol pre komunikáciu v internete. IPv6 vzniklo v reakcii na rýchle vyčerpávanie adries v predchádzajúcom protokole IPv4 a snaží sa vyriešiť ďalšie problémy, ktoré narastajúci počet užívateľov...

Čítať ďalej

Client-side scripting (skriptovanie na strane klienta) je typ programovania, ktorý sa používa na vytváranie dynamických webových stránok na zariadení používateľa, a nie na serveri. Je to ako sada pokynov, ktoré hovoria prehliadaču používateľa, ako zobrazovať a interagovať s obsahom...

Čítať ďalej

RAID poľa je spôsob, ako predísť strate dát pri zlyhaní pevného disku. RAID pole tvorí obyčajné a sériovo vyrábané pevné disky. Dáta sa potom ukladajú na viac nezávislých diskov - a vďaka tomu,...

Čítať ďalej