
![]() |
|
Synonym of Web spider
Web crawler
A web crawler (also known as a web spider or web robot) is a program or automated script which browses the World Wide Web in a methodical, automated manner. Other less frequently used names for web crawlers are ants, automatic indexers, bots, and worms (Kobayashi and Takeda, 2000). This process is called web crawling or spidering. Many sites, in particular search engines, use spidering as a means of providing up-to-date data. Web crawlers are mainly used to create a copy of all the visited pages for later processing by a search engine that will index the downloaded pages to provide fast searches. Crawlers can also be used for automating maintenance tasks on a website, such as checking links or validating HTML code. Also, crawlers can be used to gather specific types of information from Web pages, such as harvesting e-mail addresses (usually for spam).
Robot d'indexation
Un robot d'indexation (ou littéralement araignée du Web ; en anglais web crawler ou web spider) est un logiciel qui explore automatiquement le Web. Il est généralement conçu pour collecter les ressources (pages web, images, vidéos, documents Word, PDF ou PostScript, etc.), afin de permettre à un moteur de recherche de les indexer.
WebCrawler
WebCrawler ist eine Internet-Suchmaschine, die seit 2001 zur Firma InfoSpace Inc. mit Hauptsitz in Bellevue (Washington, USA) gehört.
Webcrawler Ein Webcrawler (auch Spider oder Robot, kurz Bot) ist ein Computerprogramm, das automatisch das World Wide Web durchsucht und Webseiten analysiert. Webcrawler werden vor allem von Suchmaschinen eingesetzt. Weitere Anwendungen sind beispielsweise das Sammeln von RSS-Newsfeeds, E-Mail-Adressen oder anderer Informationen.
Robot internetowy
Robot internetowy - jest programem zbierającym informacje o strukturze i stronach umieszczanych w indeksie wyszukiwarek i służą m.in. do:
W przypadku robota Google tzn. Googlebota mówi się robotach wykonujących "Google's fresh crawl" i "Google's deep crawl" lub "Google's main crawl". "Fresh crawl" jest wykonywany często, nawet kilka razy dziennie - robot najprawdopodobniej sprawdza co się zmieniło na stronie, "deep crawl" głębokie indeksowanie najprawdopodobniej polega na pobieraniu większej ilości danych z witryny i odbywa się kilka razy w miesiącu.
Crawler
Un crawler (detto anche spider o robot), è un software che analizza i contenuti di una rete (o di un database) in un modo metodico e automatizzato, in genere per conto di un motore di ricerca. Un crawler è un tipo di bot (programma o script che automatizza delle operazioni). I crawler solitamente acquisiscono una copia testuale di tutti i documenti visitati e le inseriscono in un indice. Un uso estremamente comune dei crawler è nel Web. Sul Web, il crawler si basa su una lista di URL da visitare fornita dal motore di ricerca (il quale, inizialmente, si basa sugli indirizzi suggeriti dagli utenti o su una lista precompilata dai programmatori stessi). Durante l'analisi di un URL, identifica tutti gli hyperlink presenti nel documento e li aggiunge alla lista di URL da visitare. Il processo può essere concluso manualmente o dopo che un determinato numero di collegamenti è stato seguito.
Spider
Een spider (ook wel webcrawler genoemd) is een computerprogramma dat het wereldwijde web op een methodische en geautomatiseerde manier doorbladert, als een soort robot. Spiders maken veelal een lokale kopie van de gevonden pagina's om deze later te kunnen verwerken en indexeren voor bijvoorbeeld zoekmachines.
Spinnen (dieren) De spinnen (Araneae) zijn de bekendste orde uit de klasse spinachtigen (Arachnida), en zijn geleedpotige dieren waarvan ongeveer 50.000 soorten zijn beschreven. Spinnen komen over vrijwel de hele wereld voor, maar niet in zee; zeespinnen zijn wel verwant aan spinachtigen maar geen spinnen. Ook hooiwagens zijn geen spinnen, en kunnen geen web maken. De kleinste spinnensoorten blijven enkele millimeters, grotere soorten hebben een spanwijdte van meer dan 25 centimeter. Spinnen zijn er in alle vormen en maten, vooral tropische soorten worden groter en hebben soms bonte kleuren, markante lichaamsvormen of doornachtige uitsteeksels. De meeste soorten hebben echter een goede camouflage.
Поисковый робот
Поиско́вый ро́бот («веб-пау́к», паук, спайдер, краулер) — программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них (ключевые слова) в базу поисковика. По своей сути паук больше всего напоминает обычный браузер. Он сканирует содержимое страницы, забрасывает его на сервер поисковой машины, которой принадлежит и отправляется по ссылкам на следующие страницы. Владельцы поисковых машин обычно ограничивают глубину проникновения паука внутрь сайта и максимальный размер сканируемого текста, поэтому чересчур большие сайты могут оказаться не полностью проиндексированными поисковой машиной. Кроме обычных пауков, существуют так называемые «дятлы» — роботы, которые «простукивают» проиндексированный сайт, чтобы определить, что он подключен к Интернету.
Web crawler
Un web crawler (o araña de la web) es un programa que inspecciona las páginas del World Wide Web de forma metódica y automatizada. Los Web crawlers se utilizan para crear una copia de todas las páginas web visitadas para su procesado posterior por un motor de búsqueda que indexa las páginas proporcionando un sistema de búsquedas rápido.
זחלן רשת
זחלן רשת (web crawler) או רובוט חיפוש הוא סוג של בוט או תוכנה שסורקת באופן אוטומטי ושיטתי את הרשת הכלל עולמית (WWW). אתרים רבים, בייחוד מנועי חיפוש, משתמשים בזחלנים כדי לקבל תמונה עדכנית של הרשת. במנועי חיפוש, הזחלן שומר העתק של האתרים כדי שיהיה ניתן לעדכן אותם מאוחר יותר באינדקס של מנוע החיפוש. כמו כן, תוכנות זחלן יכולות לאתר קישורים מתים בדפי אינטרנט או לאסוף כתובות דואר אלקטרוני (בדרך כלל לשם שליחת דואר זבל). בדרך כלל הזחלן מתחיל לסרוק דף מתוך רשימה נתונה של דפים (למשל האינדקס של מנוע החיפוש) ומשם הוא מתקדם באופן רקורסיבי דרך הקישורים בדף, לדפים נוספים.
Web spider
(n.) = buscador web Ex: Subject databases where results appear as dynamically created HTML pages are not accessible to Web spiders and thus constitute a hidden Internet = Las bases de datos en las que los resultados aparecen como páginas HTML creadas dinámicamente no están accesibles a los buscadores web y, por lo tanto, son información oculta de Internet.
Web spider = buscador web
Ex: Subject databases where results appear as dynamically created HTML pages are not accessible to Web spiders and thus constitute a hidden Internet = Las bases de datos en las que los resultados aparecen como páginas HTML creadas dinámicamente no están accesibles a los buscadores web y, por lo tanto, son información oculta de Internet. | ||||||||||||||||||||||||||||||||||||||||||||||||