Informationsextraktion von Webseiten via RoadRunner [German]

By Pawel Broda

No Customer Reviews

Forschungsarbeit aus dem Jahr 2009 im Fachbereich Didaktik - Informatik, Note: 1, Ludwig-Maximilians-Universit t M nchen (Centrum f r Informations- und Sprachverarbeitung), Veranstaltung: Web Data Mining, Sprache: Deutsch, Abstract: Das Web hat sich in den letzten Jahren zum gr ten existierenden und frei verf gbaren Daten- und Informationsbestand entwickelt. Im Netz, wo es ein absoluter Daten berfluss und Informationenchaos herrscht, ist beinahe alles zu finden. Auf der Suche nach ben tigten Informationen wird durch unz hlige Dokumente gest bert, die von unterschiedlicher Struktur und unterschiedlicher Relevanz sind. W hrend die Suchmaschinen einen gewissen Teil des Webs crawlen und somit auch indexiert k nnen, bleibt ein sehr gro er Teil des Webs verschlossen. Dieser Umstand wird auf die stets wachsende Anzahl von dynamisch generierten Webseiten zur ckgef hrt. Die gesuchten Informationen sind nicht mehr statisch verf gbar sondern werden aufgrund von benutzerspezifischen Anfragen aus den relationalen Datenbanken dynamisch erzeugt. In diesem riesigen Dokumentenbestand, in den statischen und dynamisch generierten Webseiten, werden mit Information Retrieval Verfahren relevante Daten gesucht und nach dem Finden so abgespeichert, dass sie bequem weiterverarbeitet werden k nnen. Im n chsten Schritt wird es versucht, aus den semi-strukturierten Dokumenten relevante Informationen zu gewinnen.

Format:Paperback

Language:German

ISBN:3640518640

ISBN13:9783640518647

Release Date:February 2010

Publisher:Grin Verlag

Length:28 Pages

Weight:0.11 lbs.

Dimensions:0.1" x 5.8" x 8.3"

Related Subjects

Computers Computers & Technology Crafts Crafts & Hobbies Crafts & Hobbies

Customer Reviews

0 rating

Write a review

ThriftBooks sells millions of used books at the lowest everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15. ThriftBooks.com. Read more. Spend less.

Copyright © 2026 Thriftbooks.com Terms of Use | Privacy Policy | Do Not Sell/Share My Personal Information | Cookie Policy | Cookie Preferences | Accessibility Statement
ThriftBooks^® and the ThriftBooks^® logo are registered trademarks of Thrift Books Global, LLC

Informationsextraktion von Webseiten via RoadRunner [German]

Recommended

Customer Reviews

Popular Categories

Website

My Account

Partnerships

Quick Help

About Us

Follow Us