Forschungsarbeit aus dem Jahr 2009 im Fachbereich Didaktik - Informatik, Note: 1, Ludwig-Maximilians-Universit t M nchen (Centrum f r Informations- und Sprachverarbeitung), Veranstaltung: Web Data Mining, Sprache: Deutsch, Abstract: Das Web hat sich in den letzten Jahren zum gr ten existierenden und frei verf gbaren Daten- und Informationsbestand entwickelt. Im Netz, wo es ein absoluter Daten berfluss und Informationenchaos herrscht, ist beinahe alles zu finden. Auf der Suche nach ben tigten Informationen wird durch unz hlige Dokumente gest bert, die von unterschiedlicher Struktur und unterschiedlicher Relevanz sind. W hrend die Suchmaschinen einen gewissen Teil des Webs crawlen und somit auch indexiert k nnen, bleibt ein sehr gro er Teil des Webs verschlossen. Dieser Umstand wird auf die stets wachsende Anzahl von dynamisch generierten Webseiten zur ckgef hrt. Die gesuchten Informationen sind nicht mehr statisch verf gbar sondern werden aufgrund von benutzerspezifischen Anfragen aus den relationalen Datenbanken dynamisch erzeugt. In diesem riesigen Dokumentenbestand, in den statischen und dynamisch generierten Webseiten, werden mit Information Retrieval Verfahren relevante Daten gesucht und nach dem Finden so abgespeichert, dass sie bequem weiterverarbeitet werden k nnen. Im n chsten Schritt wird es versucht, aus den semi-strukturierten Dokumenten relevante Informationen zu gewinnen.
ThriftBooks sells millions of used books at the lowest
everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We
deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15.
ThriftBooks.com. Read more. Spend less.