Табличные данные - это существующий источник информации, доступный в Интернете. Мы начали работу над коллекцией HTML-таблиц, взятых из Интернета. Сначала будут определены таблицы хорошего качества, затем будет выполнено сопоставление схем. Сопоставление схем определяет количество соответствий, которые определяют схожие элементы из двух разных схем. Столбцы и значения данных сравниваются один за другим для соответствия схеме. При поиске табличных данных в Интернете поисковая система может вернуть URL, а не табличные данные, что является основной проблемой. Поэтому мы работаем над этой проблемой. Мы извлекли данные табличных веб-страниц и извлекли их схему, а затем выполнили сопоставление схем путем выявления соответствия похожих элементов с помощью техники, основанной на корпусе. После сопоставления схем мы заполнили данные HTML-страниц путем объединения связанных таблиц в одну HTML-таблицу, которая является более подходящей и полезной для пользователей.
ThriftBooks sells millions of used books at the lowest
everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We
deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15.
ThriftBooks.com. Read more. Spend less.