Добыча текста, также известная как добыча данных, относится к процедуре извлечения ценной информации из текста. Принцип интеллектуального анализа данных заключается в обработке сырой и неструктурированной информации, извлечении значимой информации из текста. Как правило, он включает в себя метод структурирования полученного текста, извлечение закономерностей, содержащихся в структурированных данных, и в заключение оценку и анализ полученного результата. Одна из основных трудностей алгоритмов обучения классификации текста заключается в том, что для их точного обучения требуется большое количество примеров, помеченных вручную.
ThriftBooks sells millions of used books at the lowest
everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We
deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $15.
ThriftBooks.com. Read more. Spend less.