В этой книге описывается влияние различных факторов, таких как скорость обучения, коэффициент дисконтирования и эпсилон, на способность дрона к обучению навигации от источника к месту назначения. Более высокое значение скорости обучения способствует быстрому обучению дрона, но при этом возникает риск осцилляции, а не сходимости, а при более низком значении скорости обучения дрон обучается медленно, но сходится стабильно. Эта книга в основном посвящена реализации алгоритмов RL для небольших областей. Для больших сложных областей эти алгоритмы менее эффективны, поэтому глубокое обучение с подкреплением может быть использовано в будущем, чтобы сделать БПЛА более эффективными для реальной реализации.
ThriftBooks sells millions of used books at the lowest everyday prices. We personally assess every book's quality and offer rare, out-of-print treasures. We deliver the joy of reading in recyclable packaging with free standard shipping on US orders over $20. ThriftBooks.com. Read more. Spend less.