Разница между глубоким обучением и обучением с подкреплением

И глубоко, и обучение с подкреплением тесно связаны с вычислительной мощностью искусственного интеллекта (ИИ). Это автономные функции машинного обучения, которые позволяют компьютерам создавать собственные принципы при разработке решений. Эти два вида обучения могут также сосуществовать в нескольких программах. В общем-то, глубокое обучение использует текущие данные в то время как Обучение с подкреплением использует метод проб и ошибок при вычислении прогнозов. В следующих обсуждениях такие различия более подробно рассматриваются.



Что такое глубокое обучение?

Глубокое обучение также называется глубоким структурированным обучением или иерархическим обучением. Впервые это было представлено в 1986 году Риной Дехтер, компьютерная наука профессор. Он использует текущую информацию в обучающих алгоритмах для поиска подходящих закономерностей, которые необходимы для прогнозирования данных. Такая система использует разные уровни искусственных нейронных сетей, подобных нейронному составу человеческого мозга. С помощью сложных связей алгоритм может обрабатывать миллионы информации и заниматься более конкретным прогнозом.

Этот вид обучения может применяться, когда разработчики хотят, чтобы программное обеспечение обнаруживало фиолетовый цвет на различных изображениях. Затем в программу будет загружено несколько изображений (отсюда и «глубокое» обучение) с фиолетовыми цветами и без них. Благодаря кластеризации программа сможет определять закономерности и узнавать, когда отмечать цвет как фиолетовый. Глубокое обучение используется в различных программах распознавания, таких как анализ изображений и задачи прогнозирования, такие как прогнозирование временных рядов.



Что такое обучение с подкреплением?

Обучение с подкреплением обычно делает прогнозы методом проб и ошибок. Что касается его истории с точки зрения искусственного интеллекта, он был разработан в конце 1980-х; он был основан на результатах экспериментов на животных, концепциях оптимального управления и методах временных разностей. Наряду с обучением с учителем и без учителя подкрепление является одной из фундаментальных парадигм в машинном обучении. Как следует из названия, алгоритм тренируется с помощью вознаграждений.

Например, ИИ разработан, чтобы играть с людьми в определенной мобильной игре. Каждый раз, когда ИИ проигрывает, алгоритм пересматривается, чтобы получить максимальное количество очков. Таким образом, эта техника учится на своих ошибках. После многочисленных циклов ИИ эволюционировал и стал лучше побеждать игроков-людей. Обучение с подкреплением применяется в различных передовых технологиях, таких как улучшение робототехники, интеллектуального анализа текста и здравоохранения.

Разница между глубоким обучением и обучением с подкреплением

Техника обучения

Глубокое обучение способно выполнять целевое поведение, анализируя существующие данные и применяя полученные знания к новому набору информации. С другой стороны, обучение с подкреплением способно изменить свою реакцию, адаптируя постоянную обратную связь.



Существование данных

Глубокое обучение работает с уже существующими данными, поскольку это необходимо при обучении алгоритма. Что касается обучения с подкреплением, то оно носит исследовательский характер и может разрабатываться без текущего набора данных, поскольку оно обучается методом проб и ошибок.

заявка

Глубокое обучение - это используемый в изображении и речь распознавание, глубокое предварительное обучение сети и задачи уменьшения размерности. Для сравнения, обучение с подкреплением используется при взаимодействии с внешними стимулами с оптимальным контролем, например, в робототехнике, планировании лифтов, телекоммуникациях, компьютерных играх и ИИ в здравоохранении.

Также известный как

Глубокое обучение также известно как иерархическое обучение или глубоко структурированное обучение, в то время как обучение с подкреплением не имеет других широко известных терминов.



Машинное обучение

Глубокое обучение - один из многочисленных методов машинного обучения. С другой стороны, обучение с подкреплением - это область машинного обучения; это одна из трех фундаментальных парадигм.

Человеческий мозг

По сравнению с глубоким обучением, обучение с подкреплением ближе к возможностям человеческого мозга, поскольку этот вид интеллекта можно улучшить с помощью обратной связи. Глубокое обучение в основном предназначено для распознавания и меньше связано с взаимодействием.

История

Глубокое обучение было впервые представлено в 1986 году Риной Дехтер, а обучение с подкреплением было разработано в конце 1980-х годов на основе концепций экспериментов на животных, оптимального управления и методов временной разницы.

Глубокое обучение против обучения с подкреплением

Резюме

  • Глубокое обучение и обучение с подкреплением - это автономные функции машинного обучения, которые позволяют компьютерам создавать собственные принципы при поиске решений.
  • Глубокое обучение использует текущую информацию в обучающих алгоритмах для поиска подходящих закономерностей, которые необходимы для прогнозирования данных.
  • Обучение с подкреплением обычно делает прогнозы методом проб и ошибок.
  • Глубокое обучение применяет выученные шаблоны к новому набору данных, в то время как обучение с подкреплением извлекает выгоду из обратной связи.
  • Для глубокого обучения требуется уже существующий набор данных, в то время как обучение с подкреплением не требует текущего набора данных для обучения.
  • Применение глубокое обучение чаще используется в задачах распознавания и сокращения площади, в то время как обучение с подкреплением обычно связано с взаимодействием с окружающей средой с оптимальным контролем.
  • Глубокое обучение также известно как иерархическое обучение или глубоко структурированное обучение, в то время как обучение с подкреплением не имеет другого термина.
  • Глубокое обучение - один из многих методов машинного обучения, тогда как обучение с подкреплением - одна из трех основных парадигм машинного обучения.
  • Глубокое обучение было введено в 1986 году, а обучение с подкреплением было разработано в конце 1980-х годов.

Свежие мысли

Категория

Поход По Магазинам

Овощи И Фрукты

Физика

Мода И Красота

Математика И Статистика

Промышленное

Оборудование

Бизнес

Обработанные Пищевые Продукты

Бытовая Техника

Рекомендуем