هوش مصنوعی در دوی 100 متر رقابت می کند!
در این ویدئو، 5 عامل هوش مصنوعی برای یادگیری نحوه دویدن 100 متر سریعترین رقابت را انجام می دهند. هوش مصنوعی با استفاده از Deep Reinforcement Learning، روشی از یادگیری ماشینی آموزش دیدند که شامل پاداش دادن به عامل برای انجام درست کاری و تنبیه او برای انجام هر کاری نادرست است. اقدامات هر عامل توسط یک شبکه عصبی کنترل می شود که پس از هر تلاش به روز می شود تا سعی شود در طول زمان پاداش های بیشتر و مجازات کمتری به ماموران داده شود. برای اطلاعات بیشتر در مورد نحوه آموزش هوش مصنوعی، نظر پین شده را بررسی کنید!
نظرات (۱)