Агентни системи | Agent Systems
Минало събитие
Ще получите базисни познания в областта на агентните системи и подсиленото самообучение (Reinforcement Learning). Ще научите какво е "агент", какво е рационално мислене и как да постигате оптималност при избора на действията. Ще се потопите в дебрите на подсиленото самоубочение и ще придобиете основни познания относно процеса за решенията на Марков (Markov decision process) и уравненията на Белман.
Семинарът ще завърши с реализирането на практически проект. Ще имате възможност индивидуално или в група от двама. трима или четирима човека да имплементирате алгоритъм, който да се самообучи да играе Морски шах. Алгоритъмът, изправен срещу естествен противник - човек, трябва винаги да побеждава или да води играта до реми.
Изискванията към желаещите да участват в този курс са: основни познания по програмиране и аналитични умения. Няма допълнителни изисквания към езика за програмиране, стига той да е от високо ниво.
Вижте видео от семинара "Агентни системи"
Какво представляват агентните системи?
Агентните системи са автономни единици, които следят околната среда чрез сензори и реагират по начин, по който могат да постигнат предварително зададени цели. Агентните системи могат да се самообучават, което определя и широката им употреба в практиката:
-
Управление на процеси, SCADA;
-
Роботика;
-
Автономни автомобили;
-
GoogleAdSense - за определяне на кого да се показват рекламите и колко да струва една реклама;
-
E-bay агенти - агенти, които наддават вместо вас, Sniper bid- наддаване в последният момент;
-
Сензорни мрежи;
-
За охрана и военни цели;
-
Автономно управление на сфетофарна система в един град - система, която сама решава колко дълъг да е всеки сигнал, в зависимост от натовареността на трафика.
Семинар за "Агентни системи" - програма
Час | Лекция |
09:40 – 10:00 | Настаняване |
10:00 – 10:45 | Въведение в Изкувствения интелект. Какво е агент? Какво е агента система? |
10:45 – 11:00 | Почивка |
11:00 – 11:45 | Кратка история и възникване на едноагентните системи. Динамично програмиране. Монте-карло алгоритми. Уравнения на темпоралните разлики. |
11:45 – 12:00 | Почивка
|
12:00 – 12:45 | Рационални агенти. Състояния на средата. Видимост. Свойството на Марков. Цели. Функции на прехода и Награди. |
12:45 – 13:00 | Почивка
|
13:00 – 13:45 | Самообучение. Q-самообучение. Уравнения на Белман. ( уравнението на Белман е основна част от Q-самообучението ) |
13:45 – 15:00 | Обяд |
15:00 – 19:00 | Задаване на проекта. Имплементация. |
Лектор
-
Стефан Ставрев
Собственик и управител на TRI Soft Ltd.
С над 3 години опит в проектирането и разработването на интелигентни системи и игри, и трудов стаж в научната компания TNO - основен партньор на Холандското министерство на отбраната. Понастоящем Стефан Ставрев се занимава с разработката на иновативни автономни системи, компютърно зрение, разпознаване на лица и разработване на игри. Изкувственият интелект и модерните технологии за него са не просто академични дисциплини, а и начин на мислене. В свободното си време обича да преподава. Води избираеми курсове в Пловдивския университет "Паисий Хилендарски".
Facebook LinkedIn Blog E-mail