臺(tái)灣中山大學(xué)黃國(guó)勝教授關(guān)于強(qiáng)化學(xué)習(xí)的講座通知
報(bào)告人: 黃國(guó)勝 教授(IET Fellow)
邀請(qǐng)人: 崔榮鑫
時(shí)間: 2017年11月4日,下午2:30
地點(diǎn): 航海學(xué)院東配樓
主題: 強(qiáng)化學(xué)習(xí)概述及其應(yīng)用范例
內(nèi)容簡(jiǎn)介:
強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)中的一個(gè)領(lǐng)域,強(qiáng)調(diào)如何基于環(huán)境而行動(dòng),以取得最大化的預(yù)期利益。其靈感來(lái)源于心理學(xué)中的行為主義理論,即有機(jī)體如何在環(huán)境給予的獎(jiǎng)勵(lì)或懲罰的刺激下,逐步形成對(duì)刺激的預(yù)期,產(chǎn)生能獲得最大利益的習(xí)慣性行為。這個(gè)方法具有普適性,因此在其他許多領(lǐng)域都有研究,例如博弈論、控制論、運(yùn)籌學(xué)、信息論、仿真優(yōu)化、多主體系統(tǒng)學(xué)習(xí)、群體智能、統(tǒng)計(jì)學(xué)以及遺傳算法。強(qiáng)化學(xué)習(xí)和標(biāo)準(zhǔn)的監(jiān)督式學(xué)習(xí)之間的區(qū)別在于,它并不需要出現(xiàn)正確的輸入/輸出對(duì),也不需要精確校正次優(yōu)化的行為。強(qiáng)化學(xué)習(xí)更加專(zhuān)注于在線(xiàn)規(guī)劃,需要在探索(在未知的領(lǐng)域)和遵從(現(xiàn)有知識(shí))之間找到平衡。本次報(bào)告將簡(jiǎn)介強(qiáng)化學(xué)習(xí)的基本概念以及其在報(bào)告人的研究團(tuán)隊(duì)所應(yīng)用范例。希望在聽(tīng)講后能對(duì)強(qiáng)化學(xué)習(xí)有初步理論概念,激發(fā)在此研究興趣。
報(bào)告人簡(jiǎn)介:
黃國(guó)勝教授1993年獲美國(guó)西北大學(xué)計(jì)算機(jī)工程博士學(xué)位,現(xiàn)任職于臺(tái)灣中山大學(xué)電機(jī)系。這十幾年擔(dān)任過(guò)中正大學(xué)電算中心組長(zhǎng)、代主任、電機(jī)系系主任、光機(jī)電整合研究所所長(zhǎng)、自動(dòng)化學(xué)門(mén)復(fù)審委員、大學(xué)院校工程教育認(rèn)證中心認(rèn)證委員、IEEE機(jī)器人及自動(dòng)化臺(tái)北分會(huì)主席,臺(tái)灣系統(tǒng)學(xué)會(huì)理事、臺(tái)灣機(jī)器人學(xué)會(huì)理事、臺(tái)灣自動(dòng)控制學(xué)會(huì)理事等職務(wù)。目前其研究興趣主要在于多機(jī)器人合作的研究議題及智能嵌入式系統(tǒng)的開(kāi)發(fā)應(yīng)用議題。由于其學(xué)術(shù)表現(xiàn)受到國(guó)際人士的認(rèn)同,因此成為IET Fellow,并擔(dān)任IEEE Transactions on Cybernetics以及IEEE/ASME Transactions on Mechatronics的編委。