機器學(xué)習(xí)是模式識別、機器視覺、數(shù)據(jù)挖掘等方向的支撐技術(shù)之一,被廣泛應(yīng)用到安防、醫(yī)療、大數(shù)據(jù)分析等領(lǐng)域?;跇颖镜莫毩⑼植技僭O(shè),監(jiān)督學(xué)習(xí)技術(shù)通過學(xué)習(xí)已標(biāo)記數(shù)據(jù)來訓(xùn)練模型。然而,在復(fù)雜交互場景下,當(dāng)處理動態(tài)、多源、弱標(biāo)記等非獨立同分布數(shù)據(jù)時,亟需研究新型機器學(xué)習(xí)技術(shù),以解決數(shù)據(jù)表示不魯棒、最優(yōu)解不穩(wěn)定、難以優(yōu)化等一系列難題,增強算法對復(fù)雜場景的適用性。
該項目在國家自然科學(xué)基金重點/面上項目、江蘇省自然科學(xué)基金重點項目、科技部國際科技合作與交流專項等支持下,項目第一完成人及其團(tuán)隊10余年努力,重點研究“面向復(fù)雜交互場景的新型機器學(xué)習(xí)技術(shù)”,形成以下成果:
面向隨機交互的在線優(yōu)化:
- 創(chuàng)新性地提出在線優(yōu)化機制,根據(jù)反饋自適應(yīng)環(huán)境的動態(tài)變化,實現(xiàn)大規(guī)模任務(wù)的交互決策。
- 首次提出基于遺傳算法的在線優(yōu)化方法,解決動態(tài)、自治網(wǎng)格中的任務(wù)調(diào)度問題。
- 在此基礎(chǔ)上,發(fā)展了基于核的在線選擇時間差分學(xué)習(xí)算法,顯著降低大規(guī)模場景在線決策的時間代價。
面向動態(tài)交互的多智能體強化學(xué)習(xí):
- 創(chuàng)新性地發(fā)展多智能體強化學(xué)習(xí)理論體系,針對并發(fā)決策場景,實現(xiàn)穩(wěn)定的多智能體協(xié)作和博弈均衡。
- 首次提出“學(xué)習(xí)-規(guī)劃”相結(jié)合的多智能體強化學(xué)習(xí)方法,有效解決多智能體協(xié)同問題。
- 進(jìn)一步提出基于分布式博弈求解的多智能體強化學(xué)習(xí)方法,解決了分布式系統(tǒng)非共享信息和博弈約簡等難題。
面向多源異構(gòu)數(shù)據(jù)的表示學(xué)習(xí):
- 創(chuàng)新性地提出聯(lián)合“樣本-特征-視圖”的多源異構(gòu)數(shù)據(jù)表示學(xué)習(xí)新框架,引入權(quán)重自適應(yīng)學(xué)習(xí)機制。
- 首次提出基于樣本選擇的多源耦合稀疏表示學(xué)習(xí)和聯(lián)合樣本與特征分析的多源特征選擇算法。
- 實現(xiàn)從不同粒度對多源異構(gòu)數(shù)據(jù)進(jìn)行聯(lián)合耦合分析,有效提取多源數(shù)據(jù)特征,增強特征的鑒別能力。
面向結(jié)構(gòu)約束的表示學(xué)習(xí):
- 創(chuàng)新性地將結(jié)構(gòu)約束限制下的非獨立同分布數(shù)據(jù)表示問題形式化地轉(zhuǎn)化為弱監(jiān)督環(huán)境下的機器學(xué)習(xí)問題(如直推式學(xué)習(xí)、多示例學(xué)習(xí)等)。
- 能夠有效地將全局標(biāo)記與局部觀察之間自動建立有效關(guān)聯(lián),解決了傳統(tǒng)方法存在的學(xué)習(xí)效率低,解釋性差等難題。
- 研究了基于空間約束的直推式特征選擇算法,并提出了基于多示例字典學(xué)習(xí)的特征表示算法。
項目共發(fā)表國外期刊和國際會議論文91篇,論文總被他引916次。在IEEE匯刊(如TPAMI,TNNLS等)上發(fā)表論文12篇,在人工智能、機器視覺和數(shù)據(jù)挖掘等領(lǐng)域重要國際會議AAAI、AAMAS、CVPR、ACM MM、ICDM上發(fā)表論文9篇,在計算機學(xué)報、軟件學(xué)報等國內(nèi)重要期刊上發(fā)表論文20篇。且得到了美國卡耐基梅隆大學(xué)Alexander Hauptmann教授、羅格斯州立大學(xué)人工智能實驗室主任Ahmed Elgammal教授(ICCV 2015領(lǐng)域主席)、國內(nèi)知名學(xué)者自動化所盧漢清研究員、浙江大學(xué)蔡登、何曉飛教授的引用。
項目成果獲IDEAL國際會議最佳論文獎、PAKDD國際會議最佳學(xué)生論文獎各1次。獲吳文俊人工智能科學(xué)技術(shù)獎自然科學(xué)二等獎1項、軍隊醫(yī)療成果二等獎和三等獎各1項。培養(yǎng)教育部新世紀(jì)優(yōu)秀人才1名、江蘇省333工程第二層次人才1名、中國科協(xié)青年人才托舉工程入選者1名。
項目獲授權(quán)專利4項,其中2項獲得轉(zhuǎn)讓。與江蘇省公安廳物證鑒定中心、解放軍八一醫(yī)院、江蘇萬維艾斯、方天電力、江蘇中博等多家單位合作,技術(shù)成果被廣泛應(yīng)用于智能監(jiān)控、醫(yī)學(xué)圖像分析、大數(shù)據(jù)分析等實際任務(wù)中,取得了良好的經(jīng)濟(jì)與社會效益。
機器學(xué)習(xí)是模式識別、機器視覺、數(shù)據(jù)挖掘等方向的支撐技術(shù)之一,被廣泛應(yīng)用到安防、醫(yī)療、大數(shù)據(jù)分析等領(lǐng)域?;跇颖镜莫毩⑼植技僭O(shè),監(jiān)督學(xué)習(xí)技術(shù)通過學(xué)習(xí)已標(biāo)記數(shù)據(jù)來訓(xùn)練模型。然而在復(fù)雜交互場景下,當(dāng)處理動態(tài)、多源、弱標(biāo)記等非獨立同分布數(shù)據(jù)時,亟需研究新型機器學(xué)習(xí)技術(shù),以解決數(shù)據(jù)表示不魯棒、最優(yōu)解不穩(wěn)定、難以優(yōu)化等一系列難題,增強算法對復(fù)雜場景的適用性。
該項目在國家自然科學(xué)基金重點/面上項目、江蘇省自然科學(xué)基金重點項目、科技部國際科技合作與交流專項等支持下,項目第一完成人及其團(tuán)隊10余年努力,重點研究“面向復(fù)雜交互場景的新型機器學(xué)習(xí)技術(shù)”,形成以下成果:
面向隨機交互的在線優(yōu)化:創(chuàng)新性地提出在線優(yōu)化機制,根據(jù)反饋自適應(yīng)環(huán)境的動態(tài)變化,實現(xiàn)大規(guī)模任務(wù)的交互決策。首次提出基于遺傳算法的在線優(yōu)化方法,解決動態(tài)、自治網(wǎng)格中的任務(wù)調(diào)度問題;并在此基礎(chǔ)上發(fā)展了基于核的在線選擇時間差分學(xué)習(xí)算法,顯著降低大規(guī)模場景在線決策的時間代價。
面向動態(tài)交互的多智能體強化學(xué)習(xí)“創(chuàng)新性地發(fā)展多智能體強化學(xué)習(xí)理論體系,針對并發(fā)決策場景,實現(xiàn)穩(wěn)定的多智能體協(xié)作和博弈均衡。首次提出“學(xué)習(xí)-規(guī)劃”相結(jié)合的多智能體強化學(xué)習(xí)方法,有效解決多智能體協(xié)同問題。在此基礎(chǔ)上,進(jìn)一步提出基于分布式博弈求解的多智能體強化學(xué)習(xí)方法,解決了分布式系統(tǒng)非共享信息和博弈約簡等難題。
面向多源異構(gòu)數(shù)據(jù)的表示學(xué)習(xí):創(chuàng)新性地提出聯(lián)合“樣本-特征-視圖”的多源異構(gòu)數(shù)據(jù)表示學(xué)習(xí)新框架,引入權(quán)重自適應(yīng)學(xué)習(xí)機制,首次提出基于樣本選擇的多源耦合稀疏表示學(xué)習(xí)和聯(lián)合樣本與特征分析的多源特征選擇算法。實現(xiàn)從不同粒度對多源異構(gòu)數(shù)據(jù)進(jìn)行聯(lián)合耦合分析,有效提取多源數(shù)據(jù)特征,增強特征的鑒別能力。
面向結(jié)構(gòu)約束的表示學(xué)習(xí):創(chuàng)新性地將結(jié)構(gòu)約束限制下的非獨立同分布數(shù)據(jù)表示問題形式化地轉(zhuǎn)化為弱監(jiān)督環(huán)境下的機器學(xué)習(xí)問題(如直推式學(xué)習(xí)、多示例學(xué)習(xí)等)。能夠有效地將全局標(biāo)記與局部觀察之間自動建立有效關(guān)聯(lián),解決了傳統(tǒng)方法存在的學(xué)習(xí)效率低,解釋性差等難題:研究了基于空間約束的直推式特征選擇算法、并且提出了基于多示例字典學(xué)習(xí)的特征表示算法。
項目共發(fā)表國外期刊和國際會議論文91篇,論文總被他引916次。在IEEE匯刊(如TPAMI,TNNLS等)上發(fā)表論文12篇,在人工智能、機器視覺和數(shù)據(jù)挖掘等領(lǐng)域重要國際會議AAAI、AAMAS、CVPR、ACM MM、ICDM上發(fā)表論文9篇,在計算機學(xué)報、軟件學(xué)報等國內(nèi)重要期刊上發(fā)表論文20篇。且得到了美國卡耐基梅隆大學(xué)Alexander Hauptmann教授、羅格斯州立大學(xué)人工智能實驗室主任Ahmed Elgammal教授(ICCV 2015領(lǐng)域主席)、國內(nèi)知名學(xué)者自動化所盧漢清研究員、浙江大學(xué)蔡登、何曉飛教授的引用。
項目成果獲IDEAL國際會議最佳論文獎、PAKDD國際會議最佳學(xué)生論文獎各1次。獲吳文俊人工智能科學(xué)技術(shù)獎自然科學(xué)二等獎1項、軍隊醫(yī)療成果二等獎和三等獎各1項。培養(yǎng)教育部新世紀(jì)優(yōu)秀人才1名、江蘇省333工程第二層次人才1名、中國科協(xié)青年人才托舉工程入選者1名。
項目獲授權(quán)專利4項,其中2項獲得轉(zhuǎn)讓。與江蘇省公安廳物證鑒定中心、解放軍八一醫(yī)院、江蘇萬維艾斯、方天電力、江蘇中博等多家單位合作,技術(shù)成果被廣泛應(yīng)用于智能監(jiān)控、醫(yī)學(xué)圖像分析、大數(shù)據(jù)分析等實際任務(wù)中,取得了良好的經(jīng)濟(jì)與社會效益。