| 專利名稱 | 一種提高多智能體系統(tǒng)合作水平的多跳學(xué)習(xí)方法 | ||
|---|---|---|---|
| 專利狀態(tài) | - | 專利號(申請?zhí)枺?/th> | CN111294242A |
| 專利申請日期 | 2020-02-16 | 專利類型 | 發(fā)明專利 |
| 申請公布號 | 2020100947204 | 申請公布日 | 2020-02-16 |
| 授權(quán)公告號 | - | 授權(quán)公告日 | - |
| 發(fā)明人 | 王濤;韓樂;關(guān)潤宇;熊偉明;周達(dá);秦宇;王卓婭;金鑫 | ||
| 專利權(quán)人 | 湖南大學(xué) | ||
| 專利摘要 | 一種提高多智能體系統(tǒng)合作水平的多跳學(xué)習(xí)方法,屬于人工智能和計算機網(wǎng)絡(luò)領(lǐng)域?;诰W(wǎng)絡(luò)演化博弈理論,通過增強智能體學(xué)習(xí)范圍來促進智能體采用合作策略,提高系統(tǒng)的整體收益。首先將智能體關(guān)鍵的,重復(fù)的交互活動建模到獵鹿博弈或囚徒博弈,智能體采用合作或者背叛策略,并將智能體系統(tǒng)部署到網(wǎng)格網(wǎng)絡(luò);然后智能體之間進行博弈,累計各自的收益;接著智能體根據(jù)無條件學(xué)習(xí)方法或復(fù)制子動態(tài)方法學(xué)習(xí)多跳范圍(2~5跳)的鄰居,調(diào)整自己的策略,并重新開始博弈。該方法對建模在獵鹿博弈下的系統(tǒng)合作率最高比經(jīng)典方法提升數(shù)十倍,可以應(yīng)用于P2P網(wǎng)絡(luò),無線傳感器網(wǎng)絡(luò)等群體智能領(lǐng)域。 | ||
