- 相關推薦
計算機仿真機器人世界杯足球錦標賽攻防戰(zhàn)術的研究
【摘要】隨著計算機技術的發(fā)展, 分布式人工智能中多智能體系統(tǒng)(MAS Multi-agent System)的理論及應用研究已經成為人工智能研究的熱點,RoboCup(Robot World Cup),即機器人世界杯足球錦標賽,是一個在異步,有噪聲的對抗環(huán)境下,研究多智能體的決策和合作的問題。本文詳細介紹了計算機仿真足球機器人競賽中進攻和防守的設計與實現。
【關鍵詞】進攻;組織性;準確;快速;防守;靈活性
RoboCup(Robot World Cup),即機器人世界杯足球錦標賽。它是國際上一項為提高相關領域的教育和研究水平而舉行的大型比賽和學術活動,通過提供一個標準任務來促進分布式人工智能、智能機器人技術、及其相關領域的研究與發(fā)展。訓練和制造機器人進行足球賽,是當前人工智能和機器人領域的研究熱點之一。在比賽中,當確定了球隊的陣型后,每個隊員分配了相應的角色,開始討論球隊的整體和局部攻防戰(zhàn)術。
全隊進攻戰(zhàn)術
全隊進攻戰(zhàn)術是指比賽中一方獲得球后,通過隊員之間的傳遞配合達到射門的目的而采用的配合方法。與局部進攻戰(zhàn)術相比較,全隊進攻戰(zhàn)術的進攻面比較廣,參加進攻和快速反擊等。主要有邊路進攻,中路進攻,快速反擊等。
1、邊路進攻:利用球場兩側地區(qū)發(fā)起進攻的方法叫做邊路進攻。邊路進攻是全隊進攻戰(zhàn)術的主要形式之一,其主要特點是有利于發(fā)揮進攻速度,打破對方防線制造缺口。
2、中路進攻:中路進攻是利用球場中間區(qū)域組織的進攻,這種進攻雖然能直接射門,但難度最大,因為中路防守最為嚴密,突前的攻擊手必須是反應極其敏銳,意識強而且技術高,敢于冒險,速度快和善于路位策應的隊員。
3、快速反擊:比賽中當攻方進攻時,后衛(wèi)線往往壓至中場附近,防守人數也由于插上進攻和助攻而相對減少,此時抓住對方防區(qū)空隙比較大和回防較慢的機會,趁其失球發(fā)動快速反擊,往往能取得良好的效果,快速反擊是最有威脅的進攻手段,有效發(fā)動快速反擊。能有效得分,但其有一定的冒險性。所以要掌握準確快速的原則。配合要有組織性,要非常有默契,需要多次練習。否則很難在比賽中實施。
全隊防守戰(zhàn)術
防守戰(zhàn)術可分為兩種基本類型:盯人緊逼防守(人盯人防守),即在規(guī)定的范圍內盯人緊逼,不交換看守:區(qū)域緊逼防守(盯人和區(qū)域相結合),即現今流行的綜合防守,緊逼和保護相結合,在個人的防區(qū)內緊逼,作交替看守。盯人防守即各自都有明確的防守對象。防守最根本的原則是緊逼和保護。只有緊逼才能有效地主動斷搶,壓制對方技術的優(yōu)勢而獲得主動權:保護是為了更好地緊逼和控制空檔,為贏得比賽準備時機。防守可以被解釋成一個布置的事件。在清華設計地隊伍中它是使用一個類型,基于情況的策略布置理論。布置最重要的一點是在基本的編隊中,哪個確定一個隊員的位置通過標準的角色分配,球的位置和球的控制狀態(tài)。在這個防守問題上,基本的信息提供作為一個標準,命名的,一個相同的角色,因為角色分配和任務評價。另外一個重要的事實是在防守的位置靈活性,這個測量多么危險,如果一個對手站在給定的位置。防守位置靈活性因為任意的點在球場上的是先前已經知道在所有的隊友中間。
四種類型的防守動作:
1、lock(妨礙):交叉一個對手的占有這個球在我們球門的外圍,阻止他向前推進。
2、Press(壓力):跑,在一個對手占有這個球,并且在我們球門的附近,保持對他有威脅
3、Mark(盯人):盯住一個沒有球的對手,因此他的隊友不可以傳球給他
4、Point Defend(位置防御):站在基本的信息位置,這個將有好處,當一個附近的隊友在1vs1中失敗了,或者當這個隊重新奪回了球的控制權。
為了簡化這個問題,我們設置一個規(guī)則,一個防守隊員不可以防守兩個對手在相同的時間里面,還有兩個防守隊友不應該防守相同的對手。這個互斥的操作被提供在相同的這些情況下。這個沖突的操作沒有在這里使用。那里有一個二中擇一,就是block和press被設置成沖突,替代了互斥,提供一個不同的防守策略。因此另外一個也是可以的,我們不再進一步深入討論。在分解一個防守任務到防守每個進攻的對象,和站在基本的信息點,安排被產生通過鏈接每個防守隊員到每個子任務。那時候,這個程序到達一個評價個體的效用。
我們定義了一個評價函數為了每種類型的動作。這些變量被用來每個評價函數的輸入:劇烈,測量時間間隔從隊員的當前位置到防守位置,背離,測量距離從防守的點到隊員的基本的編隊位置,威脅,也就是這個防守位置靈活性對手當前的位置。這個函數輸出增加隨著威脅和減小隨著距離和背離。為了點防守,只有威脅作為輸入。為了獲得每個函數的實際的值,我們設置一些典型的情景,從他們之間摘錄輸入值,然后賦予輸出值到這個函數。這個值被小心的裝入來保持輕微的變化。在這個方式下,一個輸入和輸出的列表數據就生成了。
在清華設計中,他們使用BP網絡神經去編碼評價函數。這個列表產生被使用作為訓練網絡神經的設置。在訓練之后,網絡被測試去確保他們適合在先前的段中要求的,因此評價函數就確定了,但我們隊伍還在改進中。剩下的計劃到一個標準的程序現在上面和沒有需要更進一步的討論。還留下一個補救計劃的產生。有時候這個隊維持一致失敗了。例如,當一個對手和兩個防守隊員的位置的距離相同,而且在相同的時間里面。編隊的點。這兩個安排將有相似的評價,這兩個防守隊員可能沖突。我們的設計利用這個絕對的反饋存在這個系統(tǒng)中。因為球將保持移動在這個比賽中,和對手必須向前移動去進攻,另外這個基本的信息位置或者防守的點將改變在下個周期。那里有一個小小的改變使得這兩個安排仍然保持相同的評價。一旦這兩個安排不同的時候足夠明顯為兩個防守隊員去分辨出來。這個預先防守隊員將執(zhí)行這個防守動作,更接近的移動到對手。然后另外一個將移動到另外一個方向。因此,這個對照增加,這個系統(tǒng)提取一個狀態(tài)分離來自先前的進退兩難的局面。因此又可以完成一致了。
防守算法的實現
1、防守算法的初始想法
第一步:找球的位置,即時更新
第二步:判斷球是否在可踢范圍:
如果可踢,則根據自己所在的位置作出相應的動作,具體是:
如果再罰球去內,馬上把球踢出去,且盡量傳給隊友;如果再罰球區(qū)外,可以適當的帶球,把球送
【計算機仿真機器人世界杯足球錦標賽攻防戰(zhàn)術的研究】相關文章:
盤算機仿真機器人世界杯足球錦標賽攻防戰(zhàn)術的鉆研03-23
汽車領域計算機仿真技術研究03-28
化工中計算機仿真技術研究03-28
6R機器人基于三維圖形的運動仿真研究03-07
船舶遠程操縱仿真系統(tǒng)的研究03-07
跳頻通信系統(tǒng)的仿真研究12-05
分集合并的性能研究與仿真03-07