強化學(xué)習,又稱(chēng)為再勵學(xué)習,其原理是動(dòng)物學(xué)習了某種行為得到獎勵導致出現該行為的趨勢加強。之前的研究表明,當動(dòng)物獲得意想不到的獎勵時(shí),多巴胺神經(jīng)元興奮性增強。因此,研究人員認為這些多巴胺信號在強化學(xué)習方面發(fā)揮著(zhù)重要的作用。
你有否想過(guò),人為什么會(huì )有思想,會(huì )有感覺(jué),會(huì )對一些事物熱烈追求,這可能都只不過(guò)是來(lái)自我們大腦內一些微小物質(zhì)的化學(xué)作用而已。麻省理工學(xué)院的一項新研究 表明,神經(jīng)遞質(zhì)多巴胺就發(fā)揮著(zhù)這樣的作用,它是一種代表獲得獎勵的信號。從另外一個(gè)角度來(lái)說(shuō),也許正在因為多巴胺水平過(guò)低,缺乏動(dòng)力,帕金森病人才難以完 成大腦的指令。
在現實(shí)生活中,并不是所有的獎勵都能立即兌現:為了生存,自然界的動(dòng)物必須有一個(gè)長(cháng)遠的目標,保持積極性,花費大量的時(shí)間和精力才可能尋找到食物。人也如此,要想到達一個(gè)目的地,必須要有堅持的動(dòng)力。
麻省理工學(xué)院麥戈文腦科學(xué)研究所(McGovern Institute for Brain Research)研究員 Ann Graybiel 教授領(lǐng)導的研究小組決定研究強化學(xué)習是如何影響多巴胺水平變化的。每次實(shí)驗時(shí),研究人員將老鼠置于水迷宮中,并播放一個(gè)指示其在路口左轉或者右轉的提示音,當老鼠到達目的地時(shí)給予巧克力牛奶作為獎勵。為了測定大腦釋放多巴胺的量,而不只是簡(jiǎn)單測定多巴胺神經(jīng)元的活性,麻省理工和華盛頓大學(xué)的研究人員將微型碳纖維電極植入小鼠體內,利用快速掃描循環(huán)伏安法(FSCV)進(jìn)行對多巴胺含量的持續性測定。FSCV 法測定老鼠經(jīng)過(guò)四個(gè)不同地點(diǎn)時(shí),大腦中多巴胺的水平。每一個(gè)探針測定腦組織內一個(gè)微小體積內的胞外多巴胺濃度,其可能反應數以千計的神經(jīng)末梢的活性。"
研究人員驚奇地發(fā)現,當接近目的地時(shí),老鼠體內的多巴胺水平平穩上升,這似乎在表明,它在期待著(zhù)獎勵。當越接近目標,多巴胺的含量越多。并且,多巴胺的水平高低與預期獎勵的豐厚程度成正比。當對老鼠進(jìn)行訓練后,期待較多巧克力牛奶的老鼠,其多巴胺水平上升得更快。而在一些T型迷宮實(shí)驗中,動(dòng)物需要多費一些周折才能到達目的地獲得獎勵。相應地,其多巴胺的水平是呈斜坡?tīng)钪饾u增加的。
Ann Graybiel 教授表示,正是由于帕金森病人的多巴胺水平過(guò)低,不能因大腦指令形成增加趨勢,導致患者精神萎靡。 "這意味著(zhù),多巴胺的水平可以幫助動(dòng)物在選擇途徑接近目標上做出選擇,并且估計起點(diǎn)到終點(diǎn)的距離。"Salk 研究所計算神經(jīng)科學(xué)家 Terrence Sejnowsk 說(shuō)。
意見(jiàn)反饋 關(guān)于我們 隱私保護 版權聲明 友情鏈接 聯(lián)系我們
Copyright 2002-2025 Iiyi.Com All Rights Reserved