學(xué)科要求:
計(jì)算機(jī)科學(xué)、人工智能、機(jī)器學(xué)習(xí)等專業(yè)。深入理解強(qiáng)化學(xué)習(xí)理論,在處理獎(jiǎng)勵(lì)稀疏問題上有創(chuàng)新性研究成果,熟悉多種深度強(qiáng)化學(xué)習(xí)算法架構(gòu)。具備將仿真環(huán)境策略遷移至現(xiàn)實(shí)場(chǎng)景的實(shí)戰(zhàn)經(jīng)驗(yàn),能夠搭建高效訓(xùn)練框架,提升機(jī)器人訓(xùn)練效率與適應(yīng)性。
崗位職責(zé):
1、負(fù)責(zé)搭建機(jī)器人強(qiáng)化學(xué)習(xí)仿真訓(xùn)練平臺(tái),開發(fā)基于學(xué)習(xí)的雙足人形機(jī)器人控制策略,并與傳統(tǒng)控制方案互補(bǔ),提升機(jī)器人整體控制效果;
2、負(fù)責(zé)算法策略的訓(xùn)練和移植部署,實(shí)現(xiàn)算法sim2real在機(jī)器人物理樣機(jī)上的落地應(yīng)用;
3、持續(xù)跟蹤和實(shí)踐相關(guān)領(lǐng)域的國(guó)內(nèi)外前沿研究成果。
崗位要求:
1、擁有人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等相關(guān)領(lǐng)域的博士,有機(jī)器人深度強(qiáng)化學(xué)習(xí)研究的項(xiàng)目經(jīng)歷;
2、具有強(qiáng)化學(xué)習(xí)相關(guān)項(xiàng)目或研究經(jīng)驗(yàn),熟悉常用的機(jī)器人仿真平臺(tái),如: Mujoco, Pybullet, Gazebo等,了解常用的深度強(qiáng)化學(xué)習(xí)算法(PPO、SAC、DQN、DDPG、A3C)熟悉linux/ROS操作系統(tǒng);
3、熟練使用TensorFlow、Pytorch等深度學(xué)習(xí)框架,熟悉各類強(qiáng)化學(xué)習(xí)算法和開源庫(kù);
4、 具備優(yōu)秀的編程能力申請(qǐng)者優(yōu)先,熟悉常見開發(fā)規(guī)范,熟悉git等開發(fā)工具;
5、富有創(chuàng)造力和探索精神,能夠在快速變化的環(huán)境中主動(dòng)學(xué)習(xí)和適應(yīng)新技術(shù);
6、具有良好的團(tuán)隊(duì)合作意識(shí),具有較強(qiáng)的溝通表達(dá)能力, 工作積極進(jìn)取主動(dòng)、細(xì)致、責(zé)任心強(qiáng),有鉆研精神。