Yuki Kadokawa, Lingwei Zhu, Yoshihisa Tsurumine, Takamitsu Matsubara (2022), “Cyclic Policy Distillation: Sample-Efficient Sim-to-Real Reinforcement Learning with Domain Randomization”, Robotics and Autonomous Systems., April, 2023. Vol. 165, pp. 1-30.