Friendly Wiki

Home About Random Help Updates Contact

Login

Friendly Wiki

Home About Random Help Updates Contact

Login

Contents

direct preference optimization

REDIRECT Reinforcement learning from human feedback#Direct preference optimization

{{R to section}}

{{Redirect category shell|

{{R to section}}

}}

About Help Updates Contact Privacy Terms GitHub

© 2025 Friendly Wiki. All rights reserved.