Preference Tuning LLMs with Direct Preference Optimization Methods

Hugging Face Blog · 2024-01-18

Open source

Related items

AIHugging Face Blog2024-07-10

Preference Optimization for Vision Language Models

AIHugging Face Blog2022-10-12

Optimization story: Bloom inference

AIarXiv cs.LG2026-05-26

Probabilistic Smoothing with Ratio-Monotone Transforms for Global Optimization

Probabilistic smoothing is a standard tool for global optimization, but existing methods rely on Gaussian kernels and specific transforms, often resulting in strong hyperparameter sensitivity and limited robustness. We propose a general smoothing framework that combines flexible symmetric unimodal kernels with monot...

AIHugging Face Blog2025-03-28

🚀 Accelerating LLM Inference with TGI on Intel Gaudi

AIHugging Face Blog2023-11-07

Introducing Prodigy-HF: a direct integration with Hugging Face

AIHugging Face Blog2023-09-15