Update README.md
Browse files
README.md
CHANGED
|
@@ -192,7 +192,7 @@ out_of_domain - вопросы которые специально никак н
|
|
| 192 |
|
| 193 |
Реализацию SMPO, rejection sampling и другое можно найти в нашей библиотеке [effective_llm_alignment](https://github.com/VikhrModels/effective_llm_alignment/) на GitHub
|
| 194 |
|
| 195 |
-
Идея использования именно SMPO, а не другого PO метода, возникла в результате проведения большого количества экспериментов с классическими методами, при необходимости лучшего контроля процесса сходимости. При
|
| 196 |
|
| 197 |
### Как работать с RAG
|
| 198 |
|
|
|
|
| 192 |
|
| 193 |
Реализацию SMPO, rejection sampling и другое можно найти в нашей библиотеке [effective_llm_alignment](https://github.com/VikhrModels/effective_llm_alignment/) на GitHub
|
| 194 |
|
| 195 |
+
Идея использования именно SMPO, а не другого PO метода, возникла в результате проведения большого количества экспериментов с классическими методами, при необходимости лучшего контроля процесса сходимости. При тщательной настройке других методов (например SimPO), можно добится похожего результата, однако мы постарались стаблизировать этот процесс и объединить лучшие практики из других методов.
|
| 196 |
|
| 197 |
### Как работать с RAG
|
| 198 |
|