Microsoft ogłosił Phi-4-reasoning. Model ma zapewniać wysoką wydajność w złożonych zadaniach

Phi-4-reasoning to 14-B-parametrowy model “małego rozumowania”. Microsoft wytrenował go poprzez nadzorowane dostrajanie Phi-4 na wyselekcjonowanym zestawie nauczalnych monitów generowanych za pomocą o3-mini. Microsoft wprowadził również Phi-4-reasoning-plus, 14-B-parametrowy wariant Phi-4-reasoning, który zapewnia jeszcze lepszą wydajność poprzez generowanie dłuższych śladów rozumowania. Według Microsoftu, te nowe modele Phi-4-reasoning przewyższają kilka większych modeli open-weight, takich jak DeepSeek-R1-Distill-Llama-70B, a nawet […]

Maj 1, 2025 - 16:10
 0
Microsoft ogłosił Phi-4-reasoning. Model ma zapewniać wysoką wydajność w złożonych zadaniach

Phi-4-reasoning to 14-B-parametrowy model “małego rozumowania”. Microsoft wytrenował go poprzez nadzorowane dostrajanie Phi-4 na wyselekcjonowanym zestawie nauczalnych monitów generowanych za pomocą o3-mini. Microsoft wprowadził również Phi-4-reasoning-plus, 14-B-parametrowy wariant Phi-4-reasoning, który zapewnia jeszcze lepszą wydajność poprzez generowanie dłuższych śladów rozumowania. Według Microsoftu, te nowe modele Phi-4-reasoning przewyższają kilka większych modeli open-weight, takich jak DeepSeek-R1-Distill-Llama-70B, a nawet […]