Assignment Model Algorithm

14 小时

2026开年新风向：上下文即Teacher，三文详解Self-Distillation新范式

这三项工作打破了传统知识蒸馏必须依赖更强外部 Teacher（如 GPT-4）的定式，共同指向了一种 On-Policy Self-Distillation的新范式：在数学推理任务中，SFT 存在训练与推理分布偏移的问题。OPSD (On-Policy Self-Distillation) 关注如何利用训练数据中隐含的特权信息——即 Ground Truth 答案。

6 小时

University of Cincinnati gets $1.1M grant for AI physician training

The College of Medicine will use smart glasses and smartphone apps to give medical students real-time feedback on clinical ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

2026开年新风向：上下文即Teacher，三文详解Self-Distillation新范式

University of Cincinnati gets $1.1M grant for AI physician training

今日热点