Coding-Tutor 基于大语言模型的编程辅导研究,通过知识追踪与逐步验证的工作流程,解决编程辅导场景中用户背景知识差异带来的教学适配问题。该方法不仅适用于编程辅导,也可扩展至其他需要个性化教学的任务场景。
项目开发了DICT评估协议,结合模拟学生与编程测试双重机制。该协议支持自动化评估流程,为教学代理的迭代开发提供系统化验证框架。实验数据显示,不同水平的模拟学生在完成相同编程任务时展现出显著的能力差异。
1、推理扩展性:Traver工作流配合验证模块,在编程辅导场景中展现出可扩展的推理能力
2、数据开放性:项目公开了训练验证器的检查点、评估脚本及完整实验数据
3、成本优势:DICT协议相比人工评估具有更好的扩展性和经济性
【学术引用】 @article{wang2025training, title={Training Turn-by-Turn Verifiers for Dialogue Tutoring Agents: The Curious Case of LLMs as Your Coding Tutors}, author={Wang, Jian and Dai, Yinpei and Zhang, Yichi and Ma, Ziqiao and Li, Wenjie and Chai, Joyce}, journal={arXiv preprint arXiv:2502.13311}, year={2025} }
【资源获取】
训练/评估脚本:scripts/eval/
实验数据:output目录
验证器模型:已发布检查点