老师批的作业,我让AI做成了错题集

孩子在备考 FCE(剑桥英语B2),每周老师批完作业,密密麻麻的红笔,加上孩子本来就歪歪扭扭的文字,肉眼难以识别。而且批改的内容孩子翻翻就搁一边了,真正能内化的没多少。

于是我想试试把每次批改让 AI 帮我整理成结构化的错题集,挂到网上,随时能查。

结果出来了:leonfce.hawken.im


流程是这样的

整个事情分三步,我基本没手动干预。

第一步:微信存图

老师在微信上发来批改图,我全部扔进一个文件夹。不需要命名,不需要整理,就是一堆 xxxx.jpg

第二步:OCR 读图

用 OCR 模型把图片里的文字认出来——不光是学生原文,还有老师的批注、改正、旁边写的评语,全提取出来。

这一步以前很难做好,批改里有大量手写字,还有删改符号、箭头、圈圈,普通 OCR 基本废了。但是好在老师的红字是键盘敲在图片上的。我给的提示词里还宽容的指出:“即便识别不出来也没关系,因为后面的推理模型可以补全。“

第三步:推理模型做解析

拿到 OCR 结果之后,交给推理模型做第二轮处理:

  1. 识别错误类型——是时态错了、主谓不一致、搭配不对、还是逻辑问题?
  2. 生成示范句——把错误的那句话改对,作为标准示例
  3. 再造一个同类句——用同样的语法点或搭配,造一个全新的句子,供孩子对照练习

这样每一个错误,孩子手里就有三样东西:原来错的、改对的、另一个例子。
效果比我预期好很多,因为所谓的 LLM 不就是大语言模型吗,最原始的功能就是补全语言。


出来的效果

leonfce.hawken.im 这次处理了 42 页批改,老师的 FCE 写作课内容。

错误被按类型归类:主谓一致、时态、词形变化、介词搭配、写作结构……每一条都有出处(对应第几张图),方便孩子回头翻原图核对。
最后还有一张汇总表,按错误类型统计,一眼能看出哪块是高频弱点。

然后再让推理模型自己做一个总结,下次我又来图了可以复用整个过程。


为什么这个对孩子有用

普通的错题本,孩子自己整理,费时费力,还容易漏,而且整理完也就抄了一遍,没有深度加工。

这个流程做出来的东西不一样:

  • 结构化:不是一页页翻图,是按类型检索
  • 有例句:不只是”你这里错了”,而是”对的该是这样,再看另一个同类的”
  • 可复习:网页随时打开,不用找本子

当然,AI 不能替代孩子自己思考。但它能做的那部分——把散乱的批改变成有组织的材料——确实帮我省了大量时间,而且做得比我手工整理好。


技术上的流程整理

整个流程用 VSCode + Cline 跑的,本地执行。大概步骤:

  1. 读取文件夹里所有图片
  2. 逐张调 OCR 模型(支持手写识别的多模态模型),输出批改内容
  3. 把 OCR 结果喂给推理模型,按固定 prompt 输出错题结构(错误类型 / 示范句 / 造句)
  4. 聚合成 HTML,推上服务器

下次处理新的一批作业,把图片扔进去,重跑一遍,新内容自动合并进去。


如果你家孩子也在备考英语,或者有类似整理学习材料的需求,这个思路可以直接套用,但是我估计英语和语文要好办一些,数学错题、物理错题能不能被识别的很好还不好说。因为我是先识别成文字再进行推理。跟手机某些 App 的直接分析画面可能还有点距离。