← 返回文章列表
李奕锦的个人网站所属专题:AI 协同与人机进化

AI赋能刷题:从 AI 眼睛到职场 API,这些"为什么"比答案更值钱

更新于 2026-01-18年份:2026字数:3,600阅读时长:10 分钟

连刷 9 道题后的人机协同复盘:用 AI 把“对答案”升级成“追问为什么”——标框与闭区域、清洗与变换、可视化负荷、V 模型与原型、劳动法逻辑,在更短时间里吃透第一性原理,少背、多想、记得牢。

刚连刷了 9 道题,从数据标注到软件测试,从法律法规到可视化分析,跨度像一场“全栈工程师”微缩洗礼。很多人考证刷题会陷进“背答案”:A 对 B 错,背完拉倒——效率高在表面,质量低在根上,过几天遇到变体题照样懵。

这次我换了一种打法:题目仍是自己做,AI 当复盘教练。对完答案后,我不急着记结论,而是把错题、犹豫项和“我为什么会这么想”丢给 AI,让它帮我找认知错位、补类比、串成一条线。同样一个晚上,过去可能只“记住”几道题,现在能把几道题背后的第一性原理压进脑子里——这才是 AI 赋能刷题该有的样子:省的是从糊涂到清醒的时间,不是省掉思考本身

技术人更该关心的是“为什么”——这些题背后,藏的是计算机科学里最朴素的原理。下面不堆考点,把几道题揉碎了复盘;你也会看到,人机分工里人该盯什么、AI 该放大什么。

---

AI 的眼睛

AI 的眼睛:关于“界限”的艺术

(涉及:标框标注、区域标注)

题里在聊“为什么标框要找最边缘像素点”和“什么是闭区域”。听着像美术课,本质是在定义 Ground Truth(真值)。在 CV 里,模型很笨:你告诉它“这是宝宝”,它不知道“宝宝”是那个肉嘟嘟的人,还是连旁边奶瓶也算上。

和 AI 复盘时的高效问法:不只问“正确答案是什么”,而是问“若标框多包一行背景像素,训练损失/特征会怎么偏?”——逼自己走到边界,比背一句“要贴边”记得牢。

标框(Bounding Box)的本质:是在做降维。世界很复杂,用矩形 (x, y, w, h) 把物体概括出来,计算量指数级下降。为什么要找“最边缘像素点”?因为矩形的定义就是由极值决定的。少一像素,模型学到的特征可能残缺;多一像素,模型就把背景噪音当特征。

闭区域(Polygon)的本质:是拓扑在工程里的应用。为什么“线”不能算“区域”?因为在数学和图形学里,只有首尾相连的闭合路径才能算面积、才能判断点在内还是外。就像给娃画的安全区:围栏没关口(不闭合),这个“安全区”在逻辑上就不存在(Null)。

技术启示

:做任何数据输入时,边界条件(Boundary Conditions) 永远是第一优先级。无论是标注图片还是写 if (x > 0),搞清楚边界,就搞定了大部分 Bug。

---

数据的烹饪学

数据的烹饪学:从生鲜到佳肴

(涉及:数据变换、数据分析深度)

题里区分了“数据清洗”和“数据变换”,还把数据分析分成“描述、预测、规则”。这就是一条完整的数据流水线(Data Pipeline)。这类题最容易混概念——让 AI 用一道小数据集举例:哪些行算清洗、哪些操作算变换,一眼就能对齐考纲里的用词,比干啃定义快得多。

预处理的本质:熵减

  • 清洗(Cleaning):做减法,把脏数据(空值、异常值)扔掉。
  • 变换(Transformation / Normalization):做映射。就像“做苹果泥”——在机器学习里,经常要把身高“1.8 米”和工资“20000 元”放进同一个模型。不做归一化(数据变换),工资的数值会把身高的权重淹没。所以数据变换的本质,是把不同维度的数据拉到同一起跑线上对话

分析的层级:时间维度的跃迁

  • 描述性(Descriptive)过去式。发生了什么?(看 Log、看 Dashboard)
  • 预测性(Predictive)将来式。根据历史拟合,推测未来。(机器学习在干的事)
  • 规范/规则性(Prescriptive)祈使式。基于预测,我该做什么?(决策优化的目标)
技术启示

:很多初级工程师只盯“模型准确率”,忽略“数据变换”。记住:Garbage In, Garbage Out。喂给模型的“苹果”要是整块硬邦邦的(未变换),再好的模型也会崩。

---

可视化的哲学

可视化的哲学:不要让我思考

(涉及:可视化工具、可视化的目的)

为什么 Excel 和 ECharts 是工具,PPT 却不是?为什么可视化不能“复杂”?这里触及 人机交互(HCI) 的核心:认知负荷(Cognitive Load)

工具 vs 载体:Excel 和 ECharts 有数据绑定能力——改一个数,图自动变,是动态的、有逻辑的引擎。PPT 多数情况下只是静态的像素容器。技术人要掌握的是“引擎”,不是“容器”。刷题时可以让 AI 各举一个“改数联动”与“纯贴图”的对比句,十几秒就能巩固考点,不用翻半本书。

直观 vs 复杂:题里有个错误选项说“可视化需要专业解读”——这简直是对可视化的误解。Edward Tufte 说过,好的图表应该在最短时间内传达最大信息量。一张图还要配说明书才能看懂,那是加密,不是可视化

技术启示

:做汇报或做 Dashboard 时问自己一句:“老板/用户看这张图,需要超过 3 秒才能反应过来吗?” 如果是,请重画。简单,才是最高级的复杂。

---

软件工程护城河

软件工程的护城河:V 模型与原型

(涉及:单元测试与详细设计、原型设计)

V 模型的对称

题里问:为什么单元测试要参考详细设计文档?这是验证粒度要对齐的问题。

  • 验收测试 对应 需求:做出来的东西是用户想要的吗?(宏观)
  • 单元测试 对应 详细设计:这个函数的逻辑符合当初的设计吗?(微观)

你不能拿着“我要盖大楼”的需求,去检查“这块砖是不是粘土做的”。层级必须匹配,否则测试就是无效的。这里很适合让 AI 画一张简易 V 字对照表(左需求—右测试层级),大脑对“对齐”的记忆会比纯文字深一层——这也是用 AI 提质:同样的复习时间,多一种表征。

原型的悖论

为什么选“敏捷、沟通、轻松”,不选“提高代码质量”?因为原型(Prototype)的使命是快速试错,核心价值在于可丢弃。MVP 用纸板搭滑梯,是为了验证“宝宝会不会撞头”,不是验证“纸板能不能用 100 年”。在原型阶段追求代码质量,是在浪费生命——原型就是要糙、要快、要脏。

技术启示

:写代码前先画图(详细设计),单元测试才写得出来;做产品前先搞原型。想清楚,永远比写得快更重要。

---

职场 API

职场生存指南:劳动法的逻辑

(涉及:劳动合同终止)

法律题不只是考点,更是职场 API 文档。法律的逻辑和编程很像:异常处理(Exception Handling)

  • 试用期不符合条件IllegalArgumentException(参数一开始就错了)
  • 严重违规FatalError(必须终止进程)
  • 不服从不合理安排 ≈ 合法的 UserRequest,系统不能因此 Crash

作为开发者,我们习惯看技术文档,却常忽略社会的“文档”。理解《劳动法》,是为了在遇到 Bug(职场纠纷)时,知道怎么调底层接口保护自己。跨领域题最容易孤立记忆;我会让 AI 把条款和“程序里哪种失败模式”对上号,一遍过完,迁移成本低很多。

---

总结

技术是有温度的,AI 是放大镜

复盘完这几道题,你会发现:考证里的“知识点”,其实是前人踩坑总结的最佳实践

  • 为了让机器看懂世界 → 标注(标准化)
  • 为了从噪音里提取智慧 → 数据分析(熵减)
  • 为了让人看懂数据 → 可视化(降维)
  • 为了软件不崩盘 → V 模型(校验机制)

AI 赋能刷题,说到底就三件事:缩短从错题到本质的路径用类比和反例加固理解把散点串成可迁移的结构。人仍然要亲自选、亲自错、亲自记住——AI 不负责替你考试,负责让你在同样多的夜晚里,少背几句空话,多带走几套能用的思维模型

现在刷的每一道题,不仅是为那张证书,更是在搭一套工程思维。这种思维,写代码用得上,理解这个世界也用得上。保持好奇心,才是技术人最值钱的东西。

阅读时长:10 分钟


文档信息

版权声明:自由转载-非商用-非衍生-保持署名(CC BY-NC-ND 3.0)

原文链接:https://yijinlee.com/share-future/article-13

作者:李奕锦

商业用途或修改衍生请联系授权。


TL;DR

  • AI 赋能刷题:人负责判断与记忆,AI 负责即时纠偏、类比与知识图谱——同一晚上多消化几类题,质量靠“追问为什么”兜底。
  • 边界即真值:标注、if 判断、API 契约,搞清楚边界就消灭大部分 Bug。
  • 数据流水线:清洗做减法、变换做映射;描述 / 预测 / 规范是过去 / 将来 / 祈使三层认知。
  • 可视化 = 降认知负荷:3 秒看不懂的图请重画;原型要糙要快,代码质量留给正式迭代。
Tags:计算机视觉数据流水线V 模型HCI工程思维AI 辅助学习

该专题下的阅读路径

入门:理解 AI 协作模式 → 进阶:Prompt 工程实践 → 实战:Cursor 工作流