從外面看,AI 求解器就像變魔術:你輸入 ,一段乾淨的步驟就出現了。在內部,它是一條五個階段的流水線,映照著一位細心的人類家教的工作方式——讀題、規劃、計算、驗證、講解。本指南會打開這個盒子。讀完後,你將確切知道當你在 AI-Math 求解器上按下求解時發生了什麼,以及如何辨別 AI 是站在堅實的基礎上,還是在瞎猜。
階段 1 —— 解析輸入
第一項工作是弄懂你輸入了什麼。這比看上去要難,因為學生會用五種不同的格式輸入題目:
- 乾淨的 LaTeX:
- 純 ASCII:x^2 + 3x - 4 = 0
- 自然語言:「求 x 的平方加三 x 減四的根」
- 一張教科書頁面的照片
- 平板上一段手寫塗鴉
每一種輸入都會被正規化為一個標準的內部表示——通常是一棵解析後的運算式樹。照片和手寫會先經過一個視覺模型,把像素轉換成 LaTeX;文字則經過一個語言模型,擷取出背後的方程式。
階段 2 —— 規劃解法
一旦系統拿到一個乾淨的方程式,它就必須選擇一種方法。這個二次式應該因式分解、配方,還是套二次公式?那個積分該用代換、分部,還是部分分式?
現代系統用思維鏈推理來做這件事:模型在確定路徑之前,會先寫一小段內部草稿——「這是一個被積函數為多項式乘三角函數的定積分,分部積分兩次應該能化簡它」。這段草稿對你不可見,但正因為有它,可見的步驟才是連貫的,而不是雜亂無章的。
階段 3 —— 生成步驟
現在模型一步一步地產出可見的解答。每一步都是一個小小的數學動作:一次代換、一次因式分解、一次微分、一次變形。模型把每一步寫成另一個數學引擎能讀懂的形式。
這就是為什麼一個好的 AI 解答看起來是這樣的:
- 取 ,,套用分部積分。
- 於是 ,。
- 代入得到 。
- 對 再次套用分部積分……
……而不是直接甩出答案。這個中間形式是下一階段的基底。
階段 4 —— 驗證每一步
這裡就是神經符號系統拉開與純聊天機器人差距的地方。每一個生成的步驟都會被送進一個符號驗證器——一個懂得代數和微積分規則的確定性引擎。驗證器檢查:
- 第 3 步是否由第 2 步透過一次合法的代數動作得出?
- 提出的反導函數微分後是否真的回到原來的被積函數?
- 等式、不等式以及定義域約束是否都被保持?
如果任何一項檢查失敗,系統就會回溯:丟棄那一步,並請推理模型重試,通常還附帶一條關於哪裡出錯的提示。這個迴圈對你不可見,但正是它讓現代數學 AI 比幾年前的聊天機器人可靠得多。
階段 5 —— 用大白話講解
最後,系統把已驗證的步驟改寫成對人友善的文字,並配上有用的背景:「我們在這裡用分部積分,是因為被積函數是一個代數函數與一個三角函數的乘積,而這種情形通常對該方法有效。」
講解這一層,正是把一個正確答案變成一個學習時刻的關鍵。它也是 AI 家教彼此區分高下之處——同樣正確的步驟,可以呈現為生硬的公式堆砌,也可以呈現為耐心的逐步引導。
一個完整範例:從頭到尾求解
| 階段 | 內部發生了什麼 |
|---|---|
| 解析 | 辨識出一個標準形式的一元二次式,擷取 |
| 規劃 | 注意到 且判別式看起來像一個完全平方——傾向因式分解而非二次公式 |
| 生成 | 寫道:「找兩個數,乘積為 、和為 : 和 」 |
| 驗證 | 用符號方式確認 |
| 講解 | 輸出:「因式分解得 ,所以 或 」 |
整件事在二次方程式計算器上不到一秒就完成,但這五個階段的每一個都在執行。
還有什麼可能出錯
- 輸入解析出錯。 一張雜亂的照片可能被 OCR 誤識別;一個缺失的括號可能改變題意。在相信答案之前,務必掃一眼 AI 是怎樣複述你的問題的。
- 方法選擇錯誤。 有時規劃器會選一條更慢的路徑。答案仍然正確;只是講解不夠理想。
- 無法驗證的領域。 對某些高階問題(組合學證明、抽象代數),符號驗證器覆蓋有限,AI 會退回到 LLM 式推理。這些要用常識複核。
為什麼這對你怎麼學習很重要
了解這條流水線會給你作為學習者的超能力:
- 在任何解答的第 1 步之後,在 AI 告訴你之前,先問自己「換作我會在這裡選哪種方法?」
- 步驟出現後,遮住結論,自己試著推到那裡——你已經握有全部的搭建材料。
- 如果 AI 的答案和你的教科書不一致,往往是教科書用了一個不同但等價的形式(例如 對 )。驗證兩者微分後是否得到同一個東西。
接著讀
- 走進 AI-Math:MathCore 推理引擎 —— 我們使用的具體技術堆疊
- AI 數學準確率:基準分數究竟意味著什麼 —— 如何看待「MATH 得 61.7」這類說法
- 用 AI 真正學會數學,而不是只拿到答案 —— 把 AI 變成家教的習慣