Markdown 格式自主:AI 时代最值得学会的一件事(之二)
Markdown 格式最早的出现源于程序员们对 Word 排版反复无常的厌恶。因为你在 Word 里面的所有操作会被 Word 处理成藏在背后看不见的标签语言。这种不透明导致用户的意图和 Word 的解读经常不一致。
程序员们就想着要有一个透明的语言,写着是“标题”那里就是“标题”,写着是“加粗”的那个地方就是“加粗”。
于是 Markdown 很早就成了程序员写文档的默认格式语言。
那么可想而知,AI 被大量“投喂”的文档格式,就是 Markdown。
AI 读的不是字,是结构
把你的需求发给 AI,本质上是在把一段混乱的人类意图,翻译成机器能精确执行的指令。这个翻译过程,你以为只是”打了一段话”,AI 那边却在做大量的概率计算:哪部分是背景?哪部分是目标?哪部分是约束?
如果你只给了一团文字,AI 只能去猜。
Markdown 的作用,就是把这个”猜”变成”看”。
一个 ## 标题,告诉模型”这是一个新的主题锚点”。一个 - 列表,告诉模型”这些条件是平行的、独立的”。一个 **加粗**,告诉模型”这是最高优先级的关键词”。
这不是玄学,是模型训练的必然结果——GitHub、Stack Overflow、技术文档,这些 AI 摄取最多的高质量语料,几乎全是 Markdown 格式写的。用 Markdown 跟 AI 说话,相当于用它的母语和它沟通。
有数字为证
以下数据来自公开研究:
- 仅仅加入清晰的 Markdown 标题和分隔符,模型的理解准确度可提升 31%
- 在 Markdown 框架内嵌入示例,任务执行成功率比纯文字指令高出 58%
(以上两条来源:Reddit r/PromptEngineering 社区帖子「2 Prompt Engineering Techniques That Actually Work (With Data)」,该帖整理了多项实测对比数据。)
- 相同内容,Markdown 格式消耗的 Token 仅是 PDF/DOCX 的 三分之一到八分之一
(来源:Bismart 技术博客「Markdown: The Best Text Format for Training AI Models」,附有格式对比表格。)
最后一条对重度 API 用户来说意义直接:Markdown 不只是更准,还更省钱。
三个上手就能用的场景
场景一:结构化你的 Prompt
不要再发一整段话了。试试这个格式:
1 | ## 任务 |
发出去,感受一下区别。
场景二:建一个”技能文件”
把你常用的复杂操作模式写成一个 skill.md,比如你喜欢的写作风格、常见的任务模板、固定的约束条件。每次开新对话时直接粘贴进去。
这是一种”拥有”你的 AI 的方式——不依赖某一家平台的记忆功能,你的指令,你管着。
场景三:你的笔记,变成 AI 就绪的数据集
如果你用飞书、Obsidian 或 Notion 记笔记(它们的底层都是 Markdown),你的知识库天然就是 AI 可以直接检索和分析的格式。而且现在越来越多的编辑器也支持 Markdown 了,建议打开新的编辑器试一试。
三分钟入门小tip
Markdown 没有学习门槛。核心语法六行就写完了:
1 | # 一级标题 |
掌握这六条,日常跟 AI 沟通已经够用。
如果你想更进一步,可以了解这几个进阶语法:
1 | | 列一 | 列二 | 列三 | ← 表格:整理对比信息 |
进阶语法的共同价值:帮 AI 更精准地识别数据边界。表格告诉 AI”这些字段是平行的”,代码块告诉 AI”这段内容原样处理、不要解释”。
一个写得好的 Markdown 文档,不只是给 AI 读的。给人读,也更清楚。
为了让大家尽快掌握这个技能,我做了一个免费小游戏。
Markdown练习小游戏。浏览器输入网址 play.hawken.im,或者在本公众号(AI加点油)留言:play 就可以找到。