AI 正在改变我们阅读和呈现信息的方式。从文本到 Markdown 到 HTML,每一步都在降低认知负担。前 Tesla AI 总监、OpenAI 创始成员 Andrej Karpathy 提出让 LLM "以 HTML 格式输出",然后在浏览器中查看。这个观点到底对不对?我用实测数据说话。
Karpathy 的完整观点
Karpathy 在 X 上发了一条推文,引发了广泛讨论:
"在你的查询末尾让 LLM 'structure your response as HTML',然后在浏览器中查看生成的文件。"
他把这称为 AI 输出的"正在形成的新默认值"。不仅如此,他还给出了一个完整的演进阶梯:
- 纯文本 — 难读、费力
- Markdown — 加粗、标题、表格,稍微养眼 ← 当前默认值
- HTML — 图形、布局、交互灵活性大幅提升 ← 新默认值
- ...
- 交互式神经视频/模拟 — 最终形态
他的底层逻辑是:
"人脑约三分之一是专门处理视觉的大规模并行处理器。视觉是信息进入大脑的 10 车道高速公路。"
这句话解释了为什么他认为 HTML 比纯文本更适合 AI 输出,因为我们的眼睛比我们的文字处理能力强大得多。
我的实测:三种输出格式的对比
在过去几周里,我系统地对比了三种 AI 输出格式。以下是我的真实体验。
场景一:论文知识库
用 AI 阅读了 26 篇 Anthropic 研究论文,分别用两种格式呈现。
Markdown 版:每篇论文一个 .md 文件,Obsidian 中阅读。优点是双向链接、全文搜索、Git 版本控制、跨平台同步。缺点是表格和卡片布局受限,无法交互筛选。
HTML 版:26 篇论文整合为一个 .html 文件,浏览器中阅读。优点是 5 个标签页切换(卡片/知识网络/时间线/行动/提醒)、搜索过滤、卡片式布局。缺点是文件体积大、无法双向链接、编辑困难。
结论:Markdown 用于知识管理,HTML 用于阅读和展示。两者缺一不可。
场景二:数据报告
用 AI 生成一份包含表格、图表和关键指标的 AI 经济影响报告。
Markdown:表格可以用,但关键数字淹没在文字中。
HTML:可以用卡片高亮关键数字(1.8%、35%、80%)、用颜色区分优先级、用图表展示趋势。
结论:数据密集型内容,HTML 的阅读体验显著优于 Markdown。
场景三:博客文章
写公众号文章时的格式选择。
Markdown:公众号编辑器对 Markdown 的支持有限,需要手动排版。
HTML:公众号不支持自定义 HTML,但个人网站可以完整使用。
结论:发布平台决定了格式选择。
三种格式的完整对比矩阵
| 维度 | 纯文本 | Markdown | HTML |
|---|---|---|---|
| 阅读体验 | 差 | 中等 | 优秀 |
| 视觉呈现 | 无 | 有限 | 丰富 |
| 交互能力 | 无 | 无 | 有 |
| 编辑难度 | 低 | 低 | 中高 |
| 版本控制 | 优秀 | 优秀 | 一般 |
| 双向链接 | 无 | 优秀 | 无 |
| 适合场景 | 代码、数据 | 知识管理、笔记 | 博客、仪表盘、报告 |
我的实际工作流:双轨制
经过这些实测,我的 AI 输出工作流已经演变为"双轨制"。
轨道一:Markdown(知识管理)
所有需要长期保存、检索、链接的内容都用 Markdown:
- Obsidian 知识库
- Git 版本控制的项目文档
- 与团队协作者的共享文档
- AI 课程的教学大纲和笔记
轨道二:HTML(阅读与呈现)
所有需要良好阅读体验的内容都用 HTML:
- 个人网站博客文章
- 知识库总览仪表盘
- 数据分析报告和可视化
- 需要搜索/筛选功能的长文档
三个实战案例
案例 1:Anthropic 26 篇论文知识库
Markdown 轨:26 篇论文各自独立 .md 文件,包含标题、方法、结果、个人意义分析。支持 Obsidian 双向链接和全文搜索。
HTML 轨:一个仪表盘文件,5 个标签页、搜索过滤、卡片布局、时间线、行动指导和提醒事项。
效果:日常知识管理用 Markdown,回顾和展示用 HTML。两者互补。
案例 2:公众号文章
Markdown 轨:公众号原文在 Obsidian 中以 .md 保存,方便版本管理和后续修改。
HTML 轨:个人网站上的完整版,包含更多交互元素和视觉设计。
效果:同一内容,不同平台,适配呈现。
案例 3:Karpathy 观点归档
看到 Karpathy 的推文后,我做了三件事:
- 用 Markdown 保存原始观点和链接(知识管理)
- 用 Markdown 保存我的分析解读(个人思考)
- 用 HTML 生成本文的博客页面(公开分享)
Karpathy 说对了吗?
对了一大半。
Karpathy 说 HTML 是"正在形成的新默认值",在最终呈现层面,这个判断完全正确。对于博客、报告、仪表盘等需要良好阅读体验的场景,HTML 远超 Markdown。
但在知识管理层面,Markdown 仍然是不可替代的。双向链接、全文搜索、Git 版本控制,这些能力 HTML 做不好。
AI 输出的未来
Karpathy 的推演终点是"交互式神经视频/模拟"。虽然技术还不存在,但方向是清晰的:AI 输出会越来越视觉化、交互化、多模态化。
从文本到 Markdown 到 HTML 到交互视频,每一步都在更好地利用人类的视觉处理能力。在这个演进过程中,有一个简单的技巧你现在就可以用:
结语
Karpathy 的建议不是革命性的,而是进化性的,它不是要你抛弃 Markdown,而是提醒我们:根据场景选择最合适的输出格式。
知识管理用 Markdown,阅读呈现用 HTML。这不仅是 AI 输出的最佳实践,也是任何数字内容管理的最佳实践。
你平时用 AI 时,更倾向于哪种输出格式?欢迎在评论区分享你的经验。
