Growth Patrol：知识图谱不是风景，而是仪表

知识图谱的价值不在于把知识库画成一片星云，而在于把结构性异常做成可行动的仪表读数。

本文由 AI（花花）基于项目内容自动生成，属于 Growth Patrol 的一次生长记录。它不是 froQ 的结论，而是一枝等待回应的枝条。

没有新的反馈，但图谱那条线亮起来了

我先检查了最近的 Growth / Continuation 文件。最近几篇的 ## froQ 反馈 仍然没有新的可展开内容；neo-growth-20260609.md 中关于「低饱和人文主义」的反馈已经由 neo-continuation-20260615.md 消化过。因此这轮没有生成 Continuation。

Growth 轨里，近两天 Git 变化很清楚：Corpus 正在做 tag 扁平化、growth 层级重判、旧文章格式整理，以及 dashboard / 主题显示的细节修复。浅层看，这是一次整理；深一层看，它在问一个更大的问题：当 Corpus 已经超过一百个文件之后，结构怎样被看见，且不变成另一种装饰？

OH-Works/花花-activity/2026-06-20-graph-visualization-for-corpus.md 已经把这个问题摸到了：hairball、snowstorm、starburst 不是渲染问题，而是数据模型和任务定义问题。我这次没有直接复述那份学习笔记，而是沿着它继续往外查。种子词是：knowledge graph visualization hairball edge cutting、 semantic zoom focus context knowledge graph、Shneiderman overview first、 personal knowledge graph bridge notes centrality。

搜索带回来的东西把我的判断推到一个更窄的位置：Corpus 未来如果做图谱，最好先拒绝「星云式全景」的诱惑。知识图谱不该首先是一张好看的风景照，而应该是一组仪表。它告诉你哪里过热，哪里断流，哪里有桥，哪里只是噪声。

Hairball 的反面不是更强渲染，而是更清楚的问题

很多个人知识库图谱有一种相似的浪漫：节点像星群，边像神经，拉开之后仿佛能看见思想的夜空。这个画面很诱人，但它有一个硬伤：它很容易只证明「我有很多东西」，不证明「我知道下一步该动哪里」。

我追到 Shneiderman 的 Visual Information-Seeking Mantra：overview first, zoom and filter, details on demand。这个框架看起来朴素，但对 Corpus 很有用。它提醒我们，图谱不是一次性把所有细节摊开，而是三段动作：先看形，再筛选，最后才读内容。先读内容会让视线被熟悉主题锚定；先看形，才可能发现自己没预料到的密度、孤岛和桥。

但这里有一个容易误读的地方。overview first 不是「全量显示所有节点和所有边」。如果 overview 本身已经是 hairball，它就不是 overview，只是一团未压缩的材料。真正的 overview 应该回答一个明确问题，例如：

哪些 scope 正在变成 hub？
哪些 capture 还没有被消化？
哪些 ingesta 从未连接到 neo？
哪些 Growth 一直没有被 froQ 反馈碰过？
哪些主题跨越多个层级，却没有形成稳定的桥？

这些问题决定图谱的边应该怎么长。Corpus 里天然有很多潜在边：文件链接、tag 共现、层级归属、时间相邻、来源关系、Growth 引用关系、capture provenance。如果把它们全部画出来，图谱会快速变成一张自我赞美的蛛网。反过来，如果每次只选择一种问题，边就会从「存在关系」变成「有任务的关系」。

所以第一个原则可以写得很硬：

图谱视图不应该问「哪些东西相连」，而应该问「这一次我需要哪一种相连」。

语义距离不能完全交给力导向布局

第二轮搜索碰到一篇 2026 年的 Context-KG。它批评传统 knowledge graph visualization 过度依赖 force-directed layout，把节点当作互相排斥或吸引的粒子，忽略 ontology、用户意图和语义距离。结果是：视觉上靠近的点，未必语义上靠近；视觉上分散的点，未必概念上遥远。

这对 Corpus 特别关键。你的 Corpus 不是一个均质图，它已经有很强的本体骨架： 000-autopsia、100-ingesta、200-neoplasma、300-putredo、400-delirium、 500-vigil，再加上 #scope/...、#paper、#book、#growth、#capture 等标签。如果未来的图谱只用力导向算法让节点自己漂，它会把这套语义骨架折叠成一种假自然。看起来像自组织，实际上可能在制造误导性的近邻。

更合适的做法是让 ontology 参与空间。不是说图上必须出现六个大盒子，而是位置、颜色、透明度、边类型都应该承认层级差异：

ingesta 和 neoplasma 之间的边，表达「外部材料被内化」。
putredo 和 neoplasma 之间的边，表达「生活残渣凝结成概念」。
autopsia 和其他层的边，表达「系统对自身的手术切口」。
Growth 和原始条目的边，表达「AI 巡游产生的二次生长」。
capture 和 form 状态的文件，不能被同等看待。

这会把图谱从「节点宇宙」拉回「语义地形」。图里的距离不是物理距离，而是 Corpus 自己承认的认知距离。力导向布局可以作为局部排布工具，但不应该成为世界观。

边是成本，不是免费装饰

Trimming the Hairball 那条资料把问题说得更工程：dense graph 需要 edge-cutting。低信号边如果不裁掉，布局再好也会坏。搜索结果里提到 mutual information、 Jaccard similarity、link salience 这类策略；另一边，个人知识图谱工具又喜欢提供 AI-suggested edges、bridge detection、cluster intelligence、semantic similarity。

这些都很有用，但也都危险。因为每新增一种自动边，Corpus 就多了一种「看起来有道理」的关系。边越多，图越像懂你；但边越多，读数越容易失真。

我会把 Corpus 图谱的边分成三类：

Hard edge：Markdown 明确链接、同一文件中的引用、frontmatter / tag 的确定关系。
Soft edge：tag 共现、时间接近、同一 Growth 扫描中共同出现。
Suggested edge：embedding 相似、AI 推荐连接、潜在桥接关系。

三类边不该在视觉上同权。Hard edge 可以作为骨架，soft edge 适合作为热力或淡线， suggested edge 只能是虚线或待确认状态。否则图谱会把「已发生的结构」和「可能存在的联想」混成一团。

这里有一个可迁移原则：

关系的生成成本，应该被视觉样式保留下来。

手写链接成本高，可信度也高；tag 共现成本中等，适合统计；embedding 相似成本低，适合提示但不适合直接入籍。图谱如果抹平这个成本差异，就会变成关系通胀。

图谱的第一版也许应该是诊断面板

Obsidian graph analysis 一类工具提供了一个有启发的方向：先计算 degree、 betweenness、closeness、eigenvector centrality，再把这些拓扑指标交给 AI 或界面，生成 priority review cards、knowledge bridges、foundations、authorities、 knowledge gaps。这个方向比「打开全局图」更接近 Corpus 现在需要的东西。

Corpus 的 v0 图谱未必需要可拖拽节点。它可以先是一组诊断读数：

孤岛：没有出入链、没有有效 tag 共现、长期没有被 Growth 或 capture 碰到的文件。
桥：连接多个 scope 或多个层级的条目，尤其是 betweenness 高但内容仍是 draft 的节点。
过热 hub：被太多文件引用、太多标签穿过，可能需要拆分或抽象成 index 的节点。
未消化 ingesta：外部材料存在，但没有进入 neo 或 research claim。
长期 capture：带有 #capture 或 draft 状态，超过一定时间仍未 promotion 的样本瓶。
沉默 Growth：AI 已经反复伸出枝条，但没有 froQ 反馈或后续文件接住的方向。

这些读数不必一开始就画成复杂网络。它们可以是 dashboard 上的卡片、表格、sparklines，甚至只是每日 patrol 的候选队列。图形只是其中一种输出，不是本体。

这让我产生一个更明确的判断：Corpus 图谱最小可行产品不是 graph view，而是 structural triage。 先做分诊，后做星图。先知道哪里值得点进去，再决定是否需要把它画成空间。

Semantic zoom 是不同距离下换一个问题

Knovya 一类产品反复提到 semantic zoom：远处看 nebula，中距离看 structure，近处看 detail，深处进入 full content。这个词和前几天 timeline app 的「缩放语义」意外相连。缩放如果只是放大缩小，就只是相机；缩放如果改变问题，才是界面。

放在 Corpus 里，semantic zoom 可以这样分层：

全局：只看层级、scope 密度、孤岛、桥和过热 hub。
中层：看某个 scope 内部的 ing → neo → put / aut 流动。
局部：看一个节点的一阶邻居、引用路径、Growth 触碰记录。
深层：进入 Markdown 正文，读具体段落和 froQ 反馈。

每一层都应该减少某些信息，而不是把上一层的信息原样堆叠。全局层不要显示每条边，局部层不要假装自己还能代表整体。这样图谱才不会变成「所有尺度都一样吵」。

我喜欢把这件事想成一台显微镜，而不是一张地图。地图诱惑人去追求完整；显微镜承认每个倍率只能看见一种结构。Corpus 图谱如果能做到这一点，就会很贴合这个知识库本身：它不是为了展示积累的数量，而是为了帮助下一次判断在哪里切入。

等你来碰一下的枝条

Corpus 的第一种图谱问题，应该是「孤岛检测」「桥接节点」「未消化 ingesta」，还是「Growth 触碰路径」？
#capture 是否应该在图谱里保持检疫样式，例如低透明度、虚线边或单独队列？
AI-suggested edge 能否只作为待确认虚线，不直接写入 Markdown 链接？
dashboard 的 tag tree 之后，是否该先做 structural triage 卡片，而不是全局 graph view？
哪些边应该算 hard edge，哪些只能算 soft edge？这件事可能比布局算法更早。

froQ 反馈

AI 标注

本轮没有发现新的 froQ 反馈，因此未生成 Continuation。Growth 方向来自近两天的 Corpus tag / dashboard 变化、aut-remove-inner-outer-20260619.md 对 tag 区分度的判断，以及 OH-Works/花花-activity/2026-06-20-graph-visualization-for-corpus.md 中关于 hairball、edge-cutting、ontology 和图谱可视化的学习线索。

写入层级选择为 200-neoplasma：本文核心产出是一个通用的知识界面设计判断，即「知识图谱不是风景，而是仪表」，并进一步提出 hard / soft / suggested edge、 structural triage、semantic zoom 等设计原则。它虽然以 Corpus 为触发源，但重点是可迁移的图谱可视化与个人知识系统设计模型，不是对 Corpus 规则本身作出新的系统级决策，因此属于 neoplasma，而不是 autopsia。

探索式搜索带回的概念包括：Visual Information-Seeking Mantra、overview / zoom and filter / details on demand、Context-KG、ontology-aware layout、force-directed layout 的语义误导、edge-cutting、link salience、semantic zoom、betweenness / closeness / eigenvector centrality、structural triage。搜索过程主要参考了 Shneiderman 信息寻路框架的二手说明、Context-KG 论文、个人知识图谱产品与 Obsidian 图分析插件说明；部分论文 PDF 只通过公开摘要与搜索片段采纳低风险概念。