Press "Enter" to skip to content

个人知识图谱:你的第二大脑

本站内容均来自兴趣收集,如不慎侵害的您的相关权益,请留言告知,我们将尽快删除.谢谢.

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

 

编者按:互联网的崛起导致了知识的爆炸,知识的爆炸导致我们容量有限的大脑迎接不暇,甚至连千百年来我们一直沿用的辅助知识管理手段也不能应付了。但最近在新一代的笔记工具与知识管理工具的帮助下,个人知识管理终于准备迎来新的突破。在运用个人知识图谱的第二大脑的帮助下,我们将可以更好地发挥非线性思维,释放更大的创造力。文章来自编译。

 

 

个人知识图谱(PKG)的演进

 

去年,我的老朋友 Arun Batchu 向我介绍了用于创建个人知识图谱(PKG)的新一代软件。尽管 PKG 的概念可以追溯到 2019 年,但由于使用知识图谱表示的新一代笔记软件的出现,这个术语最近变得流行起来。

 

本文首先将介绍一下 PKG,然后讨论 PKG 会如何影响你的整体企业知识管理战略,以及最终如何可以与企业知识图谱结合运用。

 

什幺是个人知识图谱(PKG)?

 

PKG 属于一种新型软件,可让你以灵活的,非线性的知识图谱的形式有效地记笔记。 但PKG 也是从比较旧的线性笔记以及大纲软件演变而来的。 PKG 正在学生、研究人员、软件开发人员、博客作者以及创意内容作者群体中得到迅速普及。

 

用链接记事卡记笔记的简史

 

早在 1500 年代的时候,德国的研究人员就开发了一种叫做卡片盒(Zettelkasten)的知识撷取系统。卡片盒本质上是把想法整理进索引卡片上的一种方式,目的是展示想法或概念是如何与其他概念相关的。 卡片盒形成了一张卡片一个概念(One-Concept-Per-Card)以及概念链接(Concept-Linking)的想法,后来到了1960 年代通过 HyperMedia 的概念被移植到电子形式,支持文档的任何部分都可以链接到该文档的任何其他部分或任何其他文件上。超媒体后来又演变成超文本,成为超文本标记语言(HTML)的基础。 2001 年,万维网的发明者(Tim Berners-Lee)又尝试给这些链接添加关系类型,这随后成为了语义网(Semantic Web)的基础。语义网是这样一次尝试,目的想让网页信息既能分布存储,又让保持链接这件事情变得更容易。

 

在概念链接不断发展的同时,我们也目睹了个人笔记软件行业的发展。这些电子工具,比方说大纲工具、思维导图工具以及像 Evernote 这样的跨平台工具 ,可以让个人在许多不同的设备,比方说他们的手机和平板电脑上创建和保留他们的笔记。这些不同的设备都与连接上云端的存储系统相关联,所以你在所有设备上的所有笔记都可以保持同步。

 

为知识撷取与知识交换服务的 Markdown 语言的兴起

 

 

常见Markdown 语法速记表样例。

 

尽管这些笔记工具很方便,但缺乏一种简单的方法来获取和交换系统之间的关联知识。类似 HTML 这样的标记语法确实具备可移植性,但大多数用户并不想在超文本中撷取笔记,因为这需要太多的工作来格式化诸如指向其他概念的链接之类的东西。我们需要的是更容易输入的“轻量”版 HTML。

 

2004 年被被创建出来的 Markdown 格式就是这样。这是一种轻量级的标记语言,用户无需创建高度结构化的标记即可快速输入知识。任何文本编辑器(比方说记事本)都可用来创建标记,只需几百行 Python 代码即可将 Markdown 转换为 HTML。自 2004 年以来,Markdown 已经稳步发展为软件工程师与数据科学家创建代码文档的首选方式。它现在还是在 GitHub 上记录文档的默认方式,Data Science用的是 Jupyter Notebooks,并用Microsites 来创建项目文档。甚至像 Google Docs 这样的传统产品也增加了 Markdown 功能。

 

给 VisualStudio等 IDE 添加“智能自动完成”可以更轻松地创建和编辑标记。想要指向自己仓库里面的一幅图像?只需键入“![ ](”,VisualStudio就会给出图像文件路径的建议!

 

将超链接、Markdown 与图谱结合在一起

 

我们看到了将概念链接、Markdown 与知识图谱结合起来的又一代个人笔记工具。这些新工具正在迅速发展,现有的笔记工具也开始增加更多的图谱感知功能。这种新的流程和软件类别称为个人知识图谱(PKG)领域。其开山鼻祖是 Roam Research 以及开源的 Obsidian 产品等创新项目。

 

为什幺个人知识图谱如此受欢迎?因为第二大脑理论。

 

 

“第二大脑”在 PKG 社区中经常被反复提及。逐步获取这些知识的想法是一个很流行的卖点。图片来自 Obsidian 文档网站。

 

几乎所有研究领域的新信息量都呈指数级增长。对某个主题简单用 Google 搜索一下,就像对着消防水管喝水一样——很难弄清楚不断涌入的信息流里面什幺是必不可少的。以下是别人告诉我自己喜欢 PKG 的几个常见原因。

 

PKG 的优势

 

优势一:快速整理思绪

 

PKG 可让你快速组织来自这些流的信息,好找出重要的内容,在现有主题之间建立新的关联,并建立你的见解。你可以导入任何文本,只需突出显示一个单词或短语并输入“[[”,它就会神奇地变成你的概念图谱中的一个节点!当你键入时,“自动完成”可以告诉你 PKG 里面是不是已经存在了,这样就可以快速地将各种条目链接在一起。

 

优势 2:降低认知负荷

 

在使用 PKG 之前,我经常会因为不断要开背靠背的会议安排而感到压力。我很少有时间在这些会议之间写下自己的想法,在学习新内容的时候老是要重新确定任务的优先级。现在,我可以在会议期间做笔记的同时,将笔记链接到我现有的知识库。所以现在的我再也不会感觉那幺紧张了!

 

问题在于我们大脑的短期记忆只能保存固定数量的东西。如果我们不把东西记下来,它们就会消失。我记得自己就曾经疏忽过,当时没有写下新想法,几天或几周后才想起来。

 

其中很多都与这个“卸载”的任务有关:记住概念,以及概念与另一系统的关系。在解释为什幺 PKG 有用时,他们往往称之为“第二大脑”。你的 PKG 变成了实际大脑的“挥之不去的影子”——因为它将关键概念及其关系存储在一个非线性结构,一个图谱里面,而这种工作方式跟我们的大脑类似。

 

优势三:促进非线性思维

 

我经常能看到的第三点是 PKG 可以帮助我们摆脱“线性思维的暴政”。遍历的顺序往往是固定的。这与传统笔记形成了对比,因为后者也使用了包含有固定顺序项目列表的文档。文档的顺序要求我们得有一系列的章节与小节。

 

但是你在做笔记的时候,所遇到的信息其内在顺序也许并不是你洞察世界的真正方式。大纲工具确实可以让你对主题的顺序进行重新排列,可以展开和收起章节。尽管如此,它仍远没有将每个主题连接到现有知识图谱那样的灵活与强大。

 

优势四:长期留存

 

似乎企业每隔几个月就会改变自己存储知识的方式。上一年可能是存储在文件夹里面的 MS Word,下一年就换成了 wiki,然后可能是用 Microsoft Sharepoint ,现在我们又看到往 GitHub 的微站点转变的趋势。每次组织变更所使用的工具时,知识都会丢失。但现在因为那些知识是围绕着容易编辑的 Markdown 等标准建立起来的,所以我们希望这些数据能够长期存在。尽管概念链接、标签以及别名等尚未实现跨平台的标准化,但我们希望能够出现轻量级 PKI 的互操作性标准,同时又不需要实现完整的DocBook 兼容性清单。

 

优势5:打破作者的障碍

 

我的目标之一是尽量每隔一周写一篇博客。有时我想到一个想法时,兴冲冲地写出了第一段,但之后就写不下去了。我不知道怎幺去组织我的想法才能让读者阅读起来感觉有条理。如果我能够用一个个小图谱来保留想法的话,这些想法就会慢慢积累。打个比方,这就好比建立一个“数字创意花园”,让创意之花自然生长。当我在一个子图谱里面有了十几个好想法时,也许将它变成一篇真正的博客的时机就成熟了。

 

这些优点是我个人对如何使用 PKG 的看法。如果你上搜索引擎去找的话,你会发现学生、研究人员、创意作者以及博主各自都有不同的用法。

 

PKG 工具面临的挑战

 

 

此图为这篇关于个人知识图谱的博客的早期图谱。请注意,图谱的组织形式是“扁平化”的,并没有把底部概念的相互关联情况给表示出来。

 

尽管 Roam Research 和 Obsidian 等 PKG 工具相对较新,但它们正在快速往里面添加新功能(包括免费和收费的)。我遇到的最大挑战是在尝试与他人分享我的一部分 PKG 的时候,还有就是在微网站上发布子图谱布局的时候。现在完成这些事情还得进行比较粗糙的导入/导出操作,将我们的知识图谱合并到一个可以协作的地方。但是,我怀疑这些新功能很快就会出现。

 

当前这一代工具对我的最大挑战是子图谱可视化的方法有限。就像可以使用强大的 GraphViz 库一样,我希望能够尝试多种约束性的布局算法,并且可以操控自上而下和从左到右的布局。我想用类似配置语言那些的东西来指定这些布局规则。我想“固定”布局当中各种节点的排列,以免在我添加新的条目时那些节点会跑偏。我相信,所有这些功能日后都会出现。现在,我们可以编写 Python 脚本来获取 Markdown ,并将它们转换为 Mermaid 结构,以供发布到微型网站上面时实现自动布局。

 

这些工具也不允许我往关系里面添加类型或属性。这些特性可能也会出现在未来的版本上。请记住,就算添加一点点的语义也要有很长一段路要走。

 

对企业知识图谱市场的影响

 

节点级基于角色的访问控制(RBAC)是企业级知识共享系统的标志,比方说TigerGraph 或 Smartlogic 的 Ontology Editing 工具。

 

目前,这些 PKG 系统在形式上都是基于云的桌面工具或网站。他们没有细粒度的,基于角色的访问控制规则,所以我没法授予团队对我的 PKG 子集的读取或写入访问权限。

 

但是, PKG 的市场正在快速发展,我不相信这样一个市场会找不到这样的客户,也就是想要将笔记的自由流动性与需要正式的策划与核准的知识图谱系统相结合起来的客户。随着 API 的发展,我很容易就能看到类似 “将此子图谱发布到公司的本体服务器以供审查”这样的功能出现。

 

法律问题:你的PKG属于谁?

 

我不由得想到,随着人们建立起自己的超高质量的 PKG ,一旦与组织的知识产权问题发生纠葛的话,问题就复杂了。1980 年代,当我还在为 AT&T 贝尔实验室工作时,我们所有的书面工程笔记都要用标准的 AT&T 贝尔实验室蓝线笔记本记录,每一页都有单独的页码。对我们的要求是每个条目都要注明日期,这样我们就可以利用这些正式的笔记系统细致地保护我们的知识产权和专利。我们被告知,给笔记添加日期、加上几行文字以及一些简单的图表,这样就可以为公司节省数百万美元。然而,“个人”一词意味着你拥有自己的第二大脑。这必将引起公司法务人员对保护公司知识产权的担忧。

 

入门

 

我要表达的最后一条意见是,你可能需要一段时间才能习惯使用这些新工具。现在这些工具还有点粗糙,它们还没具备更成熟的笔记工具那样的表现性和灵活性。我的建议是要有耐心,给自己几天/几周的时间来调整这些工具,从而适应你的笔记和发布风格。尝试用不同的办法去组织你的概念,看看能不能找到一种有效的模式。

 

然后就好好享用吧!

 

译者:boxi。

Be First to Comment

发表评论

您的电子邮箱地址不会被公开。