链接熔炉设计

  |   24 评论   |   3,802 浏览

背景

很多人都有收藏网络资料的习惯,常用的方式有两种:

  1. 浏览器书签
  2. 笔记软件

对于个人的知识管理这两种方式都比较有效,但是如果要将自己整理好的内容分享给其他人时,可选的方式就比较有限了,特别是当要批量分享某个类目时。

除了分享的场景,很多时候还 需要大众的力量进行资源的完善和维护 。完善意味着挖掘新的资源添加进来,维护意味着修正一些不可用的资源。这个场景下最有效的方式是通过 Wiki 进行协作编辑。

Wiki 方式主要站点是 [WiKiPedia] ,但因为维基百科是一个综合化的知识库,并且对于主题侧重的是权威性,所以一些我们觉得有帮助但比较小众的资源链接是整合不到其中的。

目前流行的一种方式是通过 [GitHub] 进行知识资源整理,比如一些关注数非常高的资源导航库(Awesome/资源合集等)。通常的协作流程是通过 Pull Request 发起,库 Owner 同意合并后就能够将 PR 发起者的变更(比如加入一个有价值的链接)同步到主库。这个协作方式略比 Wiki 复杂一些,但在程序员圈子是非常受欢迎的。

现状分析

通过观察 GitHub 上面很多实例我们发现,对于知识类型的资源共享/协同活动的共同点是: 少数人整理,多数人关注,很多 1K+ stars 的库其实贡献者很少。

以开源项目的观点来看的话,如果贡献者太少,那项目的活跃度主要依赖于 Owner,这样的开源项目是很难长远的。结合前面我们讨论的资源整理型项目来看,其他人的参与成本是非常低的(比如只需要提交链接和一段短小的说明),但是还是鲜有人参与,为什么呢?

原因至少应该有如下几点:

  1. PR 流程比较复杂,对于贡献者和 Owner 都存在 操作门槛
  2. 不能批量化进行变更,手工编辑过于 繁琐
  3. 大部分人喜欢占有(star/fork),对于 细节改进并不在意

另辟蹊径

在 GitHub 上进行资源整理和分享并不是最高效的方式,而 Wiki 也不太适合解决这个需求,我们得发明个轮子了 —— 链接熔炉

  1. 从浏览器书签导入资源链接:书签都是经过个人整理的,是 具有实用价值的资源链接 ,并且导入方式解决了手工、批量等操作繁琐的问题,当然,也支持提交单个链接
  2. 自动整理:根据大家提交的链接进行计算整理,按标签进行分类、 链接价值 进行排序,最终以一个单页面(比如程序员领域)展现给浏览者,该页面汇聚了一些标签以及每个标签最具价值的资源链接

技术关键点

  • 书签格式:以 Chrome 书签为例,导出后是一个 Netscape Bookmark 格式的 HTML 文件
  • 链接页面解析:按爬虫方式访问目标链接,跳过不可用(非 200)的链接,解析页面
  • 提取标签:按页面内容进行标签提取(接入第三方服务,例如玻森),并将标签结果和已有的标签库做匹配,抽取出最适合的标签
  • 链接评分:按搜索引擎结果(链接引用数)进行排序,引用越多说明越有价值(简化的 PageRank),还需要探索更精准的算法

结论

链接熔炉是一个自动化的链接整理系统,一旦加入了新的链接就会再计算以产生更具实时性的结果,也许以后你就只用关注这一个页面了,里面有所有分好类的高质量资源 :smile:

---- EOF ----
点击加入开源技术 Q 群 242561391,让学习和分享成为一种习惯!

评论

  • ali 回复»

    感觉好深奥啊。

  • senowang 回复»

    下次记得注册下就好了。这样永远不愁了。

  • relyn 回复»

    1473312852148

  • relyn 回复»

    帅!~发现solo的后台UI也变了哈!

  • Genji 回复»

    这个可以。

  • 88250 回复»

    发帖,然后从帖子里面提取,或者提交 repo 的地址,然后去解析 README.... 还没想好。

  • R 回复»

    束缚倒不会,信任也系统也需要不断优化改进,不过规划好是必要的。

    不知道熔炉链接怎么解析github格式,如文中所说 目前流行的一种方式是通过 GitHub 进行知识资源整理 ,上面资源好多。。。

  • 88250 回复»

    准备揉到 Sym 里面,正在开发中 :sweat_smile:

  • relyn 回复»

    有意思,目前这是想法还是产品?

  • 88250 回复»

    信任系统优先级较低,如果做早了我担心会成为束缚,我的优选确实迫在眉睫,不过这个链接熔炉更好玩,所以就先做了。。。。

  • R 回复»

    脑洞好大,是不是可以融合我的优选来一起搞。。。另外从社区来看,信任系统和我的优选这两个优先级比较高。。。

  • 88250 回复»

    是得有比较多的人提交才会见效果,所以考虑主要入口是书签导入,这样量比较大吧。另外,还可以从帖子 / 回帖里面解析链接,加速熔炉反应 :laughing:

  • huiyadanli 回复»

    这个想法好赞,是不是要有很多人把链接提交进这个“熔炉”才会有效果?

  • pianopaper 回复»

    其实,这里有一句是重点:少数人整理,多数人关注,要完完全全改善这个问题,只能是多数人整理(原创 or 再创作)

  • yangyujiao 回复»

    我没有用户····· 不是在登录状态下收藏的····

  • senowang 回复»

    现在很多浏览器不是可以同步么。比如360 你用户登录了 自动同步。。。

  • yangyujiao 回复»

    我来新公司 把原来的浏览器书签打包带来了 但是导入不到浏览器里。。。郁闷·····

  • senowang 回复»

    然后每个标签下面还有关联标签 嗯,nice

  • 88250 回复»

    初期可以不细分,一个页面就是一个大类,比如文中说的程序员。这个页面下面有各种程序员相关的标签,比如 Java、MySQL、Node.js 等,每个标签下面就是 top 50 的条目链接。

  • senowang 回复»

    链接多了,是不是很乱。有目录,有分类,标签么。。。

  • 88250 回复»

    可以做成绝世武功的目录....

  • 714593351 回复»

    这样做下来,是不是就成了一个知识库了?

  • 714593351 回复»

    这功能超级好啊!!
    自己的书签很多但是很乱,一直都是收藏,懒得整理,而且浏览起来不方便。

    感觉自己对这个功能最需要的是:分类精确,链接够广。

  • virtualpier 回复»

    感觉好高深~

发表评论

validate