平时上网查资料时,发现一些写得特别好的个人博客文章会记录一下 URL ,但过一段时间想去回顾这篇文章,仅靠 URL 不太方便查找,有时好不容易找到这篇文章,但博客直接打不开了。 于是想着搭建个人资料库,整理出以下几个需求:
我目前的方案是一个网页保存一份 mhtml 和一份 html 。搜索文章时在 html 中搜索关键字,找到后打开对应的 mhtml 。这种方案数据量较少时还比较方便,现在收藏网页数越来越多了,这样用起来实在不方便。找了一圈没发现有合适的轮子,想着手开发一套资料库,但一直想不到有什么好的方案。
之前尝试过保存 html ,然后写脚本将 JS 、CSS 等外部引用内嵌。但效果不是很好,如果只针对某一种主题的网站,那没问题,但是不同网站前端得写不同的脚本,请教一下大家的个人资料库是如何存储的呢?
1
liuzhaowei55 2022-05-13 20:23:34 +08:00
onenote
|
2
ltkun 2022-05-13 20:25:15 +08:00 via Android 1
很多吧 随便举几个例子 公有服务有各种笔记 私有的我用 joplin 和 wallabag 都是浏览器插件点一下就保存了
|
3
mimzy 2022-05-13 20:25:29 +08:00 via Android
cubox
|
4
renmu123 2022-05-13 20:25:36 +08:00 via Android
全文复制到笔记软件,想自动化找个剪藏插件
|
5
monphey 2022-05-13 20:46:19 +08:00 via Android
obsidian 配合 chrome 的 markdown 剪藏插件
|
6
nuistzhou 2022-05-13 21:31:27 +08:00 via iPhone
onenote
|
7
SenLief 2022-05-13 21:35:12 +08:00
简悦可以保存到 notion
|
8
beyondex 2022-05-13 21:41:30 +08:00
我也剪藏了很多 但是 极少去看 后来养成一个习惯 就是真的很有用的 会写笔记记下来 其它 就再找一遍吧。
可能 90% 的情况是这样。 |
9
xQmQ 2022-05-13 23:08:38 +08:00 via iPhone
obsidian + 浏览器简悦插件,提供导入页面到 obsidian 的功能
|
10
sunlei 2022-05-13 23:10:55 +08:00
SingleFile + DEVONthink
|
11
Pogbag 2022-05-14 00:19:51 +08:00 via iPhone
cubox
|
12
lishuolin 2022-05-14 00:42:43 +08:00 via iPhone
DS NOTE 。前提是买一个 NAS
|
13
ZC3746 2022-05-14 01:03:43 +08:00
我的做法:
1 、在浏览器上阅读,一股脑剪辑到印象笔记里 2 、随时阅读,定期删除 3 、汇总这些文章的思想、写成一篇文章,践行。这样才是真正吃透了这些文章。 |
14
i3x 2022-05-14 09:13:07 +08:00 via Android
保存 mht 或者 html 很多站点其实是无效的。
我是页面截图+全文存数据库。。 我写了个火狐插件。点击插件图标。弹出输入框询问输入补充说明,可以不填。 然后插件就自动全屏截图。把所有的 css js html xhr 的文本拼接在一起。就不怕有文字搜不到了。是不是:真·全文搜索。 服务端是 php+mysql 。图片编码后直接存入数据库。 另外会自动保存页面上浏览器能直接“下载”的视频和 gif 。这两玩意儿是普通截图克星。 对于功能类网页没办法。 |
16
haah 2022-05-14 21:27:23 +08:00
全屏截图
|
17
shuxhan 2022-05-14 21:48:17 +08:00
碰到有用的文章的话,我都是花上一到两分钟复制到自己的笔记本中,以后用到的时候直接用关键词搜索即可
其实你这个问题可以引申为搜索功能和剪藏功能比较强大的笔记软件 |
18
efcndi 2022-05-15 00:16:12 +08:00
@i3x #14 好奇,想了解下,你说的截图是真的截成了图片格式保存吗?这玩意怎么会方便搜索文字呢,ocr 的话效率是非常低的啊。
|
19
i3x 2022-05-15 03:35:07 +08:00 via Android 1
@efcndi 我说的还不清楚么?图片用于阅读。原始版本 html css js 所有的文本拼合成一个字段用于全文搜索。虽然效率很差,但是毕竟只有自己一个人在用,慢一点也无所谓。sqlite 或者 access 都能吃得消。单关键词搜索就是秒出结果,除非模糊之类的
|
20
Danswerme 2022-05-15 09:37:28 +08:00
我一般是直接生成 pdf 保存起来
|
21
Vaspike 2022-05-16 10:30:02 +08:00
Joplin 可以,网页加个官方的剪藏插件,直接保存在本地 Joplin 里了,实测剪成 Markdown 依然可读性很强(之前剪藏过廖雪峰网站讲 flex 布局的那篇,因为有时候写前端总要去翻一翻),比如:https://imgtu.com/i/OWMdBQ
|