V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
Livid
V2EX  ›  Python

pywb

  •  
  •   Livid · 6 天前 · 2195 次点击
    一个类似 Internet Archive Wayback Machine 的开源软件。

    https://github.com/webrecorder/pywb

    虽然可以很方便在本地就安装搭建,但我好奇的是,有没有人用 pywb 搭建一个面向公众服务的,类似 IA 那样的系统?

    Wayback Machine:

    https://archive.org/
    4 条回复    2024-11-03 21:45:27 +08:00
    gpt5
        1
    gpt5  
       6 天前 via iPhone
    IA 浏览一下还行,真用来找回网站挺不方便的。比如必须先充值(有最小金额限制);不等直接下载为 html
    cmdOptionKana
        2
    cmdOptionKana  
       6 天前   ❤️ 1
    类似的软件,这里有一个很不错的列表 https://github.com/ArchiveBox/ArchiveBox/wiki/Web-Archiving-Community
    AkaGhost
        3
    AkaGhost  
       5 天前
    > 有没有人用 pywb 搭建一个面向公众服务的,类似 IA 那样的系统

    面向公众服务不太可能吧,IA 那种规模的数据存储量也不是一般个人组织能承受住的。就算能撑住,能不能经住时间的考验也是个问题。
    levelworm
        4
    levelworm  
       5 天前 via Android
    分布式用 bit torrent 就行了。没人用的自然就逐渐的死掉了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1671 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 16:51 · PVG 00:51 · LAX 08:51 · JFK 11:51
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.