V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
NonClockworkChen
V2EX  ›  问与答

如何使用 Selenium 保存知乎的回答为 pdf

  •  
  •   NonClockworkChen · 2023-08-14 19:46:37 +08:00 · 630 次点击
    这是一个创建于 456 天前的主题,其中的信息可能已经有所发展或是发生改变。
    #!/usr/bin/env python3

    from selenium import webdriver
    import pdfkit

    # 设置知乎回答的 URL
    answer_url = 'https://www.zhihu.com/question/613031240/answer/3126667778'

    # 使用 Selenium 打开 Chrome 浏览器
    driver = webdriver.Chrome()
    driver.get(answer_url)

    # 等待页面加载完成
    #driver.implicitly_wait(10)

    # 使用 pdfkit 将页面保存为 PDF
    pdfkit.from_file('temp.html', 'output.pdf')

    # 关闭浏览器
    driver.quit()


    chatgpt 给的答案,不太会改,跑不了
    3 条回复    2023-08-15 09:22:57 +08:00
    securityCoding
        1
    securityCoding  
       2023-08-14 19:52:39 +08:00
    1. Screenshot
    2. 图片转 pdf
    jifengg
        2
    jifengg  
       2023-08-15 08:56:46 +08:00
    selenium 是可以直接导出为 pdf 的,你可能需要设置一下浏览器打开网页的分辨率以达到预期效果,不设置的话可能是 800*600 。
    不需要额外添加 pdfkit 模块
    HUZHUANGZHUANG
        3
    HUZHUANGZHUANG  
       2023-08-15 09:22:57 +08:00
    跑不了.为啥不把跑不了的原因给 GPT? 慢慢调试,写代码都这样的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4620 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 01:05 · PVG 09:05 · LAX 17:05 · JFK 20:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.