做了一个简单的网页工具,功能是根据用户提供的网址,返回网页的文本内容,目前是放在 vercel 上的(访问需要魔法): https://webpage2text.vercel.app/
想做这个的动机是:
1
xycool 2023-07-31 13:08:30 +08:00
直接 document.body.innerText 不就行了吗
|
2
superares 2023-07-31 13:25:41 +08:00
只能说效果不好,我用这个做的测试:
https://mp.weixin.qq.com/s/g-Ja6eZFpG1TUhMJGinEnQ |
3
ovtfkw 2023-07-31 13:35:43 +08:00
https://www.v2ex.com/t/961177#reply2
这个网站试了一下,结果文字显示不全 |
4
pansongya 2023-07-31 13:45:27 +08:00
|
5
l4ever 2023-07-31 14:00:25 +08:00
好家伙, 搞这么复杂, 还有后端.
|
6
l4ever 2023-07-31 14:00:47 +08:00
|
7
l4ever 2023-07-31 14:14:53 +08:00
javascript:document.body.innerText
收藏夹添加一个, 地址写上面内容, 点一下这个收藏夹就显示了当前页面的文本 |
8
animebing OP 1. 为什么没有使用 'document.body.innerText': 这个工具就是希望提供一个便捷的方式获得网页的纯文本内容,用的人并不需要了解 js ,浏览器的调试这些
2. 为什么需要后端:这个是和 1 相关的,由于需要获得网页的内容,但是在客户端会有 CORS 的问题,所以使用一个简单的后端来获得网页内容 |