1
chroming 2019-08-02 10:30:46 +08:00
应该只是做了网站正文检测和匹配,没标准
|
3
fansangg 2019-08-02 10:45:35 +08:00
|
4
winddweb 2019-08-02 11:04:36 +08:00
Reader 只是 Safari 的一个功能,和其他浏览器的插件一起应该都是各自独立的实现。要说标准的话,有一个概念叫语义化,semantic HTML。也就是不同的内容,以结构性放入对应的 HTML tag 里,反例就是所有内容全部放在 div 里。再辅助以 microdata 等 metadata 信息( css class 名之类的也算),剩下的就看各个插件,依靠常识来判断提取内容了。
说白了就是看网站自己的代码质量了。 |
5
geelaw 2019-08-02 11:08:35 +08:00 via iPhone
方法是猜哪部分是标题 /正文 /时间 /作者 /版权信息等,再应用一个特定的 CSS 来显示。
|
6
beijiaoff 2019-08-02 11:37:10 +08:00
你自己手写一个网页也支持的。他就是智能提取文章的大段文字。
|
7
demov2 2019-08-02 11:44:44 +08:00
readability
|
8
love 2019-08-02 11:49:26 +08:00
有算法的,大致来说是 P 标签数量 /文字长度 /元素 className/A 标签数量比率等因子的组合
|