2009.03.17 by sfufoet

RSS feed 摘要输出轻松全文

101

流量就是金钱,所以有些网站很吝啬,RSS feed 只给你看几行字,要看全文?对不起,流量送俾我先。不懂 RSS 是什么东东的读者请看 RSS 订阅如何改变我们的生活以及未来畅想

fisio 在 RSS feed 不输出全文?一样搞定你 里介绍的 GreaseMonkey 脚本,我测试了好几个 feed,一次也没成功过。(Update:Jacky 留言介绍了一个同类的脚本:這個油猴腳本 rssget 也是類似 fisio 般要自己加入想要的網站,寫個簡單抓取。因為都是給香港網友用的,所以上面大多是港台網站,可供參考 http://code.google.com/p/rssget/)煎蛋的 sein 老大在 如何用 Yahoo Pipes 制作牛博网全文 RSS 里详细介绍了强大的 Pipes。不过,也麻烦,不适合新手。我按照图文教程 Pipe 了一个百度博客的 Feed 失败。真是打击啊。

下面隆重推出史上最强最傻瓜化的 RSS feed 全文化利器:まるごとRSS。只需把博客的地址或者 RSS feed 输入到页面唯一的输入框里,然后点击 Go,全文化的 Feed 就生成了!看下图,页面还生成了相应的订阅按钮。赶紧点击 Googleリーダー,订阅到 Google Reader。注意,第一个按钮是 iGoogle。

RSS feed 摘要输出轻松全文[图] | 小众软件 > net

为什么选择 Google reader 作为阅读器?免费强大好用,能通过 https 方式访问,不用担心被 GFW 过滤。延伸阅读:RSS 阅读器,价值几何

生成的全文 Feed 效果如何?来看 Cnbeta Feed(其官方 feed 是摘要的) 对比图:上部是全文 CnBeta Feed (好像用 Pipes 生成)的一篇只有标题的文章,此全文 Feed 还是不够完美,有一些文章只输出了标题。下部是用まるごと RSS 生成的对应全文。图文并茂,缺点就是标题重复了,还有发布者发布时间也被抓取了。CnBeta 的全文 Feed 我就不写出来了,大家自己用 まるごとRSS 试试看吧。Pipes 这样强大的利器还是给不折腾会死星人去用吧。

RSS feed 摘要输出轻松全文[图] | 小众软件 > net

我还测试了一个百度博客的 Feed,也成功了。不过连评论也一并抓取了。检查了其最新的十篇文章的全文状态,发现其中有两篇文章全文失败,这是因为原文的 Html 代码有问题。成功率还是比较高的说,失败了也没什么补救的方法。

当然这个网站并不是全能的,有些摘要 Feed 可能无法全文化。对于没有 Feed 的网站,它就无能为力了。想解决这个难题,请看:如何订阅不提供 RSS Feed 输出的网站?可能吧此文还不够详细,我补充三种我自己比较喜欢的方式:

  1. FollowThatPage – 它会把页面的更新信息发送到你的邮箱,大部分的中文网站都可以识别,只有少数会乱码。
  2. Page2RSS – 把更新的那部分内容烧成一个 Feed。
  3. Update Scanner – Firefox 扩展,定时扫描页面并提示。

P.S.1 顺便介绍个安全实用方便快捷的穿墙利器 Psiphon2,具体介绍请看:GFW Blog 将长期发放 □□□ 利器 Psiphon2 的注册邀请

P.S.2 小众最近开了 Share 分类,它不会在原来的 Feed 里出现。想单独订阅 Share 分类的读者,请订阅 AppinnShare;想看全部文章的读者,请订阅这个 AppinnAll

53 Comments:

  1. 1. terababy said on: 2009/03/17 06:23

    很强!

    (0)反对 (0)

    回复

  2. 2. Mystryl said on: 2009/03/17 07:38

    h ttp://mrss.dokoda.jp/a/http/newsrss.bbc.co.uk/rss/chinese/simp/news/rss.xml

    BBC中文的全文RSS

    http://mrss.dokoda.jp/a/http/www.cnbeta.com/backend.php
    cnBeta 顺手……铜球其他曾经被我遗忘的只有摘要输出的值得一读的RSS

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @Mystryl, 弱弱的问下,你的BBC这个全文输出标题是乱码么?

    我这里用google reader 标题显示是乱码,正文内容正常

    (3)反对 (0)

    回复

    keith1st reply on 四月 29th, 2009,10:28:

    Gavatar | 小众软件

    @Mystryl, 我也遇到BBC乱码

    (0)反对 (0)

    回复

    神兽 reply on 六月 2nd, 2009,18:29:

  3. 3. 李二嫂的猪 said on: 2009/03/17 07:53

    如果不是全文,那么 GR 的快捷键还真有点白瞎……

    (1)反对 (0)

    回复

  4. 4. ichaochao said on: 2009/03/17 08:24

    的确轻松又强大~谢谢!

    (0)反对 (0)

    回复

  5. 5. =.= said on: 2009/03/17 08:25

    点击GREADER的连接后显示的还是IGOOGLE啊,而且一楼的那位提供的连接打开后是个XML文件,看不了,怎么解决啊?

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @=.=, 在 GR 里面添加那个网址。你点击错了,点击 Googleリーダー,出现两个选项,点击右边那个。

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @sfufoet, 还是那个cnbeta,我在GR里面添加了那个链接,但是CB的图片不能显示,都是小叉叉……采用第二种方法点击右边那个效果也是一样

    (0)反对 (0)

    =.= reply on 三月 17th, 2009,19:10:

    sfufoet reply on 三月 17th, 2009,09:40:

    Gavatar | 小众软件

    @=.=, 那就很奇怪了。右边那个绝对是添加到 GR 里啊说。建议清空浏览器缓存看看。

    看不了 CB 的图是因为 CB 禁止了在阅读器显示图片。用 fly2never 介绍的方法:

    @sfufoet, 我现在的解决办法是用ff插件refcontrol来伪装,可以看图了
    https://addons.mozilla.org/en-US/firefox/addon/953

    fly2never reply on 三月 17th, 2009,11:32:

    (0)反对 (0)

    回复

    sfufoet reply on 三月 17th, 2009,20:16:

  6. 6. Enson said on: 2009/03/17 08:33

    全文输出有一个好处就是原文被删除或链接改变了之后GR里面还是可以看 就当是存了个快照…

    (0)反对 (0)

    回复

  7. 7. tonie said on: 2009/03/17 08:36

    倒是个傻瓜的办法,不过我属于折腾管子的人…….呵

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @tonie, 能做一个新浪英超频道的全文输出吗?
    Feed是:http://rss.sina.com.cn/sports/global/england.xml

    (0)反对 (0)

    回复

    baomian reply on 三月 27th, 2009,21:31:

  8. 8. 破船 said on: 2009/03/17 08:39

    万恶的百度,爱死你了sfufoet。百度空间就是摘要输出。

    (0)反对 (0)

    回复

  9. 9. tonie said on: 2009/03/17 08:40

    这个用来取一些全文+评论或者论坛回复之类的倒是非常方便的.

    (0)反对 (0)

    回复

  10. 10. 赤尔 said on: 2009/03/17 08:45

    南方周末 的网站不好用 有些是全文 有些还是摘要

    (0)反对 (0)

    回复

  11. 11. 火星蜥蜴 said on: 2009/03/17 09:00

    顶火山!

    (0)反对 (0)

    回复

  12. 12. Ian said on: 2009/03/17 09:08

    谢谢~顺便又把Update Scanner装了回去。

    (0)反对 (0)

    回复

  13. 13. 抽筋儿 said on: 2009/03/17 09:17

    RSS tool的力量是无穷的~

    (0)反对 (0)

    回复

  14. 14. Jacky said on: 2009/03/17 09:39

    這個油猴腳本 rssget 也是類似 fisio 般要自己加入想要的網站,寫個簡單抓取。因為都是給香港網友用的,所以上面大多是港台網站,可供參考 http://code.google.com/p/rssget/

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @Jacky, 多谢补充。

    (0)反对 (0)

    回复

    sfufoet reply on 三月 17th, 2009,09:44:

  15. 15. oran said on: 2009/03/17 09:48

    索性退订所有摘要输出的博客。

    (0)反对 (0)

    回复

  16. 16. cdds said on: 2009/03/17 09:54

    GR一直有一个问题困扰我,在公司用https访问GR很正常,到家里,https访问就会出现错误,订阅内容里的都是很老的东西,新内容根本显示不出来,不知道是什么问题。

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @cdds, 清空浏览器缓存,更换别的浏览器试试。

    (0)反对 (0)

    回复

    sfufoet reply on 三月 17th, 2009,10:23:

  17. 17. fly2never said on: 2009/03/17 10:15

    试了一下cb的全文rss输出,貌似比pipe那个feed要好一点,只是图片仍然显示不出来

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @fly2never, 检查一下,你是不是过滤了 CB 的全部图片。我上次不小心也过滤了全部图。

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @sfufoet, 我进cb主站就可以看见.
    在feed里面只是显示一个图片地址:
    http://img.cnbeta.com/newsimg/090317/0843070308808076.jpg
    我猜也许是为了防盗链的处理吧

    (0)反对 (0)

    fly2never reply on 三月 17th, 2009,11:26:

    Gavatar | 小众软件

    @sfufoet, 我现在的解决办法是用ff插件refcontrol来伪装,可以看图了
    https://addons.mozilla.org/en-US/firefox/addon/953

    (0)反对 (0)

    fly2never reply on 三月 17th, 2009,11:32:

    sfufoet reply on 三月 17th, 2009,10:22:

  18. 18. hzq said on: 2009/03/17 10:20

    支持!小气的百度!

    (0)反对 (0)

    回复

  19. 19. GFW Blog said on: 2009/03/17 10:25

    非常感谢!期待您更多好文章。

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @GFW Blog, 呵呵,估计今天你的 Gmail 邮箱要爆炸了。

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @sfufoet, 来了很多邮件,非常感谢您。欢迎大家索取,我们累些没事:)

    (0)反对 (0)

    GFW Blog reply on 三月 17th, 2009,10:41:

    sfufoet reply on 三月 17th, 2009,10:29:

  20. 20. 雅漾 said on: 2009/03/17 10:57

    图片看不到了。。

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @雅漾, cnbeta 的 feed?昨晚我的的确确看到了,今天不知道怎么了。直接访问 CB 的图片都会出现禁止访问的提示。看来是 CB 的问题

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @sfufoet, Firefox用户可以装上RefControl这个扩展并把img.cnbeta.com这个地址加入“伪装”,就可以在Google Reader里正常显示cnBeta的图片啦。不过,cnbeta似乎本身有些图片就有问题,即使打开原文地址都不能正常显示。

    (0)反对 (0)

    KnarfJ reply on 三月 17th, 2009,11:50:

    sfufoet reply on 三月 17th, 2009,10:59:

    Gavatar | 小众软件

    @雅漾, 没图真的很不爽啊

    (0)反对 (0)

    回复

    找不着北 reply on 三月 17th, 2009,11:35:

  21. 21. 睡到自然醒blog said on: 2009/03/17 11:03

    图片看不到!

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @睡到自然醒blog, @sfufoet, Firefox用户可以装上RefControl这个扩展并把img.cnbeta.com这个地址加入“伪装”,就可以在Google Reader里正常显示cnBeta的图片啦。不过,cnbeta似乎本身有些图片就有问题,即使打开原文地址都不能正常显示。

    KnarfJ reply on 三月 17th, 2009,11:50:

    (0)反对 (0)

    回复

    sfufoet reply on 三月 17th, 2009,16:30:

  22. 22. Johnny said on: 2009/03/17 11:24

    不是太好用啊,我同学的和讯blog只输出摘要,用这个工具还是不能输出全文

    (0)反对 (0)

    回复

  23. 23. eiphinia said on: 2009/03/17 11:45

    同无效飘。。
    水煮的RSS全文失败。。。。

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @eiphinia, 哎,我那麽喜欢水煮的,不知道从哪天开始就不能全文了

    (0)反对 (0)

    回复

    fly2never reply on 三月 17th, 2009,12:03:

  24. 24. 異塵行者 said on: 2009/03/17 11:51

    這真是一個強大又好用的服務
    讓我等等也在我的部落格介紹一下吧^^

    (0)反对 (0)

    回复

  25. 25. nonenos said on: 2009/03/17 12:20

    有些网站还是喜欢去主站看的,比如CB,不能不看评论。

    (0)反对 (0)

    回复

  26. 26. muzuiget said on: 2009/03/17 12:24

    我还是用google reader full feed changer,很好用,一直在用,搞定另外几个网站,Cnbeta取消了重定向后能搞定它的全文了。但这个脚本有点问题,就是多项xpath问题,几度郁闷了我,最后小小修改一下就行了。
    http://muzuiget.blog.ubuntu.org.cn/archives/google-reader-full-feed-changer-multi-part-xpath
    我之前使用过很久的Firefox扩展Newsfox也支持获取全文,3个方式,xpath,javascript,正则表达式,对于难搞的网站可以用正则表达式由头匹配落尾。

    (0)反对 (0)

    回复

  27. 27. elion said on: 2009/03/17 12:36

    太赞了。
    CB全文输出了,效果很好。

    (0)反对 (0)

    回复

  28. 28. vern said on: 2009/03/17 12:51

    this one can’t work:

    http/rss.sina.com.cn/sports/global/focus.xml

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @vern, 搞不定的 feed,请找 pipes 机器人 sein。

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @sfufoet, sein 讓我來找你的

    我是奇怪 riku 可以搞定 新浪科技 的全文,但是 新浪體育 為什麼不行呢

    pipes 的話,新浪會亂碼

    (0)反对 (0)

    vern reply on 三月 17th, 2009,13:04:

    sfufoet reply on 三月 17th, 2009,13:00:

    Gavatar | 小众软件

    @vern, 没办法。试试 GM 脚本吧。

    (0)反对 (0)

    回复

    sfufoet reply on 三月 17th, 2009,13:18:

    Gavatar | 小众软件

    @vern, http://mrss.dokoda.jp/a/http/rss.sina.com.cn/sports/global/focus.xml

    哈哈,看你也是球迷吧。试试这个

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @ketea, 这个很好,谢谢

    (0)反对 (0)

    vern reply on 九月 8th, 2009,22:55:

    ketea reply on 九月 8th, 2009,21:03:

  29. 29. skystar said on: 2009/03/17 13:59

    日文的?忽略…

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @skystar, 说错了,日本软件?忽略…

    (0)反对 (0)

    回复

    skystar reply on 三月 17th, 2009,14:00:

    Gavatar | 小众软件

    @skystar, 你真傻。

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @sfufoet, 。。。我是希望多点国产的好软件

    (0)反对 (0)

    skystar reply on 三月 17th, 2009,20:40:

    sfufoet reply on 三月 17th, 2009,16:29:

    Gavatar | 小众软件

    @skystar, 如果国产有好货的话,我们一定极力推荐。

    可惜目前的状况就是国产的可能在安装过程耍流氓。对国产软件没兴趣,尤其是国内的下载站。点都不敢点。

    支持国产,不等于不用外国的东西,甚至厌恶日本的东西。很多中文词都是来自日本的说,这样你岂不是连话都不用讲了。

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @sfufoet, 无语一下,我不想为这事争

    (0)反对 (0)

    skystar reply on 三月 18th, 2009,11:53:

    sfufoet reply on 三月 17th, 2009,21:03:

  30. 30. e said on: 2009/03/17 15:14

    小众这么大张旗鼓地介绍,c~B不封才怪呢……
    另求一个网不易的全文……测试失败了……

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @e, 网不易有啥好看的。看煎蛋就够了。

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @sfufoet, 网不易至少比煎蛋更新少。。。

    (0)反对 (0)

    scavin reply on 三月 17th, 2009,16:53:

    sfufoet reply on 三月 17th, 2009,16:31:

    Gavatar | 小众软件

    @e, 封吧,我们生活在 GFW 下,还怕谁呢?

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @scavin, 就是就是,生活在GFW下多安全啊

    (0)反对 (0)

    芝麻 reply on 四月 8th, 2009,05:41:

    scavin reply on 三月 17th, 2009,16:55:

  31. 31. e said on: 2009/03/17 15:39

    再推个:
    http://mrss.dokoda.jp/a/http/feeds2.feedburner.com/solidot
    Solidot的RSS……原来那个就是全文,但是链接显示不了,用这个就能显示。

    (0)反对 (0)

    回复

  32. 32. seo said on: 2009/03/17 16:31

    没办法。试试 GM 脚本吧。

    (0)反对 (0)

    回复

  33. 33. 破船 said on: 2009/03/17 17:17

    GFW博客无法登录哦,我是黑龙江网通。

    w.u.gogogo=j.i.e还是很强大的,最新u94

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @破船, 把网址订阅到 GR 里,然后往后翻。

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @sfufoet, 对哦,好办法。

    (0)反对 (0)

    破船 reply on 三月 17th, 2009,17:22:

    sfufoet reply on 三月 17th, 2009,17:20:

  34. 34. 破船 said on: 2009/03/17 17:20

    GFW的博客需要 □□□ 才能进入。。。。囧rz

    (0)反对 (0)

    回复

  35. 35. aiwa99 said on: 2009/03/17 23:08

    全文了,但cnbeta的图片看不到……

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @aiwa99, 看不了 CB 的图是因为 CB 禁止了在阅读器显示图片。用 fly2never 介绍的方法:

    @sfufoet, 我现在的解决办法是用ff插件refcontrol来伪装,可以看图了
    https://addons.mozilla.org/en-US/firefox/addon/953

    fly2never reply on 三月 17th, 2009,11:32:

    (0)反对 (0)

    回复

    sfufoet reply on 三月 17th, 2009,23:15:

  36. 36. pldlr said on: 2009/03/19 10:25

    有些论坛还是无法全文,虽然说就是因为上的是论坛才想要全文的

    唉,真是纠结

    (0)反对 (0)

    回复

  37. 37. cry4u said on: 2009/03/19 22:21

    有些把整个网页都抓下来了,有什么工具可以修改吗?

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @cry4u, 没有。

    (0)反对 (0)

    回复

    sfufoet reply on 三月 24th, 2009,20:09:

  38. 38. ddd said on: 2009/03/21 13:49

    出问题了…
    订了几个页面 这几天都没有feed过来.
    实际上有更新的…原始feed也有更新啊

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @ddd, 的确不是很稳定。

    (0)反对 (0)

    回复

    sfufoet reply on 三月 24th, 2009,20:10:

  39. 39. Betty said on: 2009/03/24 20:04

    试了一下,生成的内容都是日文,汗
    标题是正常的汉字,文章内容里全是日文字符,可能是编码问题?

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @Betty, 这个我不清楚。建议试试 pipes 吧。

    (0)反对 (0)

    回复

    sfufoet reply on 三月 24th, 2009,20:09:

  40. 40. 不着疯 said on: 2009/03/26 22:39

    经测试,百度空间 重新烧录后 进google reader超赞,全文,而且竟然带意外的带上好评论!太棒了!!

    不过
    在抓虾里只能看到标题,连摘要都没得了~~~ 汗

    (0)反对 (0)

    回复

  41. 41. baomian said on: 2009/03/27 21:27

    谁能用Yahoo Pipes 做一个全文的新浪英超啊?
    http://rss.sina.com.cn/sports/global/england.xml

    (0)反对 (0)

    回复

  42. 42. tiger said on: 2009/03/29 11:39

    ddd提到的乱码问题我也遇到了,还有不更新的问题;尤其是标题乱码比较郁闷,估计是日文的缘故

    (0)反对 (0)

    回复

  43. 43. ttplay said on: 2009/04/02 01:30

    我这里也是乱码, 但不是正文,是标题。

    (0)反对 (0)

    回复

  44. 44. z.Yleo77 said on: 2009/04/03 18:56

    这个很需要,太强大了。

    (0)反对 (0)

    回复

  45. 45. leslie said on: 2009/04/27 19:41

    强!赞!多谢LZ!!!

    (0)反对 (0)

    回复

  46. 46. ytzong said on: 2009/05/05 00:26

    试下这个cnbeta全文feed
    http://feeds2.feedburner.com/cnbeta-full

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @ytzong, http://feeds2.feedburner.com/cnbeta-full 很好用

    (0)反对 (0)

    回复

    nmare reply on 一月 5th, 2010,11:15:

  47. 47. 李生 said on: 2009/07/16 21:30

    我用过滤的方法还是无法过滤链接

    (0)反对 (0)

    回复

  48. 48. gongyesheji said on: 2009/08/09 12:30

    您的共享真是太慷慨了,就是想得到rss全文

    (0)反对 (0)

    回复

  49. 49. 摩凝(M.Chan) said on: 2009/10/08 19:59

    一直沒有用它成功過。。。⊙﹏⊙b汗

    (0)反对 (0)

    回复

  50. 50. 淡烟流水 said on: 2009/12/28 00:54

    貌似现在这个网站被墙了…………唉…………不过生成的输出仍然能用。所以就 □□□ 出去得到输出网址再回来用就好。

    (0)反对 (0)

    回复

  51. 51. damo said on: 2010/03/27 22:23

    http://mrss.dokoda.jp/ 都没办法打开~

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @damo, 看 50 楼的说明。如果懒得穿,就试试 http://feedex.net/

    (0)反对 (0)

    回复

    sfufoet reply on 三月 28th, 2010,09:06:

  52. 52. CODIGG said on: 2010/03/29 00:45

    这个很需要,谢谢~~~
    能交换链接吗

    (0)反对 (0)

    回复

    Gavatar | 小众软件

    @CODIGG, 加了,在这里 http://www.appinn.com/link/

    (0)反对 (0)

    回复

    sfufoet reply on 三月 29th, 2010,09:27:

  53. 53. 全文rss said on: 2010/06/07 10:51

    全文rss生成器,低调传播:
    http://feed.rssfull.com

    (0)反对 (0)

    回复

Post a Comment

Your email is never published nor shared. Required fields are marked *

Name*

E-mail*

Website

Type your comment out: