GReader Archive – Google Reader 阅读历史存档下载工具

53
1 Star2 Stars3 Stars4 Stars5 Stars(快来投票)
Loading...

GReader Archive 可以从 Google Reader 下载到订阅数据源的所有历史数据。Python 开发、跨平台,按 GPL 协议开源。@Appinn

感谢 Chemfan 同学的推荐

Google Reader 还有10天关闭,下载要抓紧。根据作者的介绍

(100+ subcription,已读 30w+ 条目)使用者,差不多花了 48 小时的时间。GReader Archive 下载的所有数据都会保存在 data 文件夹下。全部历史数据共产生了 2GB+ 的数据。

把下载的代码放在某个目录下,运行 run.py,提示输入 Google Reader 的账户信息,验证通过后即可开始下载。Linux 下一般已内建了对 Python 的支持。Windows 下可能需要另外安装 Python 组件后运行。Aulddays 在 Windows + Python 2.7 和 Linux + Python 2.6 下测试运行正常。Python 3.x 在语言上和 2.x 不太兼容,无法运行。

使用 GReader Archive 需要 python,建议前往作者页面查看详细教程

下载地址: 作者页面 | github

已有 53 条评论, 我要留言

  1. 逍遥猪葛亮说道:

    听起来好恐怖……

  2. fjsheji说道:

    再见GR!

  3. 墨菲斯托同学说道:

    保存成什么格式?XML么?

  4. Zorro说道:

    好复杂的样子……

  5. 五味子说道:

    早就转移了,哈哈

  6. Kevin说道:

    方便以后搜索用么,很少浏览之前看过的条目,有价值的直接转到evernote里了。

    • chemfan说道:

      @Kevin 订阅的很多网站已经不存在了,只有GR上有备份,如果不趁现在down下来,以后就永久消失了

  7. wswj说道:

    哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈
    有人备份CL吗

  8. 姓名xk说道:

    能下载所有星标内容就够了

  9. ttph1oc说道:

    给你们发个不用python的

    http://userscripts.org/scripts/show/170731

  10. 趴狗狗说道:

    一片片的error downloading错误啊。。。。

  11. qwerty说道:

    备份以后要怎么阅读呢?

  12. Alucard.G说道:

    100订阅30w+,要48小时?

  13. xmokay说道:

    我想知道,下载下来之后怎么浏览和 检索

  14. beyond_st说道:

    对啊。。。。往哪里导入检索啊。。。

  15. mrall说道:

    就像ls几位问的,怎么查看这些文件呢?!
    文件夹里有xml文件,但是不能直接导入阅读器里面,请问是怎么回事?

    我想把xml文件导入到阅读器里,它说:没有找到任何有效的数据,请检查OPML文件格式是否正确或是否有内容

  16. mrall说道:

    就像ls几位问的,怎么查看这些文件呢?
    文件夹里有xml文件,也有json文件,请问怎么用?

    文件夹里有xml文件,但是不能直接导入阅读器里面,请问是怎么回事?

    我想把xml文件导入到阅读器里,结果显示说:没有找到任何有效的数据,请检查OPML文件格式是否正确或是否有内容

  17. 落水的猫说道:

    时间太长了…

  18. nevermind说道:

    谁知道feedly 7月后的订阅会和google无缝对接吗?现在感觉只是调用

  19. 行者在赶路说道:

    用了一天余下载完成,2.3G。压缩下只有430M。
    试了好多方法,发现可以通过订阅所存盘的xml文件路径来导入,但必须挨个来。
    还有个很大的问题:所有的图片Archive都没有存下来!(Archive已显示所有下载已完成)。楼主何解?

    • wilson-woo说道:

      @行者在赶路 楼上能说的详细点不

    • kkleo说道:

      @行者在赶路
      请问你用什么工具导入的?

      • wswj说道:

        @kkleo
        应该任何rss阅读器都行。我在用傲游自带的看,不怎么方便。
        图片肯定不会有,都是直接加载的。两三年前的图基本挂了

        • kkleo说道:

          @wswj
          希望详细说明用傲游阅读的方法w
          我用傲游的“导入”会提示错误…直接把xml拖进去也只是用浏览器打开xml文件而已,这样只能看到一堆代码,没法阅读啊ort

          • 行者在赶路说道:

            @kkleo 要做的操作其实不是“导入”,而是“订阅”。把xml文件的绝对路径带xml本身名称,比如 E:\GReader Archive\xxx.gmail.com\小众软件00.xml 复制,而后就将这地址看作平常的订阅地址,通过“订阅”来实现导入。

    • kkleo说道:

      @行者在赶路
      谢谢!已经可以看了w

  20. mycccc说道:

    拖进opera看就行了
    肯定不会Archive图片的,那得多大啊

    • 行者在赶路说道:

      @mycccc 这opera应该属于个例吧,也难怪opera一直都将RSS当作浏览器的一部分。。。
      为啥不抓图片呐?== 离线单机伤不起。。。

  21. flyink说道:

    。。。。。。。。。。。。。。没用过py的怎么办。。。。。楼上的Chrome插件下载了,好像也没什么效果啊= =

    • 好xixi说道:

      @flyink

      根据提示,直接下载安装py就行,就可以运行.py文件了
      那个us脚本试了下,看评论,貌似是跟GR本身的规则有关,更新数超过1K,就不全面了

  22. 好xixi说道:

    同找一个能方便查看这些文件的软件

  23. chipgenius说道:

    下了好几天了。。。。还没下完…..已经6.2G+了。。。。。

  24. chipgenius说道:

    前几天还没问题,今天开始出现这个问题了:
    2013-06-28 00:42:52,203 [ERROR] Network error: The read operation timed out
    Traceback (most recent call last):
    File “run.py”, line 404, in
    main()
    File “run.py”, line 360, in main
    status, data = requester.request(url, None, 99999)
    File “run.py”, line 86, in request
    data = response.read()
    File “C:\Python27\lib\httplib.py”, line 541, in read
    return self._read_chunked(amt)
    File “C:\Python27\lib\httplib.py”, line 586, in _read_chunked
    raise IncompleteRead(”.join(value))
    httplib.IncompleteRead: IncompleteRead(3055576 bytes read)

  25. xiozf说道:

    以为作者会提供使用自定义代理功能,没想到是蛋疼的手动找IP

  26. 偶爱偶家说道:

    我来膜拜牛人的,都按G论的, 我才30M不到

  27. lentrody说道:

    371个订阅才820M……
    看来我订的个人站点太多?

  28. 汐潮说道:

    紧急求助,下了两天,刚才不小心重启了,这个软件能够接上次的地方续传吗,还是说会重新下载?

  29. 汐潮说道:

    备份之后测试了,可以续传。

  30. mmp说道:

    貌似保存成了html,json,dat文件。用firefox保存只能看到一堆代码,能保存成网页的形式,直接看到图片吗? (貌似图片没有保存)

  31. 开玩笑说道:

    下午五点到现在就已经1.32g了
    确定那个人30w+是2g?两天?
    还是2tb?

  32. opiater说道:

    谁能传我一份“玩聚”几个feed的历史缓存,我没下载成功,不胜感激,那里留存了很多记忆……

有不同想法?说说看