GReader Archive – Google Reader 阅读历史存档下载工具

Google 2013/06/20 scavin 53

GReader Archive 可以从 Google Reader 下载到订阅数据源的所有历史数据。Python 开发、跨平台，按 GPL 协议开源。@Appinn

感谢 Chemfan 同学的推荐

Google Reader 还有10天关闭，下载要抓紧。根据作者的介绍

（100+ subcription，已读 30w+ 条目）使用者，差不多花了 48 小时的时间。GReader Archive 下载的所有数据都会保存在 data 文件夹下。全部历史数据共产生了 2GB+ 的数据。

把下载的代码放在某个目录下，运行 run.py，提示输入 Google Reader 的账户信息，验证通过后即可开始下载。Linux 下一般已内建了对 Python 的支持。Windows 下可能需要另外安装 Python 组件后运行。Aulddays 在 Windows + Python 2.7 和 Linux + Python 2.6 下测试运行正常。Python 3.x 在语言上和 2.x 不太兼容，无法运行。

使用 GReader Archive 需要 python，建议前往作者页面查看详细教程

相关链接: 作者页面 | github

Google Reader

53 条留言

逍遥猪葛亮 2013/06/20 回复

听起来好恐怖……
fjsheji 2013/06/20 回复

再见GR！
墨菲斯托同学 2013/06/20 回复

保存成什么格式？XML么？

insn 2013/06/20 回复

@墨菲斯托同学
会保存为00X.xml格式，现在正在下载中。。。
chemfan 2013/06/20 回复

@墨菲斯托同学
是的

Zorro 2013/06/20 回复

好复杂的样子……
五味子 2013/06/20 回复

早就转移了，哈哈
Kevin 2013/06/20 回复

方便以后搜索用么，很少浏览之前看过的条目，有价值的直接转到evernote里了。

chemfan 2013/06/20 回复

@Kevin 订阅的很多网站已经不存在了，只有GR上有备份，如果不趁现在down下来，以后就永久消失了

wswj 2013/06/20 回复

哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈
有人备份CL吗

wswj 2013/06/20 回复

@wswj
我单开一个马甲来备份吧，反正是通用的，再弄个好点的编辑器。完美了
篱落 2013/06/21 回复

@wswj 我倒是订阅了的

wswj 2013/06/22 回复

@篱落
下完了。一个总的加三个分版块rss。共1.3G。看了下最早是09年的的帖子

Paladin 2013/06/27 回复

@wswj
大神啊…ORZ

姓名xk 2013/06/20 回复

能下载所有星标内容就够了
ttph1oc 2013/06/20 回复

给你们发个不用python的

http://userscripts.org/scripts/show/170731

chipgenius 2013/06/20 回复

@ttph1oc userscripts.org是不是挂了，我这里直连or挂代理都访问不了
foxsheep 2013/06/20 回复

求教，下载得到的json怎么才能方便的浏览呢
wingmancn 2013/06/21 回复

@ttph1oc
万分感谢
nevermind 2013/06/21 回复

@ttph1oc 安装了不会用啊
Tomi_lla 2013/06/26 回复

@ttph1oc 好人，原来的主帐号有两步验证，无法使用该py

趴狗狗 2013/06/20 回复

一片片的error downloading错误啊。。。。
qwerty 2013/06/20 回复

备份以后要怎么阅读呢？
Alucard.G 2013/06/20 回复

100订阅30w+,要48小时？
xmokay 2013/06/20 回复

我想知道，下载下来之后怎么浏览和检索
beyond_st 2013/06/20 回复

对啊。。。。往哪里导入检索啊。。。
mrall 2013/06/21 回复

就像ls几位问的，怎么查看这些文件呢？！
文件夹里有xml文件，但是不能直接导入阅读器里面，请问是怎么回事？

我想把xml文件导入到阅读器里，它说：没有找到任何有效的数据，请检查OPML文件格式是否正确或是否有内容
mrall 2013/06/21 回复

就像ls几位问的，怎么查看这些文件呢？
文件夹里有xml文件，也有json文件，请问怎么用？

文件夹里有xml文件，但是不能直接导入阅读器里面，请问是怎么回事？

我想把xml文件导入到阅读器里，结果显示说：没有找到任何有效的数据，请检查OPML文件格式是否正确或是否有内容
落水的猫 2013/06/21 回复

时间太长了…
nevermind 2013/06/21 回复

谁知道feedly 7月后的订阅会和google无缝对接吗？现在感觉只是调用

mulang 2013/06/24 回复

@nevermind

现在feedly搞了个feedly cloud，用户可以把自己的gr数据统统的搞到它的云里了。。。

行者在赶路 2013/06/22 回复

用了一天余下载完成，2.3G。压缩下只有430M。
试了好多方法，发现可以通过订阅所存盘的xml文件路径来导入，但必须挨个来。
还有个很大的问题：所有的图片Archive都没有存下来！（Archive已显示所有下载已完成）。楼主何解？

wilson-woo 2013/06/22 回复

@行者在赶路楼上能说的详细点不
kkleo 2013/06/22 回复

@行者在赶路
请问你用什么工具导入的？

wswj 2013/06/22 回复

@kkleo
应该任何rss阅读器都行。我在用傲游自带的看，不怎么方便。
图片肯定不会有，都是直接加载的。两三年前的图基本挂了

kkleo 2013/06/23 回复

@wswj
希望详细说明用傲游阅读的方法w
我用傲游的“导入”会提示错误…直接把xml拖进去也只是用浏览器打开xml文件而已，这样只能看到一堆代码，没法阅读啊ort

行者在赶路 2013/06/23

@kkleo 要做的操作其实不是“导入”，而是“订阅”。把xml文件的绝对路径带xml本身名称，比如 E:\GReader Archive\xxx.gmail.com\小众软件00.xml 复制，而后就将这地址看作平常的订阅地址，通过“订阅”来实现导入。

kkleo 2013/06/24 回复

@行者在赶路
谢谢！已经可以看了w

mycccc 2013/06/23 回复

拖进opera看就行了
肯定不会Archive图片的,那得多大啊

行者在赶路 2013/06/23 回复

@mycccc 这opera应该属于个例吧，也难怪opera一直都将RSS当作浏览器的一部分。。。
为啥不抓图片呐？== 离线单机伤不起。。。

flyink 2013/06/26 回复

。。。。。。。。。。。。。。没用过py的怎么办。。。。。楼上的Chrome插件下载了，好像也没什么效果啊= =

好xixi 2013/06/27 回复

@flyink

根据提示，直接下载安装py就行，就可以运行.py文件了
那个us脚本试了下，看评论，貌似是跟GR本身的规则有关，更新数超过1K，就不全面了

好xixi 2013/06/27 回复

同找一个能方便查看这些文件的软件
chipgenius 2013/06/27 回复

下了好几天了。。。。还没下完…..已经6.2G+了。。。。。
chipgenius 2013/06/28 回复

前几天还没问题，今天开始出现这个问题了：
2013-06-28 00:42:52,203 [ERROR] Network error: The read operation timed out
Traceback (most recent call last):
File “run.py”, line 404, in
main()
File “run.py”, line 360, in main
status, data = requester.request(url, None, 99999)
File “run.py”, line 86, in request
data = response.read()
File “C:\Python27\lib\httplib.py”, line 541, in read
return self._read_chunked(amt)
File “C:\Python27\lib\httplib.py”, line 586, in _read_chunked
raise IncompleteRead(”.join(value))
httplib.IncompleteRead: IncompleteRead(3055576 bytes read)
xiozf 2013/06/28 回复

以为作者会提供使用自定义代理功能，没想到是蛋疼的手动找IP
偶爱偶家 2013/06/29 回复

我来膜拜牛人的,都按G论的, 我才30M不到
lentrody 2013/06/29 回复

371个订阅才820M……
看来我订的个人站点太多？
汐潮 2013/06/29 回复

紧急求助，下了两天，刚才不小心重启了，这个软件能够接上次的地方续传吗，还是说会重新下载？
汐潮 2013/06/29 回复

备份之后测试了，可以续传。
mmp 2013/06/30 回复

貌似保存成了html,json,dat文件。用firefox保存只能看到一堆代码，能保存成网页的形式，直接看到图片吗？（貌似图片没有保存）
开玩笑 2013/07/01 回复

下午五点到现在就已经1.32g了
确定那个人30w+是2g？两天？
还是2tb？
opiater 2013/07/02 回复

谁能传我一份“玩聚”几个feed的历史缓存，我没下载成功，不胜感激，那里留存了很多记忆……

分享

相关

53 条留言

写留言