SBB(Sina Blog Book) – 批量下载新浪博客文章

12
1 Star2 Stars3 Stars4 Stars5 Stars (2 votes)
Loading...

SBB(Sina Blog Book) 是一个用于下载指定新浪博客作者全部文章的 Python 脚本,下载后的文章保存为 HTML 文件。@Appinn

来自大鱼老师 @bfishadow 的脚本,更多诞生过程请阅读这篇墙外文章:

SBB(Sina Blog Book) 是一个用于下载指定新浪博客作者全部文章的脚本。基于这些下载来的 HTML 文件,您可以借助 Calibre 来生成电子书,或者当作存档。请在 Python 2.7.8 下使用。

SBB(Sina Blog Book) 只有一个 .py 文件,使用方法:

SBB.py (新浪博客地址) (desc|asc)

例子:

SBB.py http://blog.sina.com.cn/gongmin desc
SBB.py http://blog.sina.com.cn/u/1239657051

排序开关是可选的,默认为按发表时间顺序排列(即 asc)。

下载的 HTML 文件会保存于当前文件夹,请注意事先将 SSB.py 放到单独的文件夹内,以防挤爆了桌面…

下载地址: https://github.com/bfishadow/SBB

已有 12 条评论, 我要留言

  1. linap说道:

    这种地方说python会的人不多吧

  2. 小兑说道:

    瑞祥博客下载器就挺不错的

  3. viko16说道:

    现在小众开始推脚本了么。。

  4. 匿名说道:

    真没看懂怎么用……

  5. 12425说道:

    好像没用多线程啊,文章多的话会超级慢的吧。

  6. xsky123说道:

    我去…没用re 也没用beautifulsoap 人才啊…

  7. Hsiaohui说道:

    能下载文章内图片么

  8. jiwinyang说道:

    求教小众及大神,python2.7 运行之后,按照例子输入地址,一直显示SyntaxError: invalid syntax
    即使是吧例子中的网址直接复制也是出错呢

  9. sxsy说道:

    2.7.10运行出错,改2.7.8可以运行,但下载一半后又出错:
    objResponse = urllib2.urlopen(strTargetBlogPostURL)
    File “C:\Python27\lib\urllib2.py”, line 127, in urlopen
    return _opener.open(url, data, timeout)
    File “C:\Python27\lib\urllib2.py”, line 404, in open
    response = self._open(req, data)
    File “C:\Python27\lib\urllib2.py”, line 422, in _open
    ‘_open’, req)
    File “C:\Python27\lib\urllib2.py”, line 382, in _call_chain
    result = func(*args)
    File “C:\Python27\lib\urllib2.py”, line 1214, in http_open
    return self.do_open(httplib.HTTPConnection, req)
    File “C:\Python27\lib\urllib2.py”, line 1184, in do_open
    raise URLError(err)
    urllib2.URLError: ;请问该怎么解决?谢谢

有不同想法?说说看