首先说知乎收藏夹批量下载工具

图片

以下载 这才是我喜欢的知乎 这个收藏夹为例

图片

知乎cookie放在cookie.txt文件总有人问我 cookie 到底是什么?,打开工具zhihu_collection_down 输入和页数(默认输入1),每次下载500条数据,如果要继续下,修改页数再次下载。

图片

下载的回答,文章,视频在zhihu目录下,下载的视频在video目录。

图片

下载完成后转换合成pdf依赖工具wkhtmltopdf ,需要将wkhtmltopdf.exe加入环境变量。

图片

最后生成的pdf合集大小115MB,点击左侧标题书签可以跳转到对应内容,效果见网盘  https://pan.quark.cn/s/8522433ad346

图片

顺便导出了知乎收藏夹列表目录excel,数据包含类型,标题,链接,创建时间,更新时间,简介 ,评论数,赞同数和页数(超过500条数据第2次下载的时候输入的最大页数)。

图片

下载所有知乎回答以渤海小吏为例:

图片

下载的所有回答html内容,文件名为回答日期加标题。

图片

接着将html批量转换pdf  。

图片

再将所有回答内容pdf合成一个pdf文件,大小106MB,效果见网盘https://pan.quark.cn/s/8522433ad346

图片

每个回答都有原知乎回答链接,点击左侧书签跳转到对应回答。

图片

所有知乎回答的文字导出txt ,大小只有2MB。

图片

下载所有知乎文章以半佛仙人为例 :

图片

下载的所有文章html内容,文件名为回答日期加标题。

图片

接着将html批量转换pdf。  

图片

再将所有pdf合成一个pdf文件,大小57MB,效果见网盘 https://pan.quark.cn/s/8522433ad346 

图片

每篇文章都有原知乎文章链接,点击左侧书签跳转到对应回答。

图片

所有知乎文章的文字导出txt ,大小只有2MB,可以用deepseek,豆包再分析下。

图片

也可以上传到腾讯ima知识库分析下。

苏生不惑公众号2025年都写了些什么?用知识库分析下

看小约翰如何评价宋江?宋江是一个在草莽江湖中极具手腕与魅力的组织者与操纵者

图片

图片

Logo

Agent 垂直技术社区,欢迎活跃、内容共建。

更多推荐