vfence
小狐狸
小狐狸
  • UID56793
  • 注册日期2018-12-27
  • 最后登录2021-06-07
  • 发帖数42
  • 经验36枚
  • 威望0点
  • 贡献值8点
  • 好评度5点
阅读:16688回复:86

firefox 插件 scrapbee

楼主#
更多 发布于:2018-12-29 08:09
firefox 插件 scrapbee https://addons.mozilla.org/zh-CN/firefox/addon/scrapbee/
功能类似 scrapbook, 抓取网页到本地方便记录和管理.
欢迎试用

最新喜欢:

yfdyh000yfdyh0... stainstain fang5566fang55... l10xl10x
vfence
小狐狸
小狐狸
  • UID56793
  • 注册日期2018-12-27
  • 最后登录2021-06-07
  • 发帖数42
  • 经验36枚
  • 威望0点
  • 贡献值8点
  • 好评度5点
1楼#
发布于:2020-12-23 08:35
2.2.0 发布, 冒个泡
vfence
小狐狸
小狐狸
  • UID56793
  • 注册日期2018-12-27
  • 最后登录2021-06-07
  • 发帖数42
  • 经验36枚
  • 威望0点
  • 贡献值8点
  • 好评度5点
2楼#
发布于:2019-11-26 13:35
eagle5678:很多网站都只保存页面名?没有内容回到原帖
目前没发现有这个问题
vfence
小狐狸
小狐狸
  • UID56793
  • 注册日期2018-12-27
  • 最后登录2021-06-07
  • 发帖数42
  • 经验36枚
  • 威望0点
  • 贡献值8点
  • 好评度5点
3楼#
发布于:2019-11-26 13:35
beanfire:就是因为没有scrapbook这个扩展,所以不愿意换新版的火狐,感谢大神的作品,辛勤付出,不过还有一些使用不方便。
希望像以前scrapbook一样,把选中的网页内容,鼠标右键,然后选择最近使用的几个文件夹,内容保存到对应的文件夹中,
这样...
回到原帖
请用新版, 高级模式提供类似的功能
vfence
小狐狸
小狐狸
  • UID56793
  • 注册日期2018-12-27
  • 最后登录2021-06-07
  • 发帖数42
  • 经验36枚
  • 威望0点
  • 贡献值8点
  • 好评度5点
4楼#
发布于:2019-07-31 08:01
eagle5678:你好

https://www.huxiu.com/

这个改版后,内容保存不了
回到原帖
1.8.3 应该可以了
vfence
小狐狸
小狐狸
  • UID56793
  • 注册日期2018-12-27
  • 最后登录2021-06-07
  • 发帖数42
  • 经验36枚
  • 威望0点
  • 贡献值8点
  • 好评度5点
5楼#
发布于:2019-07-11 15:46
leave:红点点了会消失,但重启firefox之后又有红点了。我说的是这个意思。。回到原帖
应该是产生了Bug, 谢谢提示
vfence
小狐狸
小狐狸
  • UID56793
  • 注册日期2018-12-27
  • 最后登录2021-06-07
  • 发帖数42
  • 经验36枚
  • 威望0点
  • 贡献值8点
  • 好评度5点
6楼#
发布于:2019-07-10 08:22
eagle5678:http://www.bian-wang.com/discuz/home.php?mod=space&uid=10005&do=blog&id=1124

所得内容不正常?
回到原帖
我这抓取的过程比较长, 某些情况会导致抓取是有损失的,抓取过程可以理解为对原页面的一种近似, 很难保证100%吻合
vfence
小狐狸
小狐狸
  • UID56793
  • 注册日期2018-12-27
  • 最后登录2021-06-07
  • 发帖数42
  • 经验36枚
  • 威望0点
  • 贡献值8点
  • 好评度5点
7楼#
发布于:2019-07-10 08:09
leave:非常感谢楼主的作品,我居然才看到这个帖子。。

我之前的数据是scraobookq的,能支持吗?我试了下直接指定scrapbookq的那个rdf,老数据没导进来。rdf里面的内容已经空了。

另外每次启动firefox scrapb...
回到原帖
scrapbee是兼容scrapbook的, 而scrapbookq应该也是, 所以scrapbee应该能兼容scrapbookq的rdf, 但是这是理论上的, 操作前建议备份. chrome不支持侧边栏, 而这是scrapbook/scrapbee 的精髓所在, 暂时不知道如何在chrome中应该以什么形式实现, 网页资源指图片什么的吧? 这个主要是为了方便处理, 尤其是当存在 abc/def.jpg, xyz/def.jpg 这样的同名资源时,更典形的是有的资源没有文件名,另一方面,网页处理的一大难点就是容易有预见不到的地方,  所以采取了比较粗暴但统一处理(重命名)的方式, 那个红点点击后会消失
vfence
小狐狸
小狐狸
  • UID56793
  • 注册日期2018-12-27
  • 最后登录2021-06-07
  • 发帖数42
  • 经验36枚
  • 威望0点
  • 贡献值8点
  • 好评度5点
8楼#
发布于:2019-06-20 07:58
eagle5678:复刻不复刻是一回事,文件名这个有问题,能不能加tag回到原帖
这个不能叫有问题吧, ScrapBee是取页面标题为标题, 也就是<title></title>里的内容为准的,这个在大多数情况下都是比较合理的, 另外这个不是文件名, 就是标题, 至于tag, 以后可以考虑加
vfence
小狐狸
小狐狸
  • UID56793
  • 注册日期2018-12-27
  • 最后登录2021-06-07
  • 发帖数42
  • 经验36枚
  • 威望0点
  • 贡献值8点
  • 好评度5点
9楼#
发布于:2019-06-19 09:38
eagle5678:抓取文件名与scrapbook有差别,这样抓取微信文章,文件名是作者回到原帖
ScrapBee 不是 ScrapBook 的复刻, 但是值得借鉴的地方将来很可能会一点点加上
vfence
小狐狸
小狐狸
  • UID56793
  • 注册日期2018-12-27
  • 最后登录2021-06-07
  • 发帖数42
  • 经验36枚
  • 威望0点
  • 贡献值8点
  • 好评度5点
10楼#
发布于:2019-06-19 09:37
eagle5678:不能选目录?只能先激活目录回到原帖
正解, 这主要是受限于 firefox quantum 的编程环境, 倒不是说一定不能实现先选目录, 但是暂时难以实现好的效果, 另外,我感觉ScrapBee 现有的方式不失为一种更高效的方式
vfence
小狐狸
小狐狸
  • UID56793
  • 注册日期2018-12-27
  • 最后登录2021-06-07
  • 发帖数42
  • 经验36枚
  • 威望0点
  • 贡献值8点
  • 好评度5点
11楼#
发布于:2019-05-06 14:59
tulip17:试了,抓取页面正常了。抓取选区不行,试了三次,两次始终转圈,一次抓取成空白。并没出现选择区域的选择画面回到原帖
抓取选区需要先激活选区, 见help页
vfence
小狐狸
小狐狸
  • UID56793
  • 注册日期2018-12-27
  • 最后登录2021-06-07
  • 发帖数42
  • 经验36枚
  • 威望0点
  • 贡献值8点
  • 好评度5点
12楼#
发布于:2019-04-28 14:26
tulip17:能自动创建rdf文件了,是路径文件名设置问题。
但是还无法保存网页,始终在 转圈
日志里没有错误信息

已将scrapbee_backend.exe所在目录加入了win10杀毒软件白名单。
win10 64位
回到原帖
试试最新的1.6.0
vfence
小狐狸
小狐狸
  • UID56793
  • 注册日期2018-12-27
  • 最后登录2021-06-07
  • 发帖数42
  • 经验36枚
  • 威望0点
  • 贡献值8点
  • 好评度5点
13楼#
发布于:2019-03-07 08:50
重要更新, v1.4.1 新增页面修整功能, 欢迎试用
vfence
小狐狸
小狐狸
  • UID56793
  • 注册日期2018-12-27
  • 最后登录2021-06-07
  • 发帖数42
  • 经验36枚
  • 威望0点
  • 贡献值8点
  • 好评度5点
14楼#
发布于:2019-02-15 08:01
yfdyh000:密码还算靠谱吧,下载配置文件时里面留随机密码(最好长一点,避免暴力破解),并在扩展存储(以及“设置”可提供选项),请求时都加上,后端做验证。密码错误时警告,指导重新下载或手动配置后端。
在绑定127.0.0.1的情况下,风险应该降低很多了,...
回到原帖
多谢思路, 我抽空研究下, 后端确实有点大, golang编译后就是如此, 这还是用upx大幅缩减了的(最高压缩比), 而且Mac的还不行, 用了upx会损坏可执行文件, 据说是个Bug
上一页
游客

返回顶部