欢迎来到神奇下载!我们唯一域名是:www.sqxzz.com

Crawlab 官方最新版 v0.5.1

更新时间:2022-06-20 12:24:29

软件介绍

Crawlab是基于Golang的分布式爬虫管理平台,支持Python、Node、Go、Java、PHP等多种编程语言以及多种爬虫框架,分为Docker、直接部署、Kubernetes三种安装方式!

Crawlab软件特色

现在已经有一些爬虫管理框架了,因此为啥还要用Crawlab?

因为很多现有当平台都依赖于 Scrapyd,限制了爬虫的编程语言以及框架,爬虫工程师只能用 scrapy 和 python。当然,scrapy 是非常优秀的爬虫框架,但是它不能做一切事情。

Crawlab 使用起来很方便,也很通用,可以适用于几乎任何主流语言和框架。它还有一个精美的前端界面,让用户可以方便的管理和运行爬虫。

Crawlab软件介绍

Crawlab架构:

Crawlab的架构包括了一个主节点(Master Node)和多个工作节点(Worker Node),以及负责通信和数据储存的Redis和MongoDB数据库。

前端应用向主节点请求数据,主节点通过MongoDB和Redis来执行任务派发调度以及部署,工作节点收到任务之后,开始执行爬虫任务,并将任务结果储存到MongoDB。架构相对于v0.3.0之前的Celery版本有所精简,去除了不必要的节点监控模块Flower,节点监控主要由Redis完成。

主节点

主节点是整个Crawlab架构的核心,属于Crawlab的中控系统。主节点负责与前端应用进行通信,并通过Redis将爬虫任务派发给工作节点。同时,主节点会同步(部署)爬虫给工作节点,通过Redis和MongoDB的GdFS。

工作节点

工作节点的主要功能是执行爬虫任务和储存抓取数据与志,并且通过Redis的PubSub跟主节点通信。通过增加工作节点数量,Crawlab可以做到横向扩展,不同的爬虫任务可以分配到不同的节点上执行。

MongoDB

MongoDB是Crawlab的运行数据库,储存有节点、爬虫、任务、定时任务等数据,另外GdFS文件储存方式是主节点储存爬虫文件并同步到工作节点的中间媒介。

Redis

Redis是非常受欢迎的Key-Value数据库,在Crawlab中主要实现节点间数据通信的功能。例如,节点会将自己通过HSET储存在Redis的nodes哈希列表中,主节点根据哈希列表来判断在线节点。

前端

前端是一个基于Vue-Element-Admin的单页应用。其中重用了很多Element-UI的控件来支持相应的展示。

Crawlab

Crawlab

Crawlab免费版下载

Crawlab免费版下载

近期热门

1
烽火HG680KA刷机包是专门针对同名烽火机顶盒的刷机固件,此固件内置当贝市场,去除应用安装限制,实现自由安装 […]
2
KMSpico(KMS激活工具)免费下载是属于系统软件的一款电脑软件,神奇下载小编给各位带来了KMSpico( […]
3
ASUS Fan Xpert是一款多功能风扇调节工具,此工具针对华硕而开发,它只对华硕电脑管用,如果用户使用的 […]
4
tocad raster design 2022是一款光栅编辑软件,可以将你拍摄的地形图像、地图、航拍影像添加 […]
5
Time Boss是一款轻量级的电脑使用时间限制软件,随附各种计算机、浏览器和Messenger时间限制,可帮 […]
6
Open Hardware Monitor 是一款非常实用的硬件检测程序,它可以检测CPU、显卡、硬盘的温度, […]
7
Glary Tracks Eraser免费下载主要用于系统软件的电脑软件,神奇下载小编接下来针对Glary T […]
8
虚幻4引擎汉化官方最新版是一个虚幻游戏引擎的高度成熟的工具,软件提供了制作广袤的开放世界、虚拟现实体验及您脑海 […]
9
AlReader免费下载是属于系统软件的一款电脑软件,神奇下载小编给大家带来了AlReader下载以及软件相关 […]
10
Easy Cat Timer是一款超级Q萌,使用起来非常的简单猫咪计时器,只需要输入一个数字,点击[开始]按钮 […]

声明:本站所有软件和文章来自互联网 如有异议 请与本站联系 本站为非赢利性网站 不接受任何赞助 转载需标注!

Copyright © 2018-2023 All Rights Reserved. 神奇下载网站备案编号:苏ICP备12036411号

抵制不良游戏软件,拒绝盗版。 注意自我保护,谨防受骗上当。 适度娱乐益脑,沉迷伤身。合理安排时间,享受健康生活。

共 22 次查询,耗时 1.016 秒