YayCrawler分布式爬虫系统 v1.0源码全功能绿色商业破解版注册码迅雷下载源码下载-软件开发-java源码-YayCrawler下载-网盟

网站首页软件下载游戏下载源码下载词典软件教程攻略

　

源码	YayCrawler分布式爬虫系统 v1.0
图标
分类	源码下载-软件开发-java源码-YayCrawler下载 java源码
语言	简体中文
大小	101MB
软件类型	国产软件
发布时间
用户评分	3
备案号
官方网址
软件授权	免费软件
操作系统	Java
厂商
下载
介绍	YayCrawler分布式爬虫系统，简单使用，高级配置。可扩展，减轻开发量，能docker化，适应各种急切需求核心框架：WebMagic, Spring Boot ，MongoDB, ActiveMQ ,Spring + Quartz，Spring Jpa ， Druid，Redis， Ehcache ，SLF4J、Log4j2， Bootstrap + Jquery 等。项目目标在力所能及的情况下，最大限度的提高 Web爬虫开发人员的生产力，爬虫框架里的一股清流。主要功能基于WebMagic开发的完整的分布式爬虫框架，该框架特点如下： 1、完全分布式：由管理端(Admin)、调度端(Master)和多个Worker组成，各个组件通过Http协议通信。 2、完全配置化：通过Admin端的页面配置规则就可以爬取任何网站的数据，当然不同网站的难度不一样，会有不同的组件分别针对处理登录、验证码、封IP等问题。 3、可扩展的任务队列：任务队列由Redis实现，根据任务的状态有四种不同的任务队列：初始、执行中、成功、失败。您也可以扩展不同的任务调度算法，默认是公平调度。 4、可定义持久化方式：爬取结果中，属性数据默认持久化到MonogoDB，图片会被下载到文件服务器，当然您可以扩展更多的存储类型。 5、稳定和容错：任何一个爬虫任务都会重试和记录，只有任务真正成功了才会被移到成功队列，失败会有失败的原因描述。技术选型核心框架：Webmagic Spring boot 任务调度：Spring + Quartz 持久层框架：Spring Jpa 数据库&连接池：Alibaba Druid MongoDB MySql 缓存框架：Redis Ehcache 日志管理：SLF4J、Log4j2 前端框架： Bootstrap + Jquary 开发环境配置： 1.安装JDK8 2.安装mysql数据库，用作存储解析规则等数据，需要创建一个“yayCrawler”的数据库实例，并执行quartz相关的数据库脚本：quartz.sql(见发布包或源码)。 3.安装redis 4.安装mongoDB用于存放结果数据 5.安装ftp服务器软件ftpserver(可选，用于存放下载图片) 启动说明：导入项目，maven install 安装 Admin,Worker,Master 模块。然后生成的Jar拷贝到 crawler.worker / deploy 目录中，记住改配置文件里面的Redis,mysql mogodb 的IP ,点击start.bat启动。 (Linux & Windwos) java -jar worker.war --spring.config.location=worker_local.properties 关闭命令： (Windows) for /f "tokens=1-5 delims= " %%a in ('"netstat -ano\|findstr "^:8086""') do taskkill /f /pid %%e 各组件通信说明：一、Admin Admin层主要负责页面抽取规则配置，页面Site配置，资源管理和任务发布二、Master 分布式爬虫的控制中心，接受Admin发布的任务，并分派任务给worker执行。 2.1、接收发布任务 2.2、接受Worker的注册三、Worker 真正干事情的苦逼青年，接受Master分派的任务并执行，定时向Master汇报心跳
截图
随便看	拓网资源共享系统软件 v1.0 【上传下载】爱书吧小说下载联盟在线上传系统升级版推荐软件·拓网资源共享系统 v1.0 梦寒居土豆电影采集V3.0 T5566优酷视频小偷飞跃土豆电影小偷程序小妖在线投票系统 v4.0 人物图片投票评选系统 v3.1 迅易企业网站管理系统AmeavWebSite 落叶冰点万能企业网站生成系统 v8.5.2 飞鸟网站管理系统 v1.0 企业网站智能管理系统(TZIMS) v6.1 蓝雨博客(加入防盗处理 ) Lyb流口水迷你博客(多用户) 飞天论坛FTBBS ASP v7.0 静态GBK版 bulid 081226 亿人网络GEBBS[英文论坛] 仿MOP对开式论坛程序随缘网络留言本 v2.0 build 20120127 信友 asp 拼客程序 v3.0 MSMAX博客系统 v4.0 build 110729 栽豆迷你博客 MiniBlog v3.0 【正式版】 Adn Video Cms视频收藏专家 v3.6 【标准版】要TV音乐网 v6.0 看你能坚持多久小游戏 TXT文本分割器 V1.0 安装版音鹿(音频软件) v1.0.0 安卓版 HJ-Split(HJSplit) v3.0 文件分割合并工具英文绿色版诚信通电动车行业管理系统 v6.0 官方安装免费版批量横断面绘制软件(RoadHdm) v2.3 官方免费版石开通用LED显示系统 v1.05 官方安装免费版爱普生Epson L18058 打印机驱动 v3.02.00 官方版 PowerMatte(AE智能抠图插件) v2.0.1 汉化中文版(附教程) 三星G9009D手机USB驱动程序官方版三星G9009D线刷包/官方可救砖 5.0 附线刷机教程欢乐盖大楼 v1.4.0 安卓版消灭时间按键 v0.9.3 安卓版三国劫 v1.5.0.4 安卓版诅咒世界大冒险 v2.2 安卓版窃贼小猫 v1.0.0 安卓版克隆工厂 v1.0.3 安卓版神树小奇兵:罗宾之怒 v1.0.0 安卓版弹头风暴(原《枪战联盟》) v1.0.0.6 安卓版全民红警3D v1.0.1 安卓版帝国舰队口袋版 v3.1.003 安卓版 stubbornly Gibbs free energy ebbs ebbtide hubbub lobby for hobby farm bobby socks webby scrubby

　

网盟提供免费网站源码下载(asp源码，php源码，.net源码)，源码动态，使用教程和源码评测；为站长推介有价值的源码，为开发者宣传源码作品。

　

Copyright © 2002-2024 cnnbu.com All Rights Reserved
更新时间：2026/7/19 0:53:55