首页 首页 资源教程 数据资源 查看内容

大数据实战项目|反爬虫系统【Lua+Spark+Redis+Hadoop框架搭建】,资源教程下载

木马童年 2020-6-18 19:30 158 0

课程名称大数据实战项目|反爬虫系统【Lua+Spark+Redis+Hadoop框架搭建】,资源教程下载课程介绍很多订票网站的官网在互联网提供查询、预订等服务,如:各种航空公司的官网、去哪网、携程等,有大量正常用户访问的同 ...

大数据实战项目|反爬虫系统【Lua+Spark+Redis+Hadoop框架搭建】

课程名称

    大数据实战项目|反爬虫系统【Lua+Spark+Redis+Hadoop框架搭建】,资源教程下载

课程介绍

很多订票网站的官网在互联网提供查询、预订等服务,如:各种航空公司的官网、去哪网、携程等,有大量正常用户访问的同时,也存在大量爬虫。爬虫消耗了系统资源,但是却没有转化成销量,导致系统资源虚耗,严重时会造成系统波动,影响正常用户访问购票。 大量热门路线的好车次和航线的特价舱位吸引正常用户通过官网订票的同时,也存在大量恶意占座的非法代理(黄牛)。通过不断的订座但不支付,利用这些虚占的座位进行非法盈利,通过系统日志分析等,发现官网存在大量的非法占座会员及非会员手机号用户。 为了限制伪装技术越来越强的爬虫访问和恶意占座行为,需要开发大数据防爬工具。 项目采用Lua+Spark+Redis+Hadoop框架搭建,包含状态监控,反爬指标配置,运营指标监控展示等功能。

课程目录

├─第01阶段

│ 01-反爬虫项目-项目七个阶段总体介绍.mp4

│ 02-反爬虫项目-项目背景介绍.avi

│ 03-反爬虫项目-企业端功能概述.avi

│ 04-反爬虫项目-项目总体数据处理流程详解.avi

│ 05-反爬虫项目-项目总体逻辑架构详解.avi

│ 06-反爬虫项目-功能介绍-数据采集详解.avi

│ 07-反爬虫项目-功能介绍-数据处理详解.avi

│ 08-反爬虫项目-功能介绍-系统监控+性能监控.avi

│ 09-反爬虫项目-功能介绍-数据可视化+流程管理+系统管理.avi

│ 10-反爬虫项目-功能介绍-补充.avi

│ 11-反爬虫项目-系统架构+技术选型+用例说明.avi

│ 12-反爬虫项目-非功能介绍(与面试相关).avi

│ 14-反爬虫项目-数据库ER图介绍.avi

│ 15-反爬虫项目-防爬规则介绍+爬虫特点.avi

│ 16-反爬虫项目-数据预处理流程详解.avi

│ 17-反爬虫项目-Openresty介绍.avi

│ 18-反爬虫项目-Openresty架构介绍.avi

│ 19-反爬虫项目-Openresty安装部署.avi

│ 20-反爬虫项目-Lua语法-编写脚本及执行.avi

│ 21-反爬虫项目-Lua语法-数据类型与变量.mp4

│ 22-反爬虫项目-Lua语法-赋值运算符与算数运算符.avi

│ 23-反爬虫项目-Lua语法-逻辑运算符与其他运算符.avi

│ 24-反爬虫项目-Lua语法-if判断与关系运算符.avi

│ 25-反爬虫项目-Lua语法-while循环与repeat循环.avi

│ 26-反爬虫项目-Lua语法-数值for循环与泛型for循环.avi

│ 27-反爬虫项目-Lua语法-函数.avi

│ 28-反爬虫项目-Lua语法-Table与模块.avi

│ 29-反爬虫项目-Nginx集成lua脚本.avi

│ 30-反爬虫项目-Lua获取Get与Post请求数据.avi

│ 31-反爬虫项目-Lua获取Header与Body数据.avi

│ 32-反爬虫项目-Openresty自带redis.lua介绍.avi

│ 33-反爬虫项目-Lua脚本读取redis数据.avi

│ 34-第一阶段总结.avi

│ 

├─第02阶段

│ 35-反爬虫项目-第二阶段介绍与kafka环境准备.avi

│ 36-反爬虫项目-Kafka生产者API回顾.avi

│ 37-反爬虫项目-Lua集成kafka第三方插件代码介绍.avi

│ 38-反爬虫项目-数据采集-Lua集成kafka流程跑通.avi

│ 39-反爬虫项目-数据采集-分区编号的计算.avi

│ 40-反爬虫项目-数据采集-用户数据采集.avi

│ 41-反爬虫项目-数据采集-服务器保护机制.mp4

│ 42-反爬虫项目-爬虫介绍-爬虫导入IDEA+爬虫效果.avi

│ 43-反爬虫项目-爬虫介绍-queryao详细介绍.avi

│ 44-反爬虫项目-爬虫介绍-css-js-html等介绍.avi

│ 45-反爬虫项目-数据预处-理用例流程介绍.avi

│ 46-反爬虫项目-创建项目引入工具类.avi

│ 47-反爬虫项目-配置文件及工具类介绍.avi

│ 48-反爬虫项目-预处理及识别代码架构介绍.avi

│ 49-反爬虫项目-Streaming消费kafka数据的两种方式.avi

│ 50-反爬虫项目-CreateDirectStream消费数据.avi

│ 51-反爬虫项目-CreateDirectStream消费数据补充.avi

│ 52-反爬虫项目-数据预处理-预处理程序入口.avi

│ 53-反爬虫项目-数据预处理-预处理程序入口优化.avi

│ 54-反扒虫项目-数据预处理-链路统计实现思路.avi

│ 55-反爬虫项目-数据预处理-链路统计-serverCount计算.avi

│ 56-反爬虫项目-数据预处理-链路统计-activeUserCount计算.avi

│ 57-反爬虫项目-数据预处理-链路统计-数据写入redis.avi

│ 58-反爬虫项目-数据预处理-链路统计-效果与总结.avi

│ 59-反爬虫项目-数据预处理-链路统计redis到mysql1.avi

│ 60-反爬虫项目-数据预处理-链路统计redis到mysql2.avi

│ 61-反爬虫项目-数据预处理-链路统计-数据库到前端展现.mp4

│ 62-第二阶段总结.avi

│ 

├─第03阶段

│ 63-反爬虫项目-数据预处理模块梳理.avi

│ 64-反爬虫项目-数据预处理-数据清洗需求分析.avi

│ 65-反爬虫项目-数据预处理-数据清洗-实现思路.avi

│ 66-反爬虫项目-数据预处理-数据清洗-读取过滤规则到程序代码.avi

│ 67-反爬虫项目-数据预处理-数据清洗-规则更新流程代码.avi

│ 68-反爬虫项目-数据预处理-数据清洗-数据过滤功能代码.avi

│ 69-反爬虫项目-数据预处理-数据清洗-效果与总结.avi

│ 70-反爬虫项目-数据预处理-数据脱敏-需求及实现思路.avi

│ 71-反爬虫项目-数据预处理-数据脱敏-手机号码脱敏代码.avi

│ 72-反爬虫项目-数据预处理-数据脱敏-身份证脱敏代码.avi

│ 73-反爬虫项目-数据预处理-数据脱敏总结.avi

│ 74-反爬虫项目-数据预处理-数据拆分代码及效果.avi

│ 75-反爬虫项目-数据预处理-航线类型操作类型目标与思路.avi

│ 76-反爬虫项目-数据预处理-航线类型操作类型实现详细思路.avi

│ 77-反爬虫项目-数据预处理-航线类型操作类型-读取规则到程序.avi

│ 78-反爬虫项目-数据预处理-航线类型操作类型-更新规则.avi

│ 79-反爬虫项目-数据预处理-航线类型操作类型-逻辑判断实现.avi

│ 80-反爬虫项目-数据预处理-航线类型操作类型-效果与总结.avi

│ 81-反爬虫项目-数据预处理-单程往返-需求与思路.mp4

│ 82-反爬虫项目-数据预处理-单程往返-代码实现及效果.avi

│ 83-反爬虫项目-数据预处理-数据解析-需求与思路.avi

│ 84-反爬虫项目-数据预处理-数据解析-读取规则及加载到广播变量.avi

│ 85-反爬虫项目-数据预处理-数据解析-确定解析规则思路及效果.avi

│ 86-反爬虫项目-数据预处理-数据解析-总结及预定数据解析.avi

│ 87-第三阶段总结.avi

│ 

├─第04阶段

│ 100-反爬虫项目-数据预处理-系统监控-效果及总结.avi

│ 101-反爬虫项目-数据预处理-系统监控web界面-路径梳理.mp4

│ 102-反爬虫项目-数据预处理-系统监控web界面-系统运行情况数据来源.avi

│ 103-反爬虫项目-数据预处理-系统监控web界面-实时流量转发数据来源.avi

│ 104-反爬虫项目-数据预处理-系统监控web界面-各链路流量转发数据来源.avi

│ 105-数据预处理总结-用例及流程.avi

│ 106-数据预处理总结-代码总结.avi

│ 88-反爬虫项目-数据预处理-历史爬虫判断-需求与实现思路.avi

│ 89-反爬虫项目-数据预处理-历史爬虫判断-实现代码及效果.avi

│ 90-反爬虫项目-数据预处理-封装ProcessedData上.avi

│ 91-反爬虫项目-数据预处理-封装ProcessedData中(封装核心请求参数).avi

│ 92-反爬虫项目-数据预处理-封装ProcessedData下.avi

│ 93-反爬虫项目-数据预处理-数据推送-过滤纯查询数据.avi

│ 94-反爬虫项目-数据预处理-数据推送-代码实现.avi

│ 95-反爬虫项目-数据预处理-数据推送-效果与总结.avi

│ 96-反爬虫项目-数据预处理-系统监控-本地监控介绍.avi

│ 97-反爬虫项目-数据预处理-系统监控-创建计算方法及监控实现思路.avi

│ 98-反爬虫项目-数据预处理-系统监控-监控代码上.avi

│ 99-反爬虫项目-数据预处理-系统监控-监控代码下.avi

│ 

├─第05阶段

│ 107-反爬虫项目-爬虫识别-熟悉八个指标.avi

│ 108-反爬虫项目-爬虫识别-爬虫识别总体流程.avi

│ 109-反爬虫项目-爬虫识别-爬虫识别详细流程.avi

│ 110-反爬虫项目-爬虫识别-爬虫识别流程回顾.avi

│ 111-反爬虫项目-爬虫识别-读取预处理后的数据到爬虫识别程序.avi

│ 112-反爬虫项目-爬虫识别-封装数据成ProcessedData.avi

│ 113-反爬虫项目-爬虫识别-main方法及封装ProcesseddData总结.avi

│ 114-反爬虫项目-爬虫识别-关键页面数据读取.avi

│ 115-反爬虫项目-爬虫识别-流程规则读取.avi

│ 116-反爬虫项目-爬虫识别-流程规则读取总结.avi

│ 117-反爬虫项目-爬虫识别-爬虫识别代码实现顺序介绍.avi

│ 118-反爬虫项目-爬虫识别-IP段统计-需求及思路.avi

│ 119-反爬虫项目-爬虫识别-IP段统计-代码实现及效果.avi

│ 120-反爬虫项目-爬虫识别-IP段统计-总结.avi

│ 121-反爬虫项目-爬虫识别-IP统计需求及代码及效果.mp4

│ 122-反爬虫项目-爬虫识别-关键页面访问量-需求及实现思路.avi

│ 123-反爬虫项目-爬虫识别-关键页面访问量-实现代码及效果.avi

│ 124-反爬虫项目-爬虫识别-UA种类统计-需求及实现思路.avi

│ 125-反爬虫项目-爬虫识别-UA种类统计-代码实现及效果.avi

│ 126-反爬虫项目-爬虫识别-不同行程统计-需求及实现思路.avi

│ 127-反爬虫项目-爬虫识别-不同行程统计-代码实现及效果.avi

│ 128-反爬虫项目-爬虫识别-关键页面的cook统计-需求及思路.avi

│ 129-反爬虫项目-爬虫识别-关键页面的cook统计-代码实现及效果.avi

│ 130-反爬虫项目-爬虫识别-关键页面最小访问间隔-需求及思路.avi

│ 131-反爬虫项目-爬虫识别-关键页面最小访问间隔-上.avi

│ 132-反爬虫项目-爬虫识别-关键页面最小访问间隔-下.avi

│ 133-反爬虫项目-爬虫识别-关键页面最小访问间隔-效果及总结.avi

│ 134-反爬虫项目-爬虫识别-小于自设值的次数-需求及思路.avi

│ 135-反爬虫项目-爬虫识别-小于自设值的次数-代码实现读取默认时间.avi

│ 136-反爬虫项目-爬虫识别-小于自设值的次数-代码实现及效果.avi

│ 137-反爬虫项目-爬虫识别-小于自设值的次数-总结.avi

│ 138-第五阶段总结.avi

│ 

├─第06阶段

│ 139-反爬虫项目-爬虫识别-爬虫判断思路.avi

│ 140-反爬虫项目-爬虫识别-指标碰撞-准备数据avi.avi

│ 141-反爬虫项目-爬虫识别-指标碰撞-准备数据代码实现.avi

│ 142-反爬虫项目-爬虫识别-指标碰撞-实现思路.avi

│ 143-反爬虫项目-爬虫识别-指标碰撞-代码实现.avi

│ 144-反爬虫项目-爬虫识别-指标碰撞-代码实现总结.avi

│ 145-反爬虫项目-爬虫识别-打分.avi

│ 146-反爬虫项目-爬虫识别-爬虫判断及封装FlowScoreResult.avi

│ 147-反爬虫项目-爬虫识别-总结及效果.avi

│ 148-反爬虫项目-爬虫识别-过滤非爬虫数据.avi

│ 149-反爬虫项目-爬虫识别-过滤非爬虫数据总结.avi

│ 150-反爬虫项目-爬虫识别-爬虫数据去重.avi

│ 151-反爬虫项目-爬虫识别-爬虫写入Redis.avi

│ 152-反爬虫项目-爬虫识别-爬虫写入Redis-效果及总结.avi

│ 153-反爬虫项目-爬虫识别-Redis爬虫数据备份-准备数据.avi

│ 154-反爬虫项目-爬虫识别-Redis爬虫数据备份-代码解读.avi

│ 155-反爬虫项目-爬虫识别-Redis爬虫数据备份-效果.avi

│ 156-反爬虫项目-爬虫识别-HDFS数据恢复到Redis.avi

│ 157-反爬虫项目-爬虫识别-准备离线计算数据.avi

│ 158-反爬虫项目-爬虫识别-爬虫识别效率监控.avi

│ 159-第六阶段总结.avi

│ 

├─第07阶段

│ 160-反爬虫项目-离线计算-数据改装程序.avi

│ 161-反爬虫项目-离线计算-本地数据注册成表.avi

│ 162-反爬虫项目-离线计算-数据预处理(指标计算前).avi

│ 163-反爬虫项目-离线计算-国内查询转换率.avi

│ 164-反爬虫项目-离线计算-国际查询转换率及其他.avi

│ 165-第七阶段总结.avi

│ 

└─第08阶段

166-最终整体回顾总结(流程-ppt).avi

167-最终整体回顾总结(代码-预处理及爬虫识别).avi

168-最终整体回顾总结(代码-离线计算).avi   

大数据 互联网 数据处理 数据采集 系统监控 数据可视化
0
为您推荐
大数据时代,主要需要什么类型的人才?

大数据时代,主要需要什么类型的人才?

什么是大数据,大数据是主要指的是,无法在可承受的时间范围内用常规软件工具进行捕捉…...

数据科学,数据分析和机器学习之间,有什么本质区别?

数据科学,数据分析和机器学习之间,有什么本质区别?

我们都知道机器学习,数据科学和数据分析是未来的发展方向。有些公司不仅利用大数据帮…...

什么样的人才是大数据人才呢?我们应该怎么定义和分类?

什么样的人才是大数据人才呢?我们应该怎么定义和分类

在未来世界,国家之间、区域之间甚至是公司之间的大数据人才的争夺战,将是愈演愈烈的…...

大数据技术怎么学习,在学习大数据之前,需要具备什么基础?

大数据技术怎么学习,在学习大数据之前,需要具备什么

  大数据又称黑暗数据,是指人脑无法处理的海量数据聚合成的信息资产,在民生、IT、…...

大数据现在处于什么阶段,入行大数据,需要学习哪些基础知识?

大数据现在处于什么阶段,入行大数据,需要学习哪些基

大数据的发展历程总体上可以划分为三个重要阶段,萌芽期、成熟期和大规模应用期…...

对于大数据开发的学习,最经典的学习路线是什么?

对于大数据开发的学习,最经典的学习路线是什么?

对于现代社会,大数据开发的重要性不言而喻,通过大量的数据处理、分析获取有价值的信…...