[Hadoop] hm0024 - 大数据反爬项目【Lua+Spark+Redis+Hadoop框架搭建】

[复制链接]
online_admin aixure 发表于 2021-1-24 08:42:52 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
084120ibzwqqnk2l4c2346
售 价: ¥15¥234加入会员,免费下载
库 存:9999
销 量:6
源 址:
卖家服务: 正品保证 高清无密 包更新 永久使用 
客 服:QQ(早10点-晚6点)
资源详情
【课程介绍】
很多订票网站的官网在互联网提供查询、预订等服务,如:各种航空公司的官网、去哪网、携程等,有大量正常用户访问的同时,也存在大量爬虫。爬虫消耗了系统资源,但是却没有转化成销量,导致系统资源虚耗,严重时会造成系统波动,影响正常用户访问购票。 大量热门路线的好车次和航线的特价舱位吸引正常用户通过官网订票的同时,也存在大量恶意占座的非法代理(黄牛)。通过不断的订座但不支付,利用这些虚占的座位进行非法盈利,通过系统日志分析等,发现官网存在大量的非法占座会员及非会员手机号用户。 为了限制伪装技术越来越强的爬虫访问和恶意占座行为,需要开发大数据防爬工具。 项目采用Lua+Spark+Redis+Hadoop框架搭建,包含状态监控,反爬指标配置,运营指标监控展示等功能。
课程亮点:
1、数据采集使用Lua,实现并发量的最大化,尽可能的降低高并发时的数据丢失.
2、消息队列采用Kafka,实现各模块的解耦,利用Kafka的高吞吐和可持久化的特性为平台提升稳定性.
3、利用SparkStreaming实现数据的实时计算,完成从数据预处理到爬虫黑名单的计算.
4、Spark的状态监控功能,实时掌握Spark的运行状态.
5、使用SparkSQL实现数据可视化相关指标的离线计算
【网盘下载地址SVIP专享通道(电脑版访问)】
游客,如果您要查看本帖隐藏内容请回复

hm0024 - 大数据反爬项目【Lua+Spark+Redis+Hadoop框架搭建】
【课程目录】
第一章 项目概述
1课程内容
1. 系统介绍
2. 模块介绍
3. 数据流程描述
4. 逻辑架构设计
5. 功能描述
6. 系统架构
第二章 离线数据入库
1. 数据上传
2. 创建数据表
3. 数据拆分
4. 数据表加载
第三章 离线数据整理
1. 业务SQL语句编写
2. 整理SQL语句生成结果表的结构及字段
3. 根据结果表所需的字段,在原始表中抽取该字段
4. 数据加工及入库
5. 创建索引
第四章 实时数据生成及计算
1. Mysql 数据写入
2. canal 解析mysql实时数据写入本地
3. Flume收集数据将数据上传至集群
4. SparkStreaming 实时计算

温馨提示:
1、如果下载地址失效,请尽快反馈给我们,我们尽快修复。点此反馈>>
2、全站资源高清无密,课程百分百高清,完整,原画,包含所有的视频+素材+课件+源码,官方同步体验!每天更新,成为vip后可免费下载本站IT课程。点此办理会员>>
3、有任何问题,请咨询QQ:87887023
4、支持7*24小时自助购买,购买后自动发货,链接永久有效,自动更新
回复

使用道具 举报

精彩评论1

plugin
online_1_1 carson9246 发表于 2022-3-5 20:35:31 | 显示全部楼层
6666666666666666666666666
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

专注资源整合与知识分享
客服QQ

87887023

周一至周日9:00-23:00

反馈建议

点此进行反馈 kfs 在线QQ咨询
ftqrcode

扫描二维码关注我们

label_sm_90020

Powered by 优百课栈 X3.4© 2019-2025