kk-anti-reptile
是適用于基于spring-boot開(kāi)發(fā)的分布式系統(tǒng)的反爬蟲(chóng)組件
系統(tǒng)要求
- 基于 spring-boot 開(kāi)發(fā) (spring-boot1.x, spring-boot2.x 均可)
- 需要使用 redis
工作流程
kk-anti-reptile
使用基于 Servlet 規(guī)范的的 Filter 對(duì)請(qǐng)求進(jìn)行過(guò)濾,在其內(nèi)部通過(guò) spring-boot 的擴(kuò)展點(diǎn)機(jī)制,實(shí)例化一個(gè) Filter,并注入到 Spring 容器 FilterRegistrationBean
中,通過(guò) Spring 注入到 Servlet 容器中,從而實(shí)現(xiàn)對(duì)請(qǐng)求的過(guò)濾
在 kk-anti-reptile
的過(guò)濾 Filter 內(nèi)部,又通過(guò)責(zé)任鏈模式,將各種不同的過(guò)濾規(guī)則織入,并提供抽象接口,可由調(diào)用方進(jìn)行規(guī)則擴(kuò)展
Filter
調(diào)用則鏈進(jìn)行請(qǐng)求過(guò)濾,如過(guò)濾不通過(guò),則攔截請(qǐng)求,返回狀態(tài)碼 509,并輸出驗(yàn)證碼輸入頁(yè)面,輸出驗(yàn)證碼正確后,調(diào)用過(guò)濾規(guī)則鏈對(duì)規(guī)則進(jìn)行重置
目前規(guī)則鏈中有如下兩個(gè)規(guī)則
ip-rule
ip-rule
通過(guò)時(shí)間窗口統(tǒng)計(jì)當(dāng)前時(shí)間窗口內(nèi)請(qǐng)求數(shù),小于規(guī)定的最大請(qǐng)求數(shù)則可通過(guò),否則不通過(guò)。時(shí)間窗口、最大請(qǐng)求數(shù)、ip 白名單等均可配置
ua-rule
ua-rule
通過(guò)判斷請(qǐng)求攜帶的 User-Agent
,得到操作系統(tǒng)、設(shè)備信息、瀏覽器信息等,可配置各種維度對(duì)請(qǐng)求進(jìn)行過(guò)濾
命中規(guī)則后
命中爬蟲(chóng)和防盜刷規(guī)則后,會(huì)阻斷請(qǐng)求,并生成接除阻斷的驗(yàn)證碼,驗(yàn)證碼有多種組合方式,如果客戶端可以正確輸入驗(yàn)證碼,則可以繼續(xù)訪問(wèn)
![edcad0ee-02a0-11ed-ba43-dac502259ad0.png](https://file1.elecfans.com//web2/M00/95/D5/wKgaomTnDN-AO6l_AABLP4ltQ2o315.png)
驗(yàn)證碼有中文、英文字母 + 數(shù)字、簡(jiǎn)單算術(shù)三種形式,每種形式又有靜態(tài)圖片和 GIF 動(dòng)圖兩種圖片格式,即目前共有如下六種,所有類型的驗(yàn)證碼會(huì)隨機(jī)出現(xiàn),目前技術(shù)手段識(shí)別難度極高,可有效阻止防止爬蟲(chóng)大規(guī)模爬取數(shù)據(jù)
接入使用
后端接入非常簡(jiǎn)單,只需要引用 kk-anti-reptile
的 maven 依賴,并配置啟用 kk-anti-reptile
即可
加入 maven 依賴
<dependency>
<groupId>cn.keking.projectgroupId>
<artifactId>kk-anti-reptileartifactId>
<version>1.0.0-SNAPSHOTversion>
dependency>
配置啟用 kk-anti-reptile
anti.reptile.manager.enabled=true
前端需要在統(tǒng)一發(fā)送請(qǐng)求的 ajax 處加入攔截,攔截到請(qǐng)求返回狀態(tài)碼 509 后彈出一個(gè)新頁(yè)面,并把響應(yīng)內(nèi)容轉(zhuǎn)出到頁(yè)面中,然后向頁(yè)面中傳入后端接口 baseUrl 參數(shù)即可,以使用 axios 請(qǐng)求為例:
importaxiosfrom'axios';
import{baseUrl}from'./config';
axios.interceptors.response.use(
data=>{
returndata;
},
error=>{
if(error.response.status===509){
lethtml=error.response.data;
letverifyWindow=window.open("","_blank","height=400,width=560");
verifyWindow.document.write(html);
verifyWindow.document.getElementById("baseUrl").value=baseUrl;
}
}
);
exportdefaultaxios;
注意
1.apollo-client 需啟用 bootstrap
使用 apollo 配置中心的用戶,由于組件內(nèi)部用到 @ConditionalOnProperty
,要在 application.properties/bootstrap.properties
中加入如下樣例配置,(apollo-client
需要 0.10.0 及以上版本)詳見(jiàn) apollo bootstrap 說(shuō)明
https://github.com/apolloconfig/apollo/wiki/
apollo.bootstrap.enabled=true
2.需要有 Redisson 連接
如果項(xiàng)目中有用到 Redisson,kk-anti-reptile
會(huì)自動(dòng)獲取 RedissonClient
實(shí)例對(duì)象;如果沒(méi)用到,需要在配置文件加入如下 Redisson 連接相關(guān)配置
spring.redisson.address=redis://192.168.1.204:6379
spring.redisson.password=xxx
配置一覽表
在 spring-boot 中,所有配置在配置文件都會(huì)有自動(dòng)提示和說(shuō)明,如下圖
![ee18666a-02a0-11ed-ba43-dac502259ad0.png](https://file1.elecfans.com//web2/M00/95/D5/wKgaomTnDN-AZBudAAEnJRBRbOQ943.png)
所有配置都以 anti.reptile.manager
為前綴,如下為所有配置項(xiàng)及說(shuō)明
![ee362632-02a0-11ed-ba43-dac502259ad0.png](https://file1.elecfans.com//web2/M00/95/D5/wKgaomTnDN-AAwNGAADQVoWRToc892.png)
-
spring
+關(guān)注
關(guān)注
0文章
340瀏覽量
14394 -
分布式系統(tǒng)
+關(guān)注
關(guān)注
0文章
146瀏覽量
19299 -
爬蟲(chóng)
+關(guān)注
關(guān)注
0文章
82瀏覽量
7016
原文標(biāo)題:一個(gè)依賴搞定 Spring Boot 反爬蟲(chóng),防止接口盜刷!
文章出處:【微信號(hào):AndroidPush,微信公眾號(hào):Android編程精選】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
幫忙分析下這個(gè)設(shè)計(jì)的工作流程
求講解這個(gè)電路具體使用方法步驟和工作流程
Crawler:關(guān)于爬蟲(chóng)的簡(jiǎn)介、安裝、使用方法之詳細(xì)攻略
Simulink是什么?Simulink的工作流程是怎樣進(jìn)行的?
工作流環(huán)境下組件的開(kāi)發(fā)
![<b class='flag-5'>工作流</b>環(huán)境下<b class='flag-5'>組件</b>的開(kāi)發(fā)](https://file.elecfans.com/web2/M00/49/6D/pYYBAGKhtE-AAWusAAATILbRm9c478.jpg)
測(cè)試工程師工作流程有哪些
網(wǎng)絡(luò)爬蟲(chóng)的基本工作流程
工作流程圖怎么用?有哪些繪制工作流程圖的軟件
提高電氣工作流程效率的方法
NX CAD軟件:數(shù)字化工作流程解決方案(CAD工作流程)
![NX CAD軟件:數(shù)字化<b class='flag-5'>工作流程</b>解決方案(CAD<b class='flag-5'>工作流程</b>)](https://file1.elecfans.com/web2/M00/05/C8/wKgZomberEOAN841AAAsGK6TY38525.png)
評(píng)論