摘要:小微企業(yè)查詢系統(tǒng)地址破解的嘗試簡(jiǎn)介最近因?yàn)橛行枰獙?duì)爬取的非上市公司進(jìn)行一個(gè)驗(yàn)證,而絕大多數(shù)的非上市公司又都是小微企業(yè),比起爬企業(yè)征信系統(tǒng)來(lái)說,還是小微企業(yè)名錄更方便一點(diǎn)特點(diǎn)基于全程破解無(wú)需下載圖片無(wú)需模擬軌跡,模式就是任性覺得不錯(cuò)幫忙一下啦
小微企業(yè)查詢系統(tǒng)git地址
破解geetest offline的嘗試簡(jiǎn)介
最近因?yàn)橛行枰獙?duì)爬取的非上市公司進(jìn)行一個(gè)驗(yàn)證,而絕大多數(shù)的非上市公司又都是小微企業(yè),比起爬企業(yè)征信系統(tǒng)來(lái)說,還是小微企業(yè)名錄更方便一點(diǎn)
特點(diǎn)基于node.js axios全程破解 無(wú)需下載圖片 無(wú)需模擬軌跡,offline模式就是任性
覺得不錯(cuò)幫忙Star一下啦~ 破解流程首先我們跟著正常獲取數(shù)據(jù)的流程走一遍
打開小微企業(yè)名錄并且打開控制臺(tái)
可以看到大概有這幾個(gè)請(qǐng)求
http://xwqy.gsxt.gov.cn/security/verify_ip http://xwqy.gsxt.gov.cn/security/verify_keyword http://xwqy.gsxt.gov.cn/pc-geetest/register?t=1516872325770
查看一下response(當(dāng)然你熟悉geetest也行)就會(huì)發(fā)現(xiàn)register就是geetest的初始化請(qǐng)求啦
返回值如下
challenge:"a1d0c6e83f027327d8461063f4ac58a61c" gt:"6146190e4171da316dbb5bcc076e2607" success:0
其中你可以發(fā)現(xiàn)success基本都是0 也就是說離線模式
什么是離線模式?基本就是geetest不參與判斷的一個(gè)狀態(tài),驗(yàn)證部分都在前臺(tái)和中間服務(wù)器完成
回去看之前系統(tǒng)下載的js 會(huì)發(fā)現(xiàn)兩個(gè)geetest提供的js
geetest.0.0.0.js
offline.6.0.0.js
這幾個(gè)源文件也提供在項(xiàng)目中了
滑塊拼合
發(fā)送了一個(gè)新的驗(yàn)證請(qǐng)求
http://xwqy.gsxt.gov.cn/pc-geetest/validate request如下: geetest_challenge:a1d0c6e83f027327d8461063f4ac58a61c geetest_validate:010886ec_0084e_10100077776e geetest_seccode:010886ec_0084e_10100077776e|jordan
既然是offline 那就分析offline.js唄
查看代碼就能看到這句
return c >= f - 3 && c <= f + 3 ? { success: !0, message: "success", validate: b.A(c, e.d.challenge) + "_" + b.A(a.b("rand0", e.c), e.d.challenge) + "_" + b.A(a.b("rand1", e.c), e.d.challenge), score: Math.round(d / 200) } : {success: 0, message: "fail"}
這不就是我們要的么!
validate: b.A(c, e.d.challenge) + "_" + b.A(a.b("rand0", e.c), e.d.challenge) + "_" + b.A(a.b("rand1", e.c), e.d.challenge),
offline.6.0.0.js和offline.5.0.0.js可以看出一樣是通過密鑰 rand rand1進(jìn)行加密獲取一個(gè)值,一半來(lái)說這種方案就是得依靠收集案例倒推,但是我們是不會(huì)重復(fù)造輪子的
github關(guān)鍵詞一搜就能發(fā)現(xiàn)已經(jīng)有人整理好了"https://github.com/9468305/python-script/blob/master/geetest_offline/util.py"
所以那就用唄
后續(xù)就只是涉及到爬蟲以及頁(yè)面跳轉(zhuǎn)的問題了,具體可以看util內(nèi)的代碼
而且在micro_lib內(nèi)也可以直接搜索 發(fā)送驗(yàn)證的地址改為http://xwqy.gsxt.gov.cn/mirco...
并相應(yīng)修改傳入的值即可
organId:100000 textfield:encode后的關(guān)鍵詞 fwId:1400 searchOrganId: channelId:99 captcha: geetest_challenge:3ef815416f775098fe977004015c619332 geetest_validate:010886ec_0084e_10100077776e geetest_seccode:010886ec_0084e_10100077776e|jordanrestful-api 已經(jīng)做了一個(gè)api形式的 直接在url內(nèi)打入關(guān)鍵詞即可爬取 運(yùn)行步驟
npm install npm run start curl http://127.0.0.1:4001/公司關(guān)鍵詞
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/92803.html
摘要:國(guó)家企業(yè)信用公示系統(tǒng)的爬取網(wǎng)站分析獲取首頁(yè)通過直接請(qǐng)求網(wǎng)站首頁(yè),返回錯(cuò)誤提示碼,返回結(jié)果是代碼。驗(yàn)證碼識(shí)別開發(fā)者文檔代碼結(jié)果查詢企業(yè)在首頁(yè)的源代碼中,有一句注釋偽造極驗(yàn)變量百度成功獲取到結(jié)果鏈接國(guó)家企業(yè)信用公示系統(tǒng)爬取 國(guó)家企業(yè)信用公示系統(tǒng)的爬取 1. 網(wǎng)站分析 1.1 獲取首頁(yè) 通過 requests.get 直接請(qǐng)求網(wǎng)站首頁(yè),返回 521 錯(cuò)誤提示碼,返回結(jié)果是js代碼。這是采用...
摘要:下面我們便來(lái)講種驗(yàn)證碼的識(shí)別方式和一些思路。哈哈庫(kù)其實(shí),驗(yàn)證碼識(shí)別歸根到底還是對(duì)各種各樣圖片的識(shí)別和操作,中有很對(duì)圖像處理的庫(kù),其中就是其中之一。所以在處理驗(yàn)證碼識(shí)別之前,必須先了解庫(kù)和。第五步,按照規(guī)定軌跡進(jìn)行拖動(dòng),完成驗(yàn)證。 寫在前面 現(xiàn)在,很多網(wǎng)站采取各種各樣的措施來(lái)反爬蟲,其中之一就是使用驗(yàn)證碼。當(dāng)我們?cè)L問網(wǎng)頁(yè)時(shí),必須先通過驗(yàn)證碼才能夠訪問頁(yè)面。下面我們便來(lái)講2種驗(yàn)證碼的識(shí)別方...
摘要:下面我們便來(lái)講種驗(yàn)證碼的識(shí)別方式和一些思路。哈哈庫(kù)其實(shí),驗(yàn)證碼識(shí)別歸根到底還是對(duì)各種各樣圖片的識(shí)別和操作,中有很對(duì)圖像處理的庫(kù),其中就是其中之一。所以在處理驗(yàn)證碼識(shí)別之前,必須先了解庫(kù)和。第五步,按照規(guī)定軌跡進(jìn)行拖動(dòng),完成驗(yàn)證。 寫在前面 現(xiàn)在,很多網(wǎng)站采取各種各樣的措施來(lái)反爬蟲,其中之一就是使用驗(yàn)證碼。當(dāng)我們?cè)L問網(wǎng)頁(yè)時(shí),必須先通過驗(yàn)證碼才能夠訪問頁(yè)面。下面我們便來(lái)講2種驗(yàn)證碼的識(shí)別方...
摘要:下面我們便來(lái)講種驗(yàn)證碼的識(shí)別方式和一些思路。哈哈庫(kù)其實(shí),驗(yàn)證碼識(shí)別歸根到底還是對(duì)各種各樣圖片的識(shí)別和操作,中有很對(duì)圖像處理的庫(kù),其中就是其中之一。所以在處理驗(yàn)證碼識(shí)別之前,必須先了解庫(kù)和。第五步,按照規(guī)定軌跡進(jìn)行拖動(dòng),完成驗(yàn)證。 寫在前面 現(xiàn)在,很多網(wǎng)站采取各種各樣的措施來(lái)反爬蟲,其中之一就是使用驗(yàn)證碼。當(dāng)我們?cè)L問網(wǎng)頁(yè)時(shí),必須先通過驗(yàn)證碼才能夠訪問頁(yè)面。下面我們便來(lái)講2種驗(yàn)證碼的識(shí)別方...
摘要:那么,除了企業(yè)微信和這種落地場(chǎng)景,還有哪些值得投資的業(yè)務(wù)場(chǎng)景分析機(jī)構(gòu)預(yù)測(cè),到年,美國(guó)低代碼開發(fā)的市場(chǎng)規(guī)模將到億美元。相比2015年企業(yè)服務(wù)元年,VC炒紅了整個(gè)SaaS創(chuàng)業(yè)市場(chǎng),2018年卻眼見SaaS投資遇冷,SaaS創(chuàng)業(yè)退潮,SaaS企業(yè)兩難——不是選擇戰(zhàn)略投資遭遇自主發(fā)展難題,就是面臨增長(zhǎng)瓶頸生存壓力而紛紛裁員……悲觀者認(rèn)為,中國(guó)SaaS領(lǐng)域很難突破,這種負(fù)面情緒甚至波及整個(gè)企業(yè)級(jí)創(chuàng)業(yè)市...
閱讀 2570·2021-09-30 10:00
閱讀 3505·2021-09-22 10:54
閱讀 6274·2021-09-07 10:28
閱讀 2957·2019-08-29 13:53
閱讀 753·2019-08-29 12:42
閱讀 968·2019-08-26 13:51
閱讀 1266·2019-08-26 13:32
閱讀 3029·2019-08-26 10:39