目标
http://www.gsxt.gov.cn/corp-query-entprise-info-xxgg-100000.html

分析
POST http://www.gsxt.gov.cn/affiche-query-area-info-paperall.html?noticeType=21&areaid=100000¬iceTitle=®Org=110000
- 参数:
- noticeType=21 通知类型, 失信企业固定21
- areaid=100000 无论在哪个区域, 固定是
100000 - noticeTitle= 通知标题, 可以为空
- regOrg= 通知的区域id, 可以从省份标签上获取
- 请求体数据:
- draw: 1 点击分页按钮的次数, 可以省略
- start: 0 起始索引号
- length: 10 长度, 固定是10, 设置多了也无效
直接访问该接口时,状态521,返回如下js混淆加密代码。
本文详细介绍了如何通过JS逆向工程获取国家企业信用信息公示系统的Cookie,包括__jsluid_h、__jsl_clearance和SECTOKEN。通过多次请求分析,解析混淆的JS代码,并在Python中利用requests和jsdom模拟浏览器环境,成功获取并传递关键Cookie,最终实现数据抓取。
订阅专栏 解锁全文
1820

被折叠的 条评论
为什么被折叠?



