国家企业信用信息公示系统验证码破解(一)

我们一般会通过国家企业信用信息公示系统来查询企业信息,网址为 http://www.gsxt.gov.cn/index.html ,但是这个网站的验证码很让人头疼,打开网站后输入企业名称并点击查询,可能会弹出滑动验证码,也可能会弹出点击验证码。下面我们就来一步步解决这个验证码问题。
国家企业信用信息公示系统验证码破解(一)

首先,对于滑动验证码,我们可以通过 opencv 的模板匹配来解决,也可以通过接入打码平台的形式来解决;而点击验证码目前只有打码平台解决起来比较方便,因此,统一使用打码平台的形式。

打码平台我这边选择的是“超人打码”,官网为 http://www.chaorendama.com/Default.aspx ,首先注册一个账号
国家企业信用信息公示系统验证码破解(一)

然后保证账号有足够的验证码点数,不够的话可以进行充值
国家企业信用信息公示系统验证码破解(一)

有了账号,下一步我们根据接口文档 http://www.chaorendama.com/docs/?file=001-API%E4%B8%8B%E8%BD%BD%E5%8F%8A%E5%87%BD%E6%95%B0%E5%8E%9F%E5%9E%8B/03-HTTP%E6%8E%A5%E5%8F%A3%E8%AF%B4%E6%98%8E 编写相应的接口代码
fcb64cb81b144fe9aa7089f4c4b87009_Supermandama.py

我们随意选取一张验证码图片作为参数调用刚才写好的接口代码,不出意外的话得到的结果如下
国家企业信用信息公示系统验证码破解(一)
国家企业信用信息公示系统验证码破解(一)

其中 result 所对应的值为四个字按顺序所对应的坐标。
至此,验证码破解第一步算完成了。