高手过招第 5 期—合理利用网站 url 属性减少点击步骤
通常我们进入一个页面需要使用多个【鼠标点击 / 点击】组件来跳转到最终进行操作的子页面,流程涉及组件越多需要做的容错处理就越多,但是了解 url 的基本原理能够让我们减少操作步骤
基本原理:
* URL 配置 (URLconf) 就像站点的目录。它的本质是 URL 与要为该 URL 调用的视图函数之间的映射表。
* 简单来说输入不同的 url 时对应的视图函数进行处理执行逻辑后返回相应的页面;
* 部分页面设置了登录状态才能跳转;
* 登录过后 session 在本地被保存,再次打开相同站点不需要再次登录。
原理比较简单,基于以上我们仔细分析平时访问的网站,url 都是有规律可循的,如
打开百度搜索 IS-RPA,得到的 URL 为
https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&tn=baidu&wd=IS-RPA&oq=IS-RPA&rsv_pq=ed1040fe00056d37&rsv_t=1c53G0kz3NN%2FGtcCpXqoHd2FohE3ITKvtni2ZV2gUDJXPlHGyhqiv%2FhTZKI&rqlang=cn&rsv_enter=0&rsv_dl=tb&rsv_sug3=1&rsv_sug1=1&rsv_sug7=100&rsv_btype=t&rsv_sug4=701
其中存在的关键部分为 wd=IS-RPA&oq=IS-RPA(原先查询字符串 (oq) 和关键词 (wd) 都为参数),即我们的搜索内容被转化为了参数值传递给了服务器,尝试将 url 替换为【https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&tn=baidu&wd=IS-RPA&oq=IS-RPA】 可得到同样的搜索结果
所以类似于网页搜索功能的流程可以观察当前 URL 传入适合的参数
例如:
X 查查搜索艺赛旗可以输入:【https://www.qcc.com/web/search?key= 艺赛旗】
查看某天汇率可以输入:【http://www.chinamoney.com.cn/chinese/ccprnoticecontent/index.html?searchDate= 指定日期】
部分网页需要登录才能访问,利用浏览器的 session 可以进行如下操作:
这样就可以直接进入需要操作的页面了。
如果将当前网页的 cookies 过期时间延长可以实现每次打开不需要进行登录(如访问艺赛旗社区,登录过后进来时都是登录状态),可以省略登录步骤。
基于你对当前网页参数的了解甚至可以完成很多复杂的操作,如网站的排序、筛选
如上图的 URL,sort 为排序参数,ct、city 分别为类别、城市筛选参数
本期的分享就到这里啦,希望对各位小伙伴有所帮助
仔细研究网页 url 结构,会有意想不到的收获哦
活动传送门 [高手过招第五期:] 高手过招第 5 期:超实用 RPA 处理网页问题的方法与技巧 ](https://support.i-search.com.cn/article/1609748435088)
回帖内容已被屏蔽。
😏
机智