回帖 - linping - 艺赛旗社区

公司会配置 logstash 的人非常少，大家学一下，功能强大的超乎想象，无需研发，即可实现大量数据转换处理功能
logstash 配置语法是基于 ruby 的，ruby 也是类似 python 的一种新生代语言，大家再学习 logstash 配置的同时，也顺便学习下 ruby
现在世界语言排名如下：

Jun 2018	Jun 2017	Programming Language	Ratings	Change
1	1	Java	15.368%	+0.88%
2	2	C	14.936%	+8.09%
3	3	C++	8.337%	+2.61%
4	4	Python	5.761%	+1.43%
5	5	C#	4.314%	+0.78%
6	6	Visual Basic .NET	3.762%	+0.65%
7	8	PHP	2.881%	+0.11%
8	7	JavaScript	2.495%	-0.53%
9	-	SQL	2.339%	+2.34%
10	14	R	1.452%	-0.70%
11	11	Ruby	1.253%	-0.97%

IE 验证码图片抓取优化方案

2018-07-07 13:55

满满的干货，大家赶快学起来 👍

如何处理一些控件无法设置的【下拉框技巧】

2018-07-06 12:48

代码改一下，点这个

高级一点的是：
```Python
这里放代码
```
你试试

文本的获取、图片的判断等功能初次设定可以成功，而更新页面或重新登录时不能正常运行的问题。

2018-07-05 22:31

赞一下，以后要把这个 bbs 作为大家总结小技巧的记录板，以后遇到的问题都在这里总结分享

Table 表单内容获取

2018-07-05 20:19

今天在支持江峰时，发现 pd.read_html 有一个 bug，就是他只会读取 tbody 的第一个部分即 tbody[0]，为临时解决这个问题，查找后完整解决方案如下：

import pandas as pd
from bs4 import BeautifulSoup

html_table = '''
<table>
  <thead>
    <tr><th>Col1</th><th>Col2</th>
  </thead>
  <tbody>
    <tr><td>1a</td><td>2a</td></tr>
  </tbody>
  <tbody>
    <tr><td>1b</td><td>2b</td></tr>
  </tbody>
</table>'''

# fix HTML
soup = BeautifulSoup(html_table, "html.parser")
for body in soup("tbody"):
    body.unwrap()

df = pd.read_html(str(soup), flavor="bs4")
print(df[0])

得到的结果是：

   Col1  Col2  
0  1a  2a  
1  1b  2b

也可以简单的去除一下 tbody 的标记：

html_table = html_table.replace('</tbody>', '').replace('<tbody>', '')

当然前一种方法较为规范，很多多 tbody 标记后面还有具体的属性（attribute），第一种方法去除的比较干净。
另外需要注意的是，th 表示 table head，这种情况一般不需要指定 header=0

网页框体的小秘密 -- 你看到的不一定是你想要的

RPA 应用函数分享之 ---FTP 文件上传下载

ueba7.0 触发器配置使用

艺赛旗 RPA 全新版本 6.0 将于近期发布

关于 CSM 项目遇到的各种问题处理

【多人协作】整合流程技巧

网页检查 / 审查小技巧

Logstash 配置说明

IE 验证码图片抓取优化方案

如何处理一些控件无法设置的【下拉框技巧】

文本的获取、图片的判断等功能初次设定可以成功，而更新页面或重新登录时不能正常运行的问题。

Table 表单内容获取

Xlwings 的 sheet 操作简单用法小结

设计器在 WIN7 64 位安装后，流程编译后无法正常运行

通过设计器对数据表格的处理

Table 表单内容获取

客户端安装问题汇总及解决方案

个人主页