-
关于产品功能的几个问题
2018-09-09 21:21 -
Python 基础,在字符串中引用变量
2018-09-07 16:06补充一个
'Result is %s, %s' % (var1, var2)
-
python 如何处理 txt 文本读取上来的内容?
2018-09-05 13:18如果只是空格分割的话,可以用
pd.read_csv(filename, sep='\s+',header=None)
如果是固定宽度的话,可以用pd.read_fwf(file_path, widths=[...], names=[...])
read_fwf 文档
pd 指 pandas
如果规律比较复杂,则需要自行处理,用正则表达式处理也可以
如果没规律。。。。那还是找规律吧 -
实战分享 - 字符串切割汇率数据
2018-09-03 10:05推荐配置比如正则表达式设置在 excel 文件里面,然后继续配置的人员就不需要再读程序改程序了
另外用正则连中文一起匹配是否更佳? -
rpa 产品 --outlook 邮件问题
2018-09-02 19:11 -
Excel 数据对比
2018-09-02 18:17学习一下数据表格,数据表格秒秒钟解决你这个需求:
import pandas as pd df = pd.read_excel('/path/data.xlsx') print(df[df['data_hr']==df['data_oil']]['姓名'].tolist())
可以测试一下,不过李双一发帖踊跃,必须鼓励一个
做 excel 数据处理,必须学一下数据表格,学了爱不释手 -
Excel 表格单列相同项目汇总
2018-09-02 18:13同样给一个数据表格处理的例子:
import pandas as pd df = pd.read_excel('/path/data.xlsx') print(df[df['日期']=='20180820' ]['金额'].sum())
可以测试一下,不过李双一发帖踊跃,必须鼓励一个
-
Excel 相同项目条件筛选并计数求和
2018-09-02 18:08学习一下数据表格,数据表格秒秒钟解决你这个需求:
import pandas as pd df = pd.read_excel('/path/data.xlsx') print(df[(df['姓名']=='张三' ) & (df['车型']=='凯美瑞')].count())
可以测试一下,不过李双一发帖踊跃,必须鼓励一个
-
RPA6.1 设计器使用说明 - 线上版
2018-08-13 19:32再也不用去翻 word 了,拿出手机查一下
-
Excel 表格汇总及颜色填充
2018-07-25 11:14又一个发帖加入撰稿人队伍的,一看 python 功底就不错,遇到自行解决的问题,多发共享帖子,也多来看这边文档提意见
-
IE 验证码图片抓取优化方案
2018-07-25 10:17也可以用鼠标右键点击图,然后按 S 键,会弹出保存文件,可以输入全路径文件名保存
-
网页框体的小秘密 -- 你看到的不一定是你想要的
2018-07-20 22:26这里就是知识库嘛,就是还有点少
-
RPA 应用函数分享之 ---FTP 文件上传下载
2018-07-15 11:07赞一下,ftplib 需要另外下载吗?
-
ueba7.0 触发器配置使用
2018-07-13 17:00这个还有很多人不会呢,大家加油学,其实展示效果来说,这个比机器人更有感觉! 😁
-
艺赛旗 RPA 全新版本 6.0 将于近期发布
2018-07-13 10:366.0 全员要重新培训一下,现在各部门、渠道代理和客户均需逐步安排起来
-
关于 CSM 项目遇到的各种问题处理
2018-07-12 10:32 -
【多人协作】整合流程技巧
2018-07-10 16:46高难度动作!你用的哪个版本说一下
-
网页检查 / 审查小技巧
2018-07-09 10:09左右拍照效果也不错的,可以自行调整上下还是左右
我不知道,原来 chrome 也是 F12,哈哈,mac 上 chrome 是没有 F12 的 -
Logstash 配置说明
2018-07-07 15:10公司会配置 logstash 的人非常少,大家学一下,功能强大的超乎想象,无需研发,即可实现大量数据转换处理功能
logstash 配置语法是基于 ruby 的,ruby 也是类似 python 的一种新生代语言,大家再学习 logstash 配置的同时,也顺便学习下 ruby
现在世界语言排名如下:Jun 2018 Jun 2017 Change Programming Language Ratings Change 1 1 Java 15.368% +0.88% 2 2 C 14.936% +8.09% 3 3 C++ 8.337% +2.61% 4 4 Python 5.761% +1.43% 5 5 C# 4.314% +0.78% 6 6 Visual Basic .NET 3.762% +0.65% 7 8 PHP 2.881% +0.11% 8 7 JavaScript 2.495% -0.53% 9 - SQL 2.339% +2.34% 10 14 R 1.452% -0.70% 11 11 Ruby 1.253% -0.97% -
IE 验证码图片抓取优化方案
2018-07-07 13:55满满的干货,大家赶快学起来 👍
-
如何处理一些控件无法设置的【下拉框技巧】
2018-07-06 12:48代码改一下,点这个
高级一点的是:
```Python
这里放代码
```
你试试 -
文本的获取、图片的判断等功能初次设定可以成功,而更新页面或重新登录时不能正常运行的问题。
2018-07-05 22:31赞一下,以后要把这个 bbs 作为大家总结小技巧的记录板,以后遇到的问题都在这里总结分享
-
Table 表单内容获取
2018-07-05 20:19今天在支持江峰时,发现 pd.read_html 有一个 bug,就是他只会读取 tbody 的第一个部分即 tbody[0],为临时解决这个问题,查找后完整解决方案如下:
import pandas as pd from bs4 import BeautifulSoup html_table = ''' <table> <thead> <tr><th>Col1</th><th>Col2</th> </thead> <tbody> <tr><td>1a</td><td>2a</td></tr> </tbody> <tbody> <tr><td>1b</td><td>2b</td></tr> </tbody> </table>''' # fix HTML soup = BeautifulSoup(html_table, "html.parser") for body in soup("tbody"): body.unwrap() df = pd.read_html(str(soup), flavor="bs4") print(df[0])
得到的结果是:
Col1 Col2 0 1a 2a 1 1b 2b
也可以简单的去除一下 tbody 的标记:
html_table = html_table.replace('</tbody>', '').replace('<tbody>', '')
当然前一种方法较为规范,很多多 tbody 标记后面还有具体的属性(attribute),第一种方法去除的比较干净。
另外需要注意的是,th 表示 table head,这种情况一般不需要指定 header=0 -
Xlwings 的 sheet 操作简单用法小结
2018-07-04 17:05你也用 jupyte notebook 啊,为啥导出的 notebook markdown 语法和这个论坛不兼容呢,搞得只能截图
-
设计器在 WIN7 64 位安装后,流程编译后无法正常运行
2018-07-03 12:05点个赞,原因还需要大家分析研究
-
通过设计器对数据表格的处理
2018-06-30 17:01点赞,大家对表格数据多试多用,异常强大的数据处理能力 👍
-
Table 表单内容获取
2018-06-29 17:11从 5.0 开始,不需要太多编程,也可以处理 dataframe 类型的数据了
这些功能可以帮助进行筛选和数据处理 -
客户端安装问题汇总及解决方案
2018-06-29 12:54客户端推荐安装在 c 盘,但是很多客户会恢复 c 盘的可以安装在 d 盘
linping
- 6 标签
- 70 帖子
- 397 回帖
问题 1 已经记录,后续版本考虑
问题 2 在 7.0 会重新设计 selector
问题 3 在项目中处理,暂时 ueba 没有更新计划