• 问题 1 已经记录,后续版本考虑
    问题 2 在 7.0 会重新设计 selector
    问题 3 在项目中处理,暂时 ueba 没有更新计划

  • 补充一个

    'Result is %s, %s' % (var1, var2)
    
  • 如果只是空格分割的话,可以用 pd.read_csv(filename, sep='\s+',header=None)
    如果是固定宽度的话,可以用pd.read_fwf(file_path, widths=[...], names=[...])
    read_fwf 文档
    pd 指 pandas
    如果规律比较复杂,则需要自行处理,用正则表达式处理也可以
    如果没规律。。。。那还是找规律吧

  • 推荐配置比如正则表达式设置在 excel 文件里面,然后继续配置的人员就不需要再读程序改程序了
    另外用正则连中文一起匹配是否更佳?

  • Excel 数据对比

    2018-09-02 18:17

    学习一下数据表格,数据表格秒秒钟解决你这个需求:

    import pandas as pd
    
    df = pd.read_excel('/path/data.xlsx')
    print(df[df['data_hr']==df['data_oil']]['姓名'].tolist())
    

    可以测试一下,不过李双一发帖踊跃,必须鼓励一个
    做 excel 数据处理,必须学一下数据表格,学了爱不释手

  • 同样给一个数据表格处理的例子:

    import pandas as pd
    
    df = pd.read_excel('/path/data.xlsx')
    print(df[df['日期']=='20180820' ]['金额'].sum())
    

    可以测试一下,不过李双一发帖踊跃,必须鼓励一个

  • 学习一下数据表格,数据表格秒秒钟解决你这个需求:

    import pandas as pd
    
    df = pd.read_excel('/path/data.xlsx')
    print(df[(df['姓名']=='张三' ) & (df['车型']=='凯美瑞')].count())
    

    可以测试一下,不过李双一发帖踊跃,必须鼓励一个

  • 再也不用去翻 word 了,拿出手机查一下

  • 又一个发帖加入撰稿人队伍的,一看 python 功底就不错,遇到自行解决的问题,多发共享帖子,也多来看这边文档提意见

  • 也可以用鼠标右键点击图,然后按 S 键,会弹出保存文件,可以输入全路径文件名保存

  • 这里就是知识库嘛,就是还有点少

  • 赞一下,ftplib 需要另外下载吗?

  • 这个还有很多人不会呢,大家加油学,其实展示效果来说,这个比机器人更有感觉! 😁

  • 6.0 全员要重新培训一下,现在各部门、渠道代理和客户均需逐步安排起来

  • 看到火速联系研发,顿时觉得很尴尬 😟
    你当时看到什么日志,出了什么问题补充一下,这样对大家帮助比较大
    @guanyf @wangcx 你们也补充下

  • 高难度动作!你用的哪个版本说一下

  • 左右拍照效果也不错的,可以自行调整上下还是左右
    我不知道,原来 chrome 也是 F12,哈哈,mac 上 chrome 是没有 F12 的

  • Logstash 配置说明

    2018-07-07 15:10

    公司会配置 logstash 的人非常少,大家学一下,功能强大的超乎想象,无需研发,即可实现大量数据转换处理功能
    logstash 配置语法是基于 ruby 的,ruby 也是类似 python 的一种新生代语言,大家再学习 logstash 配置的同时,也顺便学习下 ruby
    现在世界语言排名如下:

    Jun 2018 Jun 2017 Change Programming Language Ratings Change
    1 1 Java 15.368% +0.88%
    2 2 C 14.936% +8.09%
    3 3 C++ 8.337% +2.61%
    4 4 Python 5.761% +1.43%
    5 5 C# 4.314% +0.78%
    6 6 Visual Basic .NET 3.762% +0.65%
    7 8 PHP 2.881% +0.11%
    8 7 JavaScript 2.495% -0.53%
    9 - SQL 2.339% +2.34%
    10 14 R 1.452% -0.70%
    11 11 Ruby 1.253% -0.97%
  • 满满的干货,大家赶快学起来 👍

  • 代码改一下,点这个
    c32e54b9489349f8a9fe5fccc2acc582_image.png

    高级一点的是:
    ```Python
    这里放代码
    ```
    你试试

  • 赞一下,以后要把这个 bbs 作为大家总结小技巧的记录板,以后遇到的问题都在这里总结分享

  • Table 表单内容获取

    2018-07-05 20:19

    今天在支持江峰时,发现 pd.read_html 有一个 bug,就是他只会读取 tbody 的第一个部分即 tbody[0],为临时解决这个问题,查找后完整解决方案如下:

    import pandas as pd
    from bs4 import BeautifulSoup
    
    html_table = '''
    <table>
      <thead>
        <tr><th>Col1</th><th>Col2</th>
      </thead>
      <tbody>
        <tr><td>1a</td><td>2a</td></tr>
      </tbody>
      <tbody>
        <tr><td>1b</td><td>2b</td></tr>
      </tbody>
    </table>'''
    
    # fix HTML
    soup = BeautifulSoup(html_table, "html.parser")
    for body in soup("tbody"):
        body.unwrap()
    
    df = pd.read_html(str(soup), flavor="bs4")
    print(df[0])
    

    得到的结果是:

       Col1  Col2  
    0  1a  2a  
    1  1b  2b
    

    也可以简单的去除一下 tbody 的标记:

    html_table = html_table.replace('</tbody>', '').replace('<tbody>', '')
    

    当然前一种方法较为规范,很多多 tbody 标记后面还有具体的属性(attribute),第一种方法去除的比较干净。
    另外需要注意的是,th 表示 table head,这种情况一般不需要指定 header=0

  • 你也用 jupyte notebook 啊,为啥导出的 notebook markdown 语法和这个论坛不兼容呢,搞得只能截图

  • 点个赞,原因还需要大家分析研究

  • 点赞,大家对表格数据多试多用,异常强大的数据处理能力 👍

  • Table 表单内容获取

    2018-06-29 17:11

    从 5.0 开始,不需要太多编程,也可以处理 dataframe 类型的数据了
    6790d7897213421d8c41a58c888808ec_image.png
    这些功能可以帮助进行筛选和数据处理

  • 客户端推荐安装在 c 盘,但是很多客户会恢复 c 盘的可以安装在 d 盘

linping
  • 6 标签
  • 70 帖子
  • 397 回帖

个人主页