"这是拾取表格组件返回的值:1010000 [图片] 这是目标网页中实际的值:01010000 [图片] 是该组件将返回的值自动转为 int 了导致的嘛??这感觉多此一举了,有什么办法能原样输出嘛。 不然这个组件的局限性就很强了"
这是拾取表格组件返回的值:1010000
这是目标网页中实际的值:01010000
是该组件将返回的值自动转为 int 了导致的嘛??这感觉多此一举了,有什么办法能原样输出嘛。不然这个组件的局限性就很强了
其实 pandas 读取数据就是这个规则。
这就不太善了 😭
因为我调用的是 pandas 模块的方法read_html(),它默认就是将 00123 转为 123。比如这张图,调用后,就是将 001 改为 1。 😞
read_html()
我觉得默认应该拾取为原值,例如 "01010000" 就拾取为 "01010000",不需要去做什么处理。组件右侧可以新增一个参数 converters,设置 converters = {“项目代码”: int}, 那么就把 “01010000” 当成数字处理处理,即 "1010000"。
原因是我个人觉得数据取原值就行,至于要怎么处理数据,交给用户自行决定。Python 对数据的处理还是非常方便的
你好 ~ 我最近正在修改这个问题。初步方案是 组件右侧新增一个参数converters。以你这个贴子表格为例,converters = {“项目代码”: str}, 那么就把 "01010000" 当成字符串处理,即可保留原值。
converters
你有什么建议么?
又学到一点知识,厉害厉害
还是你眼尖
大众 EMP 工单采集
初级认证的时候好像老师有提到过,表格数据会自动转成 int 类型,可以将它转为 str 类型
其实 pandas 读取数据就是这个规则。
这就不太善了 😭
因为我调用的是 pandas 模块的方法
read_html()
,它默认就是将 00123 转为 123。比如这张图,调用后,就是将 001 改为 1。 😞
我觉得默认应该拾取为原值,例如 "01010000" 就拾取为 "01010000",不需要去做什么处理。
组件右侧可以新增一个参数 converters,设置 converters = {“项目代码”: int}, 那么就把 “01010000” 当成数字处理处理,即 "1010000"。
原因是我个人觉得数据取原值就行,至于要怎么处理数据,交给用户自行决定。Python 对数据的处理还是非常方便的
你好 ~ 我最近正在修改这个问题。
初步方案是 组件右侧新增一个参数
converters
。以你这个贴子表格为例,converters = {“项目代码”: str}, 那么就把 "01010000" 当成字符串处理,即可保留原值。
你有什么建议么?
又学到一点知识,厉害厉害
还是你眼尖
大众 EMP 工单采集
初级认证的时候好像老师有提到过,表格数据会自动转成 int 类型,可以将它转为 str 类型