"1. 首先是 pdf 拆分组件 [图片] 最低为每页拆分,可多(N)页进行拆分。 达成一个效果: 将 N 个图片组成的 PDF 文件,每页一个为单位,可拆分成 N 个单一 pdf。每个 pdf 含一个图片。 测试 4 张图片为一起的 pdf ...."
高手过招第八期—PDF 系列组件:真的很强大
1. 首先是 pdf 拆分组件
![高手过招第八期—PDF 系列组件:真的很强大](https://support.i-search.com.cn/upload/bbs/20210521/136766f27b5944a2a2b3cfa23d3d2d65_image.png)
最低为每页拆分,可多(N)页进行拆分。
达成一个效果:
将 N 个图片组成的 PDF 文件,每页一个为单位,可拆分成 N 个单一 pdf。每个 pdf 含一个图片。
测试 4 张图片为一起的 pdf。如图:
![高手过招第八期—PDF 系列组件:真的很强大](https://support.i-search.com.cn/upload/bbs/20210521/0f85e2e84aea4862a6450c6145781dec_image.png)
2. 获取 PDF 文本
准备一个银行明细单
![高手过招第八期—PDF 系列组件:真的很强大](https://support.i-search.com.cn/upload/bbs/20210521/d11b5d61e3d548bdba4928cc20ca407a_image.png)
进行 pdf 文本获取
![高手过招第八期—PDF 系列组件:真的很强大](https://support.i-search.com.cn/upload/bbs/20210521/e52a2cd6fcc24a908dd2a9c31ba3793f_image.png)
真的很强啊! 可以把整个 pdf 文本内容都识别出来,只需要 python 正则,解析数据就可以提取数据出来了。太 NB 了
![高手过招第八期—PDF 系列组件:真的很强大](https://support.i-search.com.cn/upload/bbs/20210521/0824f6b41f7e4511bd87de0732910d7d_image.png)
3. 获取 pdf 页数。这个可以获取总页数
4. 获取 pdf 信息。 (获取 pdf 这个对象的信息,pdf 创建时间、修改时间、作者、标题等 pdf 信息)
![高手过招第八期—PDF 系列组件:真的很强大](https://support.i-search.com.cn/upload/bbs/20210521/0fbf7be884ae4cc2a0271134cbfffe4e_image.png)
5. 获取 pdf 图文 (会把 pdf 内,出现的所有图片!!! 将 pdf 内的图片在项目路径下 tmp 目录中:进行保存。刚好和上面的文本前后呼应,一个处理文本,一个处理图片,)
![高手过招第八期—PDF 系列组件:真的很强大](https://support.i-search.com.cn/upload/bbs/20210521/c5edff71393a4c69bef1b2e173e7c7ad_image.png)
6. 获取 pdf 表格 (会将 pdf 内出现的表格进行获取,并输出)
![高手过招第八期—PDF 系列组件:真的很强大](https://support.i-search.com.cn/upload/bbs/20210521/a09e3025d7864e36bf841154c1077542_image.png)
以上是新版本的 pdf 组件的功能, 再次强调:真的很强大,各位可以试试
是否可以提供 pdf 呢···
我们这边测试下··· 😋
读取不到图片, 这个有什么方法可以解决吗?
收到,感谢艺赛旗!
恭喜您的帖子被评为优选贴,4000Y 币奖励已充值到账,请查收
厉害!