有个提取文件的问题

如何提取页面的长文字
然后可以直接后台分析和裁剪数据吗