“读取文件”组件中的编码格式要怎么选择?

http://support.i-search.com.cn:8088/showdoc/web/#/110?page_id=4898

上面这个是:“写文件”组件的文档,文档中没有提到“编码格式”。请官方要及时更新

来看下“写文件”组件的样子;

“读取文件”组件中的编码格式要怎么选择?

这里有个“默认值”是: ‘Auto’,我就搞不懂了,这个 auto 指的是什么?是默认“GB2312”么?

如果我要写入文本到记事本里:

“读取文件”组件中的编码格式要怎么选择?

记事本的编码只有这几种,为了跟写文件匹配,那么“编码格式”是要写 ‘Auto’ 还是 ‘UTF-8’ ?

可记事本没有“BG2312”的编码,那么设置为“auto”后,又是以什么编码保存的呢?

如果是其他格式的文件呢,该怎么选择呢?

问题一: 对当前编码格式的定义比较模糊,没弄清具体是什么意思。


相应的在“读取文件”组件中,也有个“编码格式”。

官方文档:http://support.i-search.com.cn:8088/showdoc/web/#/110?page_id=4897

文档里这么说的: “encoding”参数:即待读取的文件的文档编码, 常见的编码类型有:Unicode、ASCII、GBK、GB2312、UTF-8.

“读取文件”组件中的编码格式要怎么选择?

问题二:读取文件时,这里的编码格式是指,要与源文件的编码格式一致的意思么?

比如:源文件的编码格式是 “UTF-8”,这里就要设置成“UTF-8”么,不一样的话要出错么?
设置为“Auto”,能自动识别么?
另:我怎么才能知道源文件的编码格式是什么呢?

我手上正好有一个使用“写文件”组件,编码格式是“Auto”写入的文本文件;当我使用“读取文件”组件,编码格式同样也是“Auto”读取时,报错了。

当我使用默认的 “Auto” 时,报错:
“读取文件”组件中的编码格式要怎么选择?

当我使用“UTF-8”时,报错:
“读取文件”组件中的编码格式要怎么选择?

当我使用“Unicode”时,报错:
“读取文件”组件中的编码格式要怎么选择?

直到我使用了 “GBK”时,终于可以了。

问题三:写入文件时使用的编码格式是“Auto”,为什么读取文件时编码格式也使用“Auto”就不行了?

不是所有读取都会抛出异常,但也确实会有。