本文共 1326 字,大约阅读时间需要 4 分钟。
原标题:R语言答疑:txt文件无法被R正确读入
今天来解答一个网友的疑惑,或许你也曾遇到过这个问题噢~
R语言中,txt无法正确的读入的可能性有很多种。有位网友提供的一个无法正确读入的文本文件,使用记事本打开,看起来一切正确(见图片)。
但读入的时候,报错如下。
>read.table("1.txt")
Error intype.convert(data[], as.is = as.is, dec = dec, numerals = numerals, :
'<67>'多字节字符串有错
此外,Warning messages:
Inread.table("1.txt") : line 1 appears to contain embedded nulls
Inread.table("1.txt") : line 2 appears to contain embedded nulls
Inread.table("1.txt") : line 3 appears to contain embedded nulls
Inread.table("1.txt") : line 4 appears to contain embedded nulls
Inread.table("1.txt") : line 5 appears to contain embedded nulls
Inscan(file = file, what = what, sep = sep, quote = quote, dec = dec,:embedded nul(s) found in input
问题解决
报错提示,文本中包含嵌入的null符号,所以无法正确读取。那么为什么使用记事本打开却一切正常呢?我们试试使用专业的文本编辑器VIM(如果有问题,可以百度VIM)打开(见图片,原文件-VIM)。
注意了,与记事本看起来多了很多符号。因为在记事本下,文本中的很多异常符号是显示不出来的。
符号解释
^@:代表“NULL”符号,本身代表空白,所以在记事本下不显示。
^M: 其实代表window下的回车符。
以上两个符号需要被删除的,否者R可能出现读取错误。
解决方法
1)
将1.txt使用记事本打开,然后复制到excel里。接着将excel里的文本在复制一遍,粘贴到一个新建的txt文件 2.txt里面。再次使用VIM打开,看起来就一切正常了(见图片 修改后-VIM)。
然后,R就可以正常读入了。
2)
在VIM下,将异常符号替换去除。如果熟悉使用VIM的同学,可以使用以下两个命令替换异常符号:
%s/r//g #备注:替换掉^M
%s/^@//g #备注:替换掉^@, ^@不能直接输入,否者会报错。正确的方法是Shift + Ctrl + 2 来输入^@
另外在R最新版本 3.2.3 的read.table命令 多了一个选项:skipNUL。如果skipNul=TRUE可以自动忽略文件中的NULL符号。不过在这个例子中,由于异常符号^M的存在,即使使用skipNul=TRUE依然是会报错的。需要将^M手动替换去除。返回搜狐,查看更多
责任编辑:
转载地址:http://ehkfs.baihongyu.com/