搜索
查看: 2503|: 0

[资源分享] 用R语言做数据分析(7)——数据的输入与输出之Scan函数

[复制链接]

165

主题

5

回帖

1123

积分

金牌会员

积分
1123
发表于 2014-5-24 03:27:28 | 显示全部楼层 |阅读模式
前面系列文章,介绍了R语言中的几种数据格式;其它特殊的数据格式将在后续的文章中介绍,接下来的几篇文章,将讨论如何从外部中读入数据或者将其它格式的数据读入到R环境中;

scan() 函数

scan(file = "", what = double(0), nmax = -1, n = -1, sep = "",     
quote = if(identical(sep, "\n")) "" else "'\"", dec = ".",
     
skip = 0, nlines = 0, na.strings = "NA",
   
flush = FALSE, fill = FALSE, strip.white = FALSE,
     
quiet = FALSE, blank.lines.skip = TRUE, multi.line = TRUE,
     
comment.char = "", allowEscapes = FALSE, encoding = "unknown")


一、主要的参数说明如下:

1)  what:声明读入为字符类型数据,可能指定读入的精度/类型,例如:what=integer(0);what=numeric(0);what=character(0);
如果SCAN()读入有字符与数字,用what=""来进行声明,则会把读入的数字隐式的都转变成字符;
2)  SEP:指定各个读入的数据之间的分隔符;默认情况下分隔符:空格、tab;如果不是其它分隔符,例如“:/”通过SEP来指定;
3)  可以通过list指定读入变量的变量名,同时生成的对象为列表,则可以同时读入字符与数字;
4)  Skip 从第几行开始读入数据;
5)  Nlines 指定最大读入行数;
6)  如果通过键盘输入的时候,不希望出现下标提示,则可以使用:quiet=TRUE;
7)  encoding =””指定的编码格式,有时候读入的中文可能会出现乱码的时候,可能通过这个参数来指定:Latin-1 或者 UTF-8;

二、SCAN几点注意:
1)    用于读入纯字符或者数字,没有表头;
2)    如果输入的单一类型的变量,例如均是:数值或者均是字符,用scan效率更高。但其不能读入混合类型的数据,也就是在scan()读入的必须同为字符或者同为数值;
3)    默认情况下用scan读入的数据生成向量类型(这也就是为什么读入的数据必须是同为字符或者同为数字)。


三、案例说明

1、手工输入数据
1)从键盘中输入数字




2)从键盘中输入字符




2、从外部读入
1)从D盘读入TXT文件,例如:


3、如果读入的数据中有字符或者数字,可以通过list来进行指定,则生成的对象是列表格式,如下:  


4、  指定输入字符的编码类型

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-12-22 02:39 , Processed in 0.067564 second(s), 25 queries .

快速回复 返回顶部 返回列表