【企业客户之声系列——ReproducibleResearch】
每每接到调查咨询项目时,数据处理和分析的工作总会用掉大量的时间,虽然EXCEL玩得倍儿溜,SPSS也十分熟练,但庞大的数据处理过程和重复的操作仍会让人觉得难以消化,而且数据一旦出现差错,前面所有的工作都得推翻重来。
导师深以为意,给小编指了一个方向,可重复研究——即用Rmarkdown写文档,插入可执行
数据分析的R代码、图片或网站链接等,一键knitr批量产生可重复研究的报告文档。
这段时间小编一直在这个方向摸索学习,今天和大家分享一个简单的案例撰写过程。限于文章篇幅,今天只分享数据处理和分析的基本操作,下篇小编会专门讲解Rmarkdown写报告的过程。
一、工具准备
工具准备:R及Rstudio。
包准备:memisc,vcd
二、R实现步骤
1)读取数据文件
2)定义标签、重编码
3)基本统计分析
4)简单图形绘制
5)Rmarkdown撰写报告
三、实战
本文使用数据集截取自@客户满意度咨询项目数据。
通常调研获取的数据是录入到Excel表里的,在使用R读取数据时,需要先将其转换成.csv格式。注:公司旗下A-WEB“雅典娜”网络调查系统,可以完成问卷制作与发放、数据采集(自动录入系统)、数据导出(包含.xls、.csv、.sav(SPSS)等多种格式)。
1)读取数据文件
#加载包
library(memisc)
library(vcd)
#读取数据
mydata<-read.csv(file= file.choose())
mydata<-as.data.set(mydata)
Str(mydata)
2)定义标签、重编码
#定义标签、重编码
attach(mydata)
mydata<-within(mydata,{
description(Q1)="选择XX的主要因素"
description(Region)<-"大区"
labels(Q1)<-c(
"XX品牌"=1,
"产品质量"=2,
"产品价格"=3,
"产品可扩展性"=4,
"产品配套服务"=5,
"技术领先性"=6,
"服务质量"=7,
"其他"=8
)
labels(Region)<-c(
"东北大区"=1,
"华东大区"=2,
"华南大区"=3,
"华中大区"=4,
"西南大区"=5
)
})
#查看已编码数据
labels(mydata$Q1)
#codebook函数完成基本描述统计分析
codebook(mydata$Q1)
3)基本统计分析
options(digits =2)#显示两位小数点
#单变量分析,求频数、百分比、
counts1<-table(mydata$Q1)
c1<-counts1/sum(counts1)*100
#memisc包提供percent函数可直接求出百分比
#d1<-percent(mydata$Q1) 结果可自行比对
#排序
c1<-c1[c(order(c1))]
#交叉表分析
mytable<-xtabs(~Q1+Region,data=mydata)
#求百分比
prop.table(mydata,2)*100
4)简单图形绘制
#绘制条形图
par(las=2)#旋转坐标轴标签
#旋转条形图,上色
x<-barplot(c2,main="选择XX的主要因素",horiz=T,cex.names=0.6,col=rainbow(8))
#添加数值标签-pos设置不同标签位置
lbls1<-paste(c2[1:5],"%",sep="")
lbls2<-paste(c2[6:8],"%",sep="")
text(c2[1:5],x[1:5],labels=lbls1,cex=0.6,pos=4)
text(c2[6:8],x[6:8],labels=lbls2,cex=0.6,pos=2)
#加边框
box()
总结
R需要写代码让很多人望而生畏,但对于问卷数据所使用到的函数是非常简单的,且可重复研究的目的就在于设置好分析框架,只需更换数据,就能批量产出所需报告,这一点在接下来的Rmarkdown的使用中会做展示。如果您始终为代码头疼而放弃它的美妙之处,没关系,公司正致力解决代码编写工作,给您提供一个基于“可重复研究”技术的一键式报告平台,敬请期待。
注:
商智通(www.bistone.com)面向企业推出的客户之声(webvoc)解决方案,是基于大数据技术,帮助组织各层倾听客户之声,实现对客户需求、客户满意和客户忠诚进行自动数据采集、分析、预警和改善的一站式平台,可有效提升客户体验管理水平、支持企业内部快速反馈和改善服务质量、助力企业打造粉丝经济,从而大幅提升销售额和利润率。
商智通(www.bistone.com)研究的通用客户满意度指数测评模型(UCSI),有效帮助客户企业提升客户满意度,改善客户体验。目前已经在电信行业(TCSI)、旅游行业(游客满意度指数)、保险行业(保险客户满意度指数)、物流行业(物流客户满意度指数)、高等教育行业(高校毕业生就业满意度指数)、石化行业(石化行业ToB、ToC业务客户满意度指数)、银行业(银行客户满意度指数和)、地产行业(地产中介客户满意度指数、业主满意度指数)等等多个行业成功应用。
北京商智通信息技术有限公司
营销服务中心地址:北京市海淀区长远天地大厦B1座17层
研发总部地址:北京市海淀区红山口甲1号
山东研发中心地址:山东淄博高新区政通路135号高科技创业园B座4层
广州研发中心地址:广州科学城科学大道广州国际企业孵化器A区11层
总机:010-82128818
全国咨询热线:400-082-3600
网址:http://www.bistone.com