从零学数据分析:简单数据分析(李强实践笔记)

从零学数据分析:简单数据分析(一块听听的课程)

猴子的一个观点:未必要同时学那么多课程,可以先学习“r语言”在等到觉得统计学有必要开始学习的时候再开始学,否则太枯燥的理论,人们很难坚持下去

月均消费次数:把每个人的所有消费次数合并在除以12

月均消费金额:把每个人消费的钱合并在除以12

客单价:一定时间内所有金额除以所有客人的总数

开始数据分析:

第一步将excel数据读入到r语言中,最常用是“XL Connect”包和“openxlsx"包

个人比较喜欢”openxlsx“包,只要读取文件的路径

大部分的时间都用在对数据预处理中,然后得到想要的数据

install.packages("openxlsx")

library("openxlsx")

readFilepath <- "c:/朝阳医院2016年销售数据.xlsx"

excelData <- read.xlsx(readFilepath,"sheet1")

实际操作时把excel表命名为“朝阳医院2016年销售数据”放在了一个D盘名字为“朝阳医院2016年销售数据”的文件夹中,结果使用raadFilePath读取不出来,报错后把命名为“朝阳医院2016年销售数据”的excel表直接放在D盘中,在使用“readFilepath立马读取出来了,非常高兴,在单位的会议室激动的跑来跑去,大喊大叫,李强厉害,比吃了蜜还甜,真的要记住这样克服了学习困难中的激动时候,真的比”性“,”物质奖励”等刺激都要兴奋,这也是老天对热爱学习的人最好的回馈。



导入数据我都花费了很多的时间,开始是没有"readxlsx"函数需要升级R的版本到3.4.1,各种谷歌搜索,折腾半天升级成功,在R中导入的数据不完整,转身在RSTUDIO中输入,并在google中搜索关于这一讲的学习笔记,终于成功完整导入数据,开心,对别人来说是一个很小的进步,对我来说是很大进步,越来越爱学编程了,感谢自己不嫌起点上的自己的笨拙。



预处理2:列名从命名

在编码的世界里,使用英文会好的多

3.处理缺失数据

在r中缺失值用”na“表示na.omit可以删除所有缺失数据的行

excelData <- excelData[!is.na(excelData$time),]

十个逻辑运算符:

<  小于

<= 小于或等于

> 大于

>= 大于或等于

== 严格等于

!=不等于

!x   非x

x | y   x或y

x & y    x和y

isTRUE(x)   测试x是否为TRUE


4.处理日期格式

我们不需要time中的星期几的格式,我们要做的是如何将这一列的日期字符串格式分开出我们想要的字符串,这就需要使用到R语言中的字符串处理包stringr,以后遇到字符串处理的问题只要google这个包就好了,学会如何解决问题比直接告诉答案更有效,


这里面急了,stringr包没安装完就直接往后面敲代码,开始敲出来的代码是这样的,以为是stringr包没有安装完的原因,谁知道安装完以后还是这样,什么原因????这时候没管那么多心想着先完成往后敲代码吧,一定要多鼓励自己,谁说自己学不好数学和编程的啊,我一定能学的好


class函数用于查看某一列的数据是什么格式,我们需要对日期进行一些特殊计算,我们看到日期还是字符串格式,需要将他们转换为日期格式,as.date函数就可以将字符串转换成日期格式

类型转换函数

is                                                                as

is.numeric()                                      as.numeric()

is.character()                                    as.character

is.vector()                                         as.vector()

is.matrix()                                          as.matrix()

is.data.frame()                                 as.data.frame()

is.logical()                                           as.logical()


数据预处理总结

step1:列名重命名

step2:删除缺失数据

step3:处理日期

step4:数据类型转换

step5:数据排序

总消费次数






似得

经历反反复复的很多次一边听老师的课程一边敲代码,竟然都敲不出来,实在很沮丧,那种熟悉的遇到困难是的“恐惧”与“自责”如期而来,这时候我脑子里想起了笑来老师的话,任何技能的习得,都只能靠“反反复复重复很多次”才能熟练乃至精通,那就再多练一次,在Rstudio中又新建了一个命名为“3”的项目,从头老老实实开始敲代码,这一次如有神助似的一路敲代码过来,一切正常,写到这里,我才深刻理解笑来老师的“每一步都算数”的意思,前面的困惑,迷茫,恐惧,不停的探寻都是有意义的,而且必须经历这样不停探寻的过程,(我忽然想起了自己的前半生都是在跌跌撞撞中探寻着,遇到笑来老师既是偶然又是必然,最要感谢的人其实是自己,最困难的时候没有放弃自己,不停得努力学习,撞得头破血流也没有放弃对生命的探求)只有前面的反反复复才有后面的豁然开朗,“困难是上帝给你的礼物"这句话从来不是”鸡汤“,而是事实,只是在困难的时候要多”鼓励自己“告诉自己我只是”暂时没有成功“而已,一个人的任何东西都可以被剥夺,唯独人性最后的自由,在任何境遇中选择一己态度和生活方式的自由不能被剥夺.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,132评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,802评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,566评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,858评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,867评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,695评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,064评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,705评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,915评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,677评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,796评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,432评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,041评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,992评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,223评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,185评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,535评论 2 343

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,598评论 18 139
  • 首页 资讯 文章 资源 小组 相亲 登录 注册 首页 最新文章 IT 职场 前端 后端 移动端 数据库 运维 其他...
    Helen_Cat阅读 3,843评论 1 10
  • 原文链接 《Python数据分析》(Python for Data Analysis, 2nd Edition)第...
    李绍俊阅读 8,219评论 0 5
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,577评论 18 399
  • 文/二刀 健康是人生幸福的基础,人人想健康。但是看身边的人,真正健康的没有几个,大多处在亚健康状态。一年三百六十天...
    二刀阅读 2,118评论 20 26