学R记2:数据研究

可视化→数据处理→可视化+数据处理→建模
数据可视化的学习过程容易有成就感,而非枯燥和挫败。良好的开端是成功的一半,坚持下来,离会用一门新语言就不远了。

1.数据研究

Data exploration is the art of looking at your data, rapidly generating hypotheses, quickly testing them, then repeating again and again and again. The goal of data exploration is to generate many promising leads that you can later explore in more depth.

image.png

2.为什么是可视化

Visualisation is a great place to start with R programming, because the payoff is so clear: you get to make elegant and informative plots that help you understand data.

In data visualisation you’ll dive into visualisation, learning the basic structure of a ggplot2 plot, and powerful techniques for turning data into plots.

3. 可视化够用吗

Visualisation alone is typically not enough, so in data transformation you’ll learn the key verbs that allow you to select important variables, filter out key observations, create new variables, and compute summaries.

4.怎么做更好

Finally, in exploratory data analysis, you’ll combine visualisation and transformation with your curiosity and scepticism to ask and answer interesting questions about data.

5.还需要什么

Modelling is an important part of the exploratory process, but you don’t have the skills to effectively learn or apply it yet. We’ll come back to it in modelling, once you’re better equipped with more data wrangling and programming tools.

参考资料:
https://r4ds.had.co.nz/explore-intro.html

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • pyspark.sql模块 模块上下文 Spark SQL和DataFrames的重要类: pyspark.sql...
    mpro阅读 9,951评论 0 13
  • 2017.5.28,非洲,桑给巴尔,晚上7:41。 已经是在非洲的第八篇文章了,我的右手也对我坚起了大拇指,不过不...
    丁当妈Jian阅读 1,389评论 4 14
  • 岁月的柔光打湿了我的心房 孱弱地前行在虚无缥缈的前方 总以为烟花三月是青春的梦想 寄人篱下却是一辈子幽长 谁曾经是...
    初秋微雨阅读 197评论 0 1
  • 故园中,孤馆外。古寺林阳,别后梅含蕊。 风软频邀吟晓媚。顾盼泠泠,万语千言里。 冻云寒,冬雨细。莫道凄凉,此去无悲...
    深蓝色木鱼阅读 465评论 0 5
  • 宝贝不理我了,所有的一切都是我在自嗨自叹。我不太喜欢把这种现象归结与生理现象,但是用人类感情来衡量是非常不牢固的。...
    我家亭子阅读 206评论 0 1

友情链接更多精彩内容