2 计算经济地理中的数据分析与数据挖掘

在经济地理学中,人们通过观察和分析世界各种对象,发现了许多经济地理规律和法则。在经济地理学领域也可以通过海量数据揭示出有关经济地理的重要知识。通过对海量数据的分析和挖掘,我们可以揭示出不同地理区域的经济特征和发展趋势,为经济地理学研究提供了新的视角和方法。

2.1 海量数据背后蕴藏的经济地理知识

在经济地理学中,人们通过观察和分析世界各种对象,发现了许多经济地理规律和法则。在经济地理学领域也可以通过海量数据揭示出有关经济地理的重要知识。通过对海量数据的分析和挖掘,我们可以揭示出不同地理区域的经济特征和发展趋势,为经济地理学研究提供了新的视角和方法。

参考资料:骆剑承,胡晓东,吴炜等.地理时空大数据协同计算技术[J].地球信息科学学报,2016,18(05):590-598.

随着计算机数据库技术的不断发展和计算机的广泛应用,各行各业每天都在产生和收集大量的数据。数字技术深入嵌入到经济社会发展的方方面面,我们开展经济地理研究所需要的各种经济社会的数据,在虚拟空间产生并直接关联现实空间,形成了多维度、多结构和多来源的海量数据。每天产生的海量数据都蕴藏着经济地理学的宝贵信息。经济地理学研究者和管理者希望从这些数据中挖掘出隐藏的经济地理知识,以帮助他们作出更准确的决策。

  • 比如,对产业地理来说,海量数据可以帮助我们了解不同地区的经济结构、产业分布与时空格局变化。通过分析大规模的经济数据,我们可以发现不同地区的产业组合和产业链条,揭示出不同地区的产业优势和劣势。这有助于我们理解地区经济发展的动力和路径,为制定区域发展战略提供科学依据。

  • 其次,海量数据可以揭示出地区之间的经济联系和互动。通过分析跨地区的贸易数据、投资数据和人流数据等,我们可以了解不同地区之间的经济合作和竞争关系。这有助于我们理解地区间的经济一体化程度和互补性,为区域合作和经济政策制定提供参考。

  • 此外,海量数据还可以帮助我们预测和评估地区经济的发展趋势。通过对历史数据和趋势数据的分析,我们可以建立经济模型和预测模型,预测未来地区经济的增长潜力和风险。这有助于我们及时调整经济政策和资源配置,提高地区经济的竞争力和可持续发展能力。

海量数据为经济地理学研究提供了新的机遇和挑战。通过充分利用和分析海量数据,我们可以深入理解地区经济的特征和规律,为经济地理学的理论和实践提供更加准确和全面的支持。因此,数据分析在经济地理学中显得尤为重要。通过数据分析技术,可以赋予这些海量数据以意义,并从中提取有价值的经济地理知识,为决策提供参考和支持。

3.2 经济地理数据分析与挖掘的基本步骤

经济地理数据分析是利用经济地理学的理论和方法,对各种经济活动和地理环境的数据进行整理、筛选、加工和解释,从中发现有价值的信息和知识,用于指导经济地理规划和决策的过程。

数据分析的步骤为:数据收集——数据预处理——数据分析与知识发现——数据后处理。

数据收集

数据收集是指从各种来源获取经济地理相关的数据的过程,包括主动收集和被动收集两种方式:

  • 主动收集是指根据研究目的和设计,通过抽样、测量、编码、输入、核对等操作,获取少量但精确的数据。这类数据更多表现为结构化数据,是容易直接使用和支撑研究。
  • 被动收集是指利用传感器、照相机等电子设备,从网络、社交媒体、卫星遥感等渠道,自动或半自动地获取大量但冗余的数据。这类数据更多表现为非结构化数据,很多时候需要更进一步的处理才能够使用和支撑研究。

由于经济地理现象和过程的复杂性和多样性,在当前数字技术深入嵌入经济社会的背景下,经济地理数据分析可能需要处理大规模、高维度、多源的数据的情况越来越多,因此如何从被动收集的数据中提取有效的信息是一个重要的挑战。

数据预处理

数据预处理是指对收集到的数据进行清洗、转换、归约和集成,使其符合分析的要求的过程。数据预处理完成从数据到信息的转化,包括以下几个方面:

  • 首先,对数据进行描述性统计分析,得到数据的基本特征和分布情况;
  • 其次,分析数据质量,从一致性、完整性、准确性和及时性四个方面进行评估;
  • 再次,根据发现的数据质量问题对数据进行清洗,包括缺失值处理、噪声处理、异常值处理等;
  • 最后,对数据进行特征抽取,选择或构造与研究目标相关的变量,降低数据维度和复杂度。

数据分析与知识发现

数据分析与知识发现是指运用各种统计分析和数据挖掘技术,对预处理后的数据进行探索、建模、评估和验证,从中提取有用的模式、规律和关系,形成可理解的知识的过程。

参考文献:郭锐,孙勇,樊杰.“十四五”时期中国城市群分类治理的政策[J].中国科学院院刊,2020,35(07):844-854. 数据分析与知识发现完成从信息到认知的转化,主要分为有监督的和无监督的两类:

  • 有监督的分析是指在已知目标变量或类别标签的情况下,对数据进行分类分析、关联分析或回归分析;
  • 无监督的分析是指在未知目标变量或类别标签的情况下,对数据进行聚类分析或异常检测。

机器学习是人工智能的核心研究领域之一,它可以帮助经济地理学家处理复杂的非线性问题,发现隐含在数据中的深层次结构,构建有效的预测和分类模型,实现对经济地理现象和过程的智能化认知和控制。

数据后处理

数据后处理是指将分析得到的知识应用于实际问题,并通过可视化等方式呈现给用户或决策者的过程。数据后处理主要包括以下两个方面:

  • 一方面,将知识提供给决策支持系统或专家系统,帮助用户或决策者进行优化、规划或评估;
  • 另一方面,将知识通过图表、地图、动画等方式可视化,帮助用户或决策者更直观地理解和评价。

2.3 Python与数据分析

数据分析需要与数据进行大量的交互、探索性计算以及过程数据和结果的可视 化等,过去有很多专用于实验性数据分析或者领域的特定语言,如R语言、 MATLAB、SAS、SPSS等。与这些语言相比,Python具有以下特点:

Python是面向生产的

Python是一种通用的编程语言,它可以用于实现各种应用程序和系统,包括数据分析。Python不仅可以用于实验性的研究和原型构建,还可以直接用于生产环境中,无需使用其他语言进行重写或转换。这样可以节省时间和成本,提高效率和可维护性。Python也可以与其他语言进行互操作,利用其优势和功能。

强大的第三方库的支持

Python是一种开源的语言,有着庞大的社区和丰富的资源。Python有很多专门用于数据分析的第三方库,提供了各种数据处理、统计分析、数据挖掘、机器学习、可视化等功能。常用的有NumPy、Pandas、SciPy、Scikit-learn、Matplotlib、Seaborn等。这些库都是由专业的开发者和研究者维护和更新的,能够快速适应新的需求和技术。

Python的胶水语言特性

Python是一种胶水语言,它可以将不同的语言和模块连接起来,形成一个整体。一些底层用C语言写的算法封装在Python包中,可以直接调用,无需编写复杂的代码。例如NumPy底层是用C语言实现的,所以对于很多运算,它的速度都比用R语言等语言实现的要快。Python也可以调用其他语言编写的模块或库,利用其功能和特点。例如Python可以调用R语言、Java、Fortran等语言编写的模块或库。

2.4 像学习语言一样学习Python

Python是一门编程语言,但它与我们学外语,比如英语可能有很多相似之处。学习Python就像学习一门新的语言一样,需要掌握其语法、词汇和语义。下面将详细介绍学习Python的重要性及其基本技巧。

学习Python的优势

  • Python是一门通用的编程语言。Python是一门通用的编程语言,它可以用于开发各种类型的应用程序,包括网站开发、数据分析、人工智能等。掌握Python可以让你在不同领域都能发挥自己的编程能力。

  • Python易于学习和使用。相比其他编程语言,Python具有简洁、易读的语法,使得初学者能够快速上手。Python的语法规则与英语的语法规则相似,例如使用缩进来表示代码块,这使得代码更加易读和易于理解。

  • Python拥有丰富的资源和社区支持。Python拥有庞大的开源社区,这意味着你可以轻松地找到大量的学习资源和解决问题的方法。无论你是初学者还是有经验的开发者,都可以从社区中获得帮助和支持。

  • Python在行业中广泛应用。Python在许多行业中都有广泛的应用,包括科学研究、金融、教育、媒体等。掌握Python可以为你的职业发展带来更多机会和竞争力。

  • Python具有强大的库和框架。Python拥有丰富的第三方库和框架,例如NumPy、Pandas、Django等,这些库和框架可以帮助你更高效地开发应用程序。通过学习和使用这些库和框架,你可以提高自己的编程能力和效率。

学习Python的技巧

学习Python就像学习一门新的语言一样,需要不断练习和实践。掌握Python将为你的职业发展和个人成长带来巨大的好处。无论你是初学者还是有经验的开发者,都应该重视学习Python的重要性,并不断提升自己的编程能力。下面是一些学习Python语言的技巧:

  • 制定学习计划:学习Python语言需要有一个明确的学习计划。可以根据自己的时间和目标,制定一个合理的学习计划,并按照计划进行学习。

  • 多练习:学习Python语言最重要的是多练习。通过编写代码来巩固所学的知识,可以选择一些练习题或者项目来进行实践。

  • 阅读文档:Python有非常完善的官方文档,可以通过阅读官方文档来深入了解Python的各种特性和用法。同时,还可以阅读一些优秀的第三方库的文档,了解如何使用这些库来提高编程效率。

  • 参与社区:Python有一个非常活跃的社区,可以通过参与社区来学习和交流。可以加入一些Python的论坛、社交媒体群组或者参加一些线下活动,与其他Python爱好者交流经验和学习资源。

  1. 刻意练习:学习Python语言时,可以采用刻意练习的方法。选择一些具有挑战性的练习题,通过解决这些问题来提高自己的编程能力。

  2. 学习资源:学习Python语言时,可以利用各种学习资源,如教程、视频、书籍等。可以选择适合自己的学习资源,根据自己的学习习惯选择最有效的学习方式。

2.5 小结

结合我自身的经验来看,在没有基础的情况下学习Python语言尤其需要坚持不懈地努力和实践。通过制定学习计划、多练习、阅读文档、参与社区、刻意练习和利用学习资源等方法,可以提高自己的Python编程能力。

本公众号已经在之前的推文中分享了Python入门的多个基本技巧,入门关键就是实践,写多了就顺手了。学习Python一定不存在学科背景对你有多大约束,更多时候表现为自身对编程语言的畏惧。

我有好几个朋友,曾经特别想学Python,找我咨询了学习的经验。我也很诚恳和详实地告知了我的心得,并推荐了学习资料。他们依然学不进去,甚至有人还花几千块钱,专门报班。我想只是付费也是可以,只要能学下去,并形成自己的一门技能,但他们中大多数结果都在畏难和不坚持中放弃了。

至少我0编程基础,现在可以熟练地使用Python编程,并很大程度辅助我完成研究,这足以作为一个正向的说明。在起初,我可能写论文还依赖多个工具,比如stata、matlab,但现在我也都更加集中使用Python了,其便利性,我想不用多说,网络有太多这方面的资料。

参考资料

  1. 嵩天,礼欣,黄天羽著. Python 语言程序设计基础(第2版)[M]. 高等教育出版社, 2017.
  2. 卜坤. Python与开源GIS——数据处理、空间分析与地图制图[M]. 科学出版社, 2022.
  3. 王劲峰, 廖一兰, 刘鑫. 空间数据分析教程(第2版)[M]. 科学出版社, 2021.
  4. 美]韦斯·麦金尼. 利用Python进行数据分析(原书第2版) [M]. 机械工业出版社, 2018.
  5. 崔庆才. Python3网络爬虫开发实战(第2版)[M]. 人民邮电出版社, 2021.
  6. 涂铭,刘祥,刘树春. Python自然语言处理实战:核心技术与算法[M]. 机械工业出版社, 2018.
  7. 陈洁. 复杂系统建模与仿真――基于Python语言[M]. 电子工业出版社, 2021.
  8. 唐宇迪. 跟着迪哥学Python数据分析与机器学习实战[M]. 人民邮电出版社, 2019. 周志华. 机器学习[M]. 北京: 清华大学出版社, 2016.
  9. 崔功豪. 区域分析与区域规划(第三版)[M]. 高等教育出版社, 2018.

近期文章

基于Python的计算经济地理学:引论

经济地理学笔记再出发

Python定量城市研究和计算社会科学研究常用库

耦合协调度模型的基本原理与Python实现

TOPSIS—熵权法的基本原理与基于Python实现代码

基于python构建空间权重矩阵

Python空间分析||geopandas安装与基本使用

更多内容请翻看历史记录

如果觉得有用就“分享、收藏、在看、点赞 ”

本文使用 文章同步助手 同步

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,384评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,845评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,148评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,640评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,731评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,712评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,703评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,473评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,915评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,227评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,384评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,063评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,706评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,302评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,531评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,321评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,248评论 2 352

推荐阅读更多精彩内容