大家好 本节课中 我们将介绍如何度量相异性
即相异性指数 我们将用它来表征在不同城市
和不同地区的隔离程度还记得上节课中
我曾运用过谢林的隔离模型 发现虽然
人们具有相当的忍耐度 他们能够与不同收入的群体或
不同种族的人住在一起 但最终还是被隔离开来
仔细观察遍布全美的许多城市 我们会看到大量
由于收入差异造成的隔离 大量的种族隔离而我们想知道
接下来也要讲到——我们是否能建立起某种度量法
某种数值分类法 来定量描述一个特定城市在某个特定维度的隔离情况
因为当你们有了这些度量方法,我们就可以
更好地理解数据 能更好地利用和解读数据
这也是我们建模的原因之一 开始之前
让我们先回顾一下这些隔离的图样
这里是纽约城 记住红色区主要是白种人
蓝色区主要是美国黑人
黄色 主要是拉美裔 而绿色主要是亚裔纽约非常有意思
就像是这些大片大片的不同种族群体
扩展开来并遍布了整个城市 并不是所有的城市看起来都一样 这是洛杉矶
洛杉矶的这块区域称为“山谷区” 主要是白人区
南部中心 这里主要是美国黑人 然后这边
在蒙特利公园这主要是亚裔 如果看看休斯顿 你们会再次看到这样有趣的
隔离图样 以及人们是如何按种族在城市分布的
而如果去看华盛顿特区 那里几乎像画了一道分割线一样
在它的东部 绝大多数是美国黑人而在西部 大部分是白人
所以 不同的城市看起来各不一样我们想要做的是
用数字来表征这种种族差异 好了
现在记住这也适用于表征收入情况 所以我们同样也可以用数字来描述收入差异 如果你们看看
像芝加哥这样的城市 这里红色代表富人
所以这就是著名的富人聚居的“黄金海岸”
市中心主要是穷人 然后在北部和西部的城郊
这些地方成为"衣领村" 因为它的形状
看起来像一个衣领 这里同样是富人区 再来看纽约 记住 这里的红色点代表
年收入超过二十万美金的有钱人 在中央公园四周
你都能看到富人 而一旦远离城区
你们会看到穷人 这种现象很有意思纽约与芝加哥稍微有点不同
纽约的市中心聚集着大量的财富
而一旦出了城区 就变穷了 芝加哥则看起来相反
所以我们想要做的 用一种方法来度量城市的隔离程度
因此,我们将建立一种非常简单的度量方法称为“相异性指数”
我们会用它来处理两种人——富人和穷人
那么我用蓝点表示富人 用黄点表示穷人
现在我要把这些人放进网格里
这是一个具有24格的城市街区网格每个区我会
放进10人 那就开始了 假设这边12个区我全部
放富人 然后这边6个区全部是穷人
剩下这6个区都是是穷人富人各一半
那么总人数是多少?记得我说过 这边12个区
每区放10个富人 这边有120个富人然后这边6个区
不过每区各有5个富人和5个穷人 所以这边30个富人
那么120+30=150 所以有150个富人同理得有90个穷人 所以总共240人
富人150人 穷人90人 而我想用某种方式来
表示这些城市街区的隔离程度 现在 有意思的
是这些地区 这些绿色的地区 不像这些蓝区和黄区那么隔离
所以我想要一种能够抓住这一特点的度量法好了 那么我该怎么做?
我接下来就要表示了我用字母b表示一个街区的蓝色人数
小写字母b 再用大写字母B表示蓝色的总人数
然后若我用小b除以大B 那就是 那个街区的蓝色人数
在所有蓝色人中所占的百分比 所以这只是
给出了那个街区的蓝色人数占其总数的比例
类似地 小y除以大Y给出了那个街区的黄色人数
占其总数的比例 为什么我要这么做?
为什么我要研究这两个比例?因为如果我做b/B与y/Y的差值
就会得出那个特定街区的人口分布的变形程度
让我更精确一点 假设我让
一个区有5个蓝色人和3个黄色人
这将是一个完美的典型街区
这意味着5/150 总共有150个蓝色人
而其中5人居住在那个特定街区 于是 5/150
即1/30 所以有1/30的蓝色人处住在该街区
现在总共还有90个黄色人 其中3人住在该街区所以各有1/30的
黄色人 或穷人住在该区
那么1/30减去1/30等于0 所以我们得到
这是一个代表贫富(比例)的完美街区
在这里所谓的蓝与黄的差值为0 但是如果
我们有较多的蓝色人或较多的黄色人 我取绝对值
就是这两条竖线的意思 绝对值 它的意思
是我会得到一个正数 接下来我要计算更多街区的隔离
所以让我们看一下具体例子 例如
这里的这个街区是全蓝的 对吗?并且每区有10个蓝色人现在 蓝色总人数共150人
所以10/150的蓝色人住在该区 没有黄色人
没有穷人住在该区 那么我将10/150减去0/90
就等于10/150 我把零约掉 得到1/15
所以在每一个蓝色街区 我的指数会是1/15 现在
在这边的黄色街区 没有蓝色人 没有富人 所以
是0/150 但是有10个黄色人 即穷人 所以是10/90
所以这里相较蓝黄的(总人数)比例来说黄人太多了那么
拿0减去10/90 得到了1/9 这些绝对值符号
使得结果都是正数 因此
这些区 这些街区都是1/9 那么最后我还有这些绿色区域
还记得这些地方每街区有5个蓝色人所以有5/150
同时每区有5个黄色人 就是5/90我再取绝对值
我怎样得到结果?这是1/30 再减去1/18
所以这就复杂了 不过我们会得出结果等于1/45
对吗? 这是1/45 所以我们得到
在那10个蓝区 每区的相异性指数是1/15
在每一个黄区相异性指数是1/9
并且每一个5蓝5黄的街区是1/45 好了
我们如何算出这整片区域的隔离程度?我们要做的就是
我们这有6个街区 相异性均为1/45所以我们要把1/45乘以6
然后这边6个区相异性均为1/9
所以我们要加上把1/9乘以6我们有12个相异性为1/15的地区
我们得用12乘以1/15那么如果我们把各项全部加起来
会得出72/45 所以我们暂时得到72/45
我们得将它做些变动 因为这个结果表示什么呢72/45是什么意思呢?
是差还是好?所以让我们让我们回顾一遍考察下这个结果
所以每当你建立起一种度量时 你要尝试一些极端的例子看看它效果如何
我们从一个更简单的例子开始看看这种度量是否有道理
这有4个街区 全是蓝色的 还有4个全黄的
这是另一个例子 我让这8个区每个区都蓝黄各半
然后我们来求它们的相异性指数 那么我们从
这一个开始 在这些街区 每区有
5个蓝色人 还有5个黄色人 蓝黄总人数
因为我有8个街区 总共有80人所以这意味着总共有40个蓝色人
和40个黄色人 所以在这些街区每区都是5/40
减去5/40 得0 所以每个单独的街区都贡献一个0
总的相异性指数即为0 所以这结果很好
因为这代表 如果人们完美地混合在一起指数就会是0
所以这似乎是一个相当不错的指数但是让我们回头看看另一个例子
现在我来看 这个例子是4个区全黄
4个区全蓝 所以 再一次得到40个黄色人
和40个蓝色人 可是我们要想想黄色区里的每一个街区能得出什么结果?
我会得出蓝色人的0/40 减去黄人的5/40
对吗?抱歉 应该是10 10 所以我们有10个黄色人在每个区 所以是10/40的黄色人
那么也就是等于1/4 而且因为这些区都一样
我还会接着得到一个1/4 一个1/4 再一个1/4 同时
还有蓝区对吗?同样的逻辑
每个街区都会得到1/4当我把这些值全部加起来 会得到2
不是1 而是2 所以 现在我有点问题 当人们
被完全隔离 我会得到2 而如果人们被完美混合 会得到0 所以这表明
我得到了一套相当不错的度量法 但是我可能想要
做的是将它除以2 如果我将它除以2 那么如果
完美混合 你会得出结果为0而如果处于完全被隔离的状态 你会得出结果为1
没问题吧?那么 当我回到之前的例子这里有40个富人和40个穷人
他们被充分混合 我的结果会是0 因为每个区有
5蓝5黄 噢 这应该是5 所以我得到结果为0
而当我研究另一种情况 我得到结果为1 现在
当我看着之前的结果72/45 没有任何意义 现在它成了
72/90 而如果我把它除以9 就是0.8
所以是80% 所以这相当于80%的隔离程度 似乎相当严重
现在我们可以回过头来 看看我们的城市
现在我们可以回顾下人口普查数据
我们可以看看像费城这样的城市
我们会给它的隔离程度打分 对吗?注意到它将高达0.8
正如我们的例子 所以这告诉了我们费城得分为0.8 现在
如果你看着地图说 这地方的隔离有多严重?我们现在可以打分
现在我们可以拿费城与底特律相比还记得底特律看起来也是
隔离很严重的 当我们计算底特律的得分时 尽管看起来隔离很严重
它的得分只有0.6 所以底特律的隔离程度实际上比费城要轻一些
如果你们看看这两幅图 这是费城
这是底特律 要分辨两者间的差别是非常难的
好了 那么我们这节课学到了什么?我们刚刚学到了
我们可以建立一种非常简单的度量法 称为相异性指数
而且通过这种方法我们可以比较不同城市的隔离程度
并且现在 一旦我们掌握了这个方法 我们可以用它衡量
种族隔离 收入隔离 以及各种各样的隔离
这真是一个帮助我们获取数据和理解世界的得力工具
好了 谢谢大家
2-3
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 第一章 安娜困倦地睁开了双眼。她是一个脸还完全没长开的小女孩,也就是说她的脸蛋仍然圆鼓鼓的,两个黑宝石一样的眼睛嵌...