你在用计算机、手机或信用卡做的每一件事所产生的与你有关的数据几乎都被仔细地收集、分析,并且永远地保存了起来,这些信息往往被卖给了你对其一无所知的机构。
今天我们就来讲一下计算机数据与信息的搜索、跟踪、社交网络、云计算。
1、搜索
搜索引擎的主要任务是通过在服务器上对已存储网页信息进行组织来应对可能的查询。通过万维网上的爬虫采集,扫描网页并将相关内容存储在数据库中,这样便可以快速地回答随后的查询。这是缓存的大规模应用:搜索结果都基于对缓存网页信息的预先计算。
搜索引擎怎么工作?从用户角度来看,他们会在网页上的表单中填写查询条件,然后把这个条件发送给服务器。服务器差不多马上就会返回一组链接和文本摘要。从服务器的角度来看则要复杂得多。服务器会生成一组包含查询关键词的页面,按照相关程度进行排序,再在 HTML中附上页面的摘要,然后再发给用户。
2、跟踪
跟踪对任何广告行为都会适用:定位越精准,收到的顾客回应越积极,因此广告商也更愿意投入资金。对你的在线行为进行跟踪,你搜索了什么,访问了哪些网站,以及你在访问网站时做了什么,这些都可以显示关于你的大量信息,以及你的生活组成。在大多数情况,现在的跟踪说是为了更有效地向你推销产品,但是不难想象如此详细的信息会被用于什么样的其他目的。无论如何,这部分的重点主要在于跟踪的机制: cookie、网络漏洞、JavaScript和浏览器指纹。
只要上网,我们的信息就免不了被收集。不留下蛛丝马迹,几乎什么也干不了。使用其他系统时也一样,特别是使用手机的时候,手机网络随时都知道我们的位置在哪里。如果是在户外,支持GPS的手机(现在的智能手机几乎都支持)定位用户的误差不超过10米,而且随时都会报告你的位置。有些数码相机也带GPS,可以在照片中编入地理位置信息,这种做法称为打地理标签。新式照相机可以用wifi上传照片,这很有可能也会被用来进行跟踪。
3、社交网络
社交网络含义包括硬件、软件、服务及应用,由于四字构成的词组更符合中国人的构词习惯,因此人们习惯上用社交网络来代指SNS。
对我们访问的网站进行跟踪不是唯一的信息采集方式,事实上,社交网络的使用者自愿提供大量个人隐私以换取娱乐和与其他人保持联系。
社交网站都是触及隐私问题的,因为它们收集很多有关使用者的信息,并且通过向广告商出售这些信息获利。
4、云计算
云计算是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,然后通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。
总结
在使用计算机科技的同时,我们创造了大量详细的数据,其数量远远超出我们的想象。这些数据都被获取为商用:分享、组合、研究,甚至出售,远远超出我们的认知。这些代价来自于我们引以为傲的可贵免费服务,如搜索、社交网络和无限的在线存储。对于数据收集的公众意识正在增强,虽然目前还远远不够。足够多的人开始使用广告拦截插件,这已经引起了广告商的注意。鉴于网络广告往往在无意中成为恶意软件供应商,对广告进行拦截是谨慎的。总之大家要注意保护好自己的个人信息以免被犯罪分子利用。