1.大数据的概念
2015年国务院向社会公布了《促进大数据发展行动纲要》明确提出了大数据的基本概念:大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。
2.常用的大数据应用场景
(1)互联网领域三个场景:
①搜索引擎:帮助人们在大数据集上快速检索信息。
②推荐系统:在用户没有明确目的的时候根据用户历史行为信息帮助他们发现感兴趣的新内容。
③广告系统:根据用户的历史行为信息及个人基本信息,为用户推荐最精准的广告,通常涉及广告库、日志库等数据。
(2)电信领域
①网络管理和优化:包括基础设施建设优化、网络运营管理和优化。
②市场与精准营销:包括客户画像、关系链研究、精准营销、实时营销和个性化推荐。
③客户关系管理:包括客服中心优化和客户生命周期管理。
④企业运营管理:包括业务运营监控和经营分析。
⑤数据商业化:数据对外商业化,单独盈利。
(3)医疗领域
医学数据包括影像数据、病历数据、检验检查结果、诊疗费用等。
用于临床数据对比、药品研发、临床决策支持、实时统计分析、基本药物临床应用分析、远程病人数据分析、人口统计学分析、新农合基金数据分析、就诊行为分析等。
(4)金融行业
①客户画像应用:分为个人客户画像及企业客户画像。个人客户画像包括人口统计学特征、消费能力、兴趣、风险偏好等;企业客户画像包括企业的生产、流通、运营、财务、销售、客户、相关产业链上下游等。
②精准营销:在客户画像的基础上银行可以有效地开展精准营销,银行可以根据客户的喜好进行服务或者银行产品的个性化推荐,如根据客户的年龄、资产规模、理财偏好等,对客户群进行精准定位,分析出其潜在的金融服务需求,进而有针对性地进行营销推广。
③风险管控:包括中小企业贷款风险评估和欺诈交易识别等手段,银行可以利用持卡人基本信息、卡基本信息、交易历史、客户历史行为模式、正在发生的行为模式(如转账)等,结合智能规则引擎(如从一个不经常出现的国家为一个特有用户转账或从一个不熟悉的位置进行在线交易)进行实时的交易反欺诈分析。
④运营优化:包括市场和渠道分析优化、产品和服务优化等,通过大数据,银行可以监控不同市场推广渠道尤其是网络渠道推广的质量,从而进行合作渠道的调整和优化;银行可以将客户行为转化为信息流,并从中分析客户的个性特征和风险偏好,更深层次地理解客户的习惯,智能化分析和预测客户需求,从而进行产品创新和服务优化。
3.电子商务产生数据场景:
当用户通过浏览器在淘宝上查看或购买商品时,客户端回想淘宝后端HTTP服务器发送HTTP请求,服务器接收请求进行处理后,将相应内容返回给用户的同时,以日志形式将用户访问记录传入大数据系统,以便能够通过大数据技术理解用户的行为意图,进而为广告投放、商品推荐等提供数据支持。
文章内容整理于:董西成《大数据技术体系详解:原理、架构与实践》