CSV文件
csv文件是指将数据列用逗号分隔的文件,文件的扩展名是.csv。
另一种数据类型,叫做制表符分隔值(TSV),TSV 和CSV唯一的不同之处在于,数据列直接的分隔符是制表符(tab),而不是逗号。
导入CSV数据
基于python 2.7 版本下的数据读取
import csv
file = open('wenjian.csv' , 'r')
reader = file.reader(file)
for x in reader:
print row
JSON文件
网站在像页面的JavaScript传输数据时,JSON也是最常用的数据,易于阅读且方便解析
导入JSON数据
imort json
json_data = open(wenjian.json ).read()
data = json.loads(json_data)
for item in data
print item
XML 数据
xml是一种标记语言,它具有保函格式化数据的文档结构,本质上只是个是特殊的数据文件。
导入xml 数据
from xml.tree import ELementTree as ET
tree = ET.parse('wenjian.xml')
root = tree.getroot()
#这里可以打印一下标签,找到你需要的标签
#print list(root)
data = root.find('Data')
all_data = []
for observation in data:
record = {}
for item in observation:
lookup_key = item.attrib.keys()[0]
if lookup_key == 'Numeric':
rec_key = 'NUMERIC'
rec_value = item.attrib['Numeric']
else:
rec_key = item.attrib[lookup_key]
rec_value = item.attrib['Code']
record[rec_key] = rec_value
all_data.append(record)
print all_data