实际工作中,大部分公司数据都会保存在数据库里,常用的数据库有MySQL,SQL Server和Oracle等,以下以MySQL为例介绍Python接连数据库读取数据的流程
1、环境准备
python有很多可以连接MySQL的包,比较之后,我觉得还是pymysql包简单易用,
安装pymyqsl包请参考教程:python安装第三方包
2、连接mysql数据库
import pymysql
from pandas import DataFrame,Series
import pandas as pd
import numpy as np
conn=pymysql.Connect(host="",port=‘’,user="", passwd="",
db="",charset='utf8')
cur=conn.cursor()
#host代表主机地址,port代表端口号,user代表用户名,passwd代表用户密码,db代表数据库名,charset代表数据库的编码
3、执行sql
1)普通sql语句
sql_text='select * from userlog'
df=pd.read_sql(sql_text,conn) #执行sql并转换为DataFrame格式
2)sql中含有中文
sql_text1="select * from t.branch where name='河南'".decode('utf8')
df=pd.read_sql(sql_text1,conn)
3)sql中含有模糊匹配
sql_text2="select * from t.branch where name like '%%taobao%%'"
df=pd.read_sql(sql_text2,conn)