1.1 python连接数据库的几种方式

在使用python做数据清洗,数据处理等的时候第一步就需要连接数据源,连接数据源又多种多样,这里简单讲一下我最近练习用到的和网上找的python连接数据库的几种方式,并且总结了下来。


1  使用pandas


导入pandas、pymysql、sqlalchemy

engine = create_engine('mysql://(user):(password)@(host)/(database)?charset=gbk')

举例:

IP地址:122.111.180.131

用户名:data001

密码:data@144

数据库实例名:adventure

engine = create_engine('mysql://data001:data@144@3306/adventure?charset=gbk')

sql_cmd = 'select * from abc'     #选择数据表abc

df = pd.read_sql(sql = sql_cmd , con = engine)


2.使用pymysql

什么是 PyMySQL?PyMySQL 是在 Python3.x 版本中用于连接 MySQL 服务器的一个库,一般需要安装  

 pip3 install pymysql


import

pymysql

#打开数据库连接

db=pymysql.connect(host='1.1.1.1',port=3306,user='root',passwd='123123',db='test',charset='utf8')

cursor=db.cursor()#使用cursor()方法获取操作游标

sql ="select * from test0811"

cursor.execute(sql)

info = cursor.fetchall()

db.commit()

cursor.close()#关闭游标 

db.close()#关闭数据库连接


使用pymysql的connect()方法连接数据库,connect的几个参数解释如下:

host:MySQL服务的地址,若数据库在本地上,使用localhost或者127.0.0.1。如果在其它的服务器上,应该写IP地址。

port:服务的端口号,默认为3306,如果不写,为默认值。

user:登录数据库的用户名

passwd:user账户登录MySQL的密码

db:将要操作的数据库的名字

charset:设置为utf8编码,这样就可以存入汉字没有乱码

注意:除了port=3306不用引号,其它项的值都有用引号括起来

代码中的db就架起了Python和MySQL通信的桥梁,db.cursor()表示返回连接的游标对象,通过游标执行SQL语句。还有几个常用的方法是commit()表示提交数据库修改,rollback()表示回滚,就是取消当前的操作,close()表示关闭连接。

上面讲的是连接对象db的一些方法,游标对象的一些方法也很重要,利用游标对象的方法就可以对数据库进行操作了,游标对象的常用方法如下表:

名称描述

close()  关闭游标,之后游标不可用

execute(query[,args])  执行一条SQL语句,可以带参数

executemany(query,pseq)  对序列pseq中的每个参数执行SQL语句

fetchone()  返回一条查询结果

fetchall()  返回所有查询结果

fetchmany([size])  返回size条查询结果

nextset()  移动到下一条结果

scroll(value,mode='relative')      移动游标到指定行,如果mode='relative',则表示从当前行移动value条,如果mode=‘absolute’,则表示从结果集的第一行移动value条


3.pandas.DataFrame.to_sql

DataFrame.to_sql(name, con, schema=None, if_exists='fail', index=True, index_label=None, chunksize=None, dtype=None)

主要参数介绍如下,详细文档参考http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_sql.html

name:输出的表名

con:连接数据库的引擎

if_exists:三种模式{“fail”,“replace”,"append"},默认是"fail"。fail:若表存在,引发一个ValueError;replace:若表存在,覆盖原来表内数据;append:若表存在,将数据写到原表数据的后面。

index:是否将DataFrame的index单独写到一列中,默认为“True”

index_label:当index为True时,指定列作为DataFrame的index输出

dtype:指定列的数据类型,字典形式存储{column_name: sql_dtype},常见数据类型是sqlalchemy.types.INT()和sqlalchemy.types.CHAR(length=x)。注意:INT和CHAR都需要大写,INT()不用指定长度。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容