这里我将爬取到的电影信息存到mysql数据库里面。
数据库配置信息
import pymysql
conn = pymysql.connect(
host = 'localhost', #服务器ip地址
port = 3306, #端口号
db = 'movie',#数据库名字
user = 'root', #数据库用户名
passwd = '123456',#数据库密码
charset = 'utf8mb4' #mysql中utf8不能存储4个字节的字符,此处与数据库中字符串编码类型都必须为utf8mb4
)
cursor = conn.cursor()
cursor.execute('sql语句')
tips:
- 数据库设计遵循三范式原则,每个表尽可能少的关联其他相关表的字段信息,所以获奖表、短评表、演员表都只保留了电影表相关电影的id;
- 电影表与演员表、评论表、获奖表都是一对多的关系;
- 其他电影相关信息与电影本身是一对一的关系,所以都写在了电影表中;
下面对数据库各表介绍:
-
演员表
-
获奖信息表
-
短评论表
-
主表--电影表