豆瓣电影top250爬虫系列(二)--- python数据库连接

github源码下载

  • 这里我将爬取到的电影信息存到mysql数据库里面。

  • 数据库配置信息

import pymysql

conn = pymysql.connect(
    host = 'localhost', #服务器ip地址
    port = 3306, #端口号
    db = 'movie',#数据库名字
    user = 'root', #数据库用户名
    passwd = '123456',#数据库密码
    charset = 'utf8mb4' #mysql中utf8不能存储4个字节的字符,此处与数据库中字符串编码类型都必须为utf8mb4
)

cursor = conn.cursor()
cursor.execute('sql语句')

tips:

  • 数据库设计遵循三范式原则,每个表尽可能少的关联其他相关表的字段信息,所以获奖表、短评表、演员表都只保留了电影表相关电影的id;
  • 电影表与演员表、评论表、获奖表都是一对多的关系;
  • 其他电影相关信息与电影本身是一对一的关系,所以都写在了电影表中;

下面对数据库各表介绍:

  • 演员表


    actor.jpg
  • 获奖信息表


    award.jpg
  • 短评论表


    comment.jpg
  • 主表--电影表


    movie.jpg
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容