mongo数据库链接
import pymongo
def test():
client = pymongo.MongoClient("127.0.0.1:27017")
db = client['test_db']
collection = db['test_collection']
# 也可以这样写
collection = pymongo.MongoClient("127.0.0.1:27017")['test_db']['test_collection']
if __name__ == '__main__':
test()
插入数据
import pymongo
def test():
collection = pymongo.MongoClient("127.0.0.1:27017")['test_db']['test_collection']
# 用dict组织数据比较方便
# _id 是mongo默认生成的主键,同时会建立索引,也可以在代码中复制(唯一),也会自动建立索引
# 目前三个插入数据的接口,insert_one insert_many insert
insert_one = {
'_id': 1,
'data': 'test insert one'
}
insert_many = [{'_id': 3, 'data': 'test insert many'},
{'_id': 4, 'data': 'test insert many'}]
insert = {
'_id': 5,
'data': 'test insert'
}
# insert_one
# 插入时可以返回 id
collection.insert_one(insert_one).inserted_id
# insert_many
collection.insert_many(insert_many).inserted_ids
# insert
# 在使用insert时,会有警告 insert is deprecated. Use insert_one or insert_many instead.
# 所以推荐使用insert_one 或 insert_many
collection.insert(insert)
if __name__ == '__main__':
test()
删除数据
import pymongo
def test():
collection = pymongo.MongoClient("127.0.0.1:27017")['test_db']['test_collection']
# 目前两个删除数据的接口,delete_one delete_many
delete_one = {'_id': 1}
# $in 见文章末尾的$高级用法
delete_many = {'_id': {'$in': [3, 4]}}
# delete_one
collection.delete_one(delete_one)
# delete_many
collection.delete_many(delete_many)
if __name__ == '__main__':
test()
更新操作
import pymongo
def test():
collection = pymongo.MongoClient("127.0.0.1:27017")['test_db']['test_collection']
# 目前两个删除数据的接口,update_one update_many
# 更新条件,一条数据
condition = {'_id': 5}
update_data = {'$set': {'update': 'update_test'}}
collection.update_one(condition, update_data)
# 更新条件,多条数据, 此操作只能使用 $set $inc 等操作符
condition = {'_id': {'$gt': 2}}
update_data = {'$set': {'update_many': 'test update many'}}
collection.update_many(condition, update_data)
# collection.update_one(condition, update_data,upsert=True)
# 可以实现upsert的操作,还可以用$setOnInsert 保证某些数据只在插入时有效
if __name__ == '__main__':
test()
查询操作
import pymongo
def test():
collection = pymongo.MongoClient("127.0.0.1:27017")['test_db']['test_collection']
# 目前两个删除数据的接口 find find_one
# 查询所有文件, 返回值是Cursor类型, 需要遍历取元素,每个元素都是字典型
# 条件查询 condition = {'_id': {'$gt': 2}} 表示 _id > 2
cursor = collection.find({})
cursor = collection.find({'_id': {'$gt': 2}})
# 单条查询, 返回值是字典型
doc = collection.find_one({'_id': 3})
if __name__ == '__main__':
test()
索引
import pymongo
from pymongo import IndexModel
def test():
collection = pymongo.MongoClient("127.0.0.1:27017")['test_db']['test_collection']
# 目前两个删除数据的接口 find find_one
# 创建一个字段的索引,1 代表升序, unique=True 表示是否唯一
collection.create_index([('name', 1)], unique=True)
# 创建多个字段的索引
index1 = IndexModel([("index", pymongo.DESCENDING), ("one", pymongo.ASCENDING)], name="index_one") # 复合索引
index2 = IndexModel([("index2", pymongo.DESCENDING)])
collection.create_indexes([index1, index2])
if __name__ == '__main__':
test()
$ 高级用法
数学比较符
$lt 小于 {'_id': {'$lt': 1}}
$lte 小于等于 {'_id': {'$lte': 1}}
$gt 大于 {'_id': {'$gt': 1}}
$gte 大于等于 {'_id': {'$gte': 1}}
$ne 不等于 {'_id': {'$ne': 1}}
查询关键字
$in 在范围内 {'_id': {'$in': [1, 2]}}
$nin 不在范围内 {'_id': {'$nin': [1, 2]}}
$or or {'$or':[{'_id':19},{'name':'test'}]}
$and and{'$and':[{'_id':{'$lte':2}},{'_id':{'$gte':1}}]}
$all 与$in类似,但有区别 {'data':{'$all':[1,2,3]}} 要求data属性包含所有的[1,2,3]条件
修改器
$set 强制替换覆盖
$unset 强制删除字段
$setOnInsert upsert时强制指定插入字段
$inc 引用增加 例:原字段+1
最近对爬虫比较感兴趣,顺手把用到pymongo基础操作总结一下备忘