从数据库中查询出来的结果一般是一个集合,这个集合叫做 QuerySet。
1. QuerySet 创建对象的方法:
一共有四种方法
# 方法 1 Author.objects.create(name="WeizhongTu", email="tuweizhong@163.com")
# 方法 2 twz = Author(name="WeizhongTu", email="tuweizhong@163.com")
twz.save()
# 方法 3 twz = Author()
twz.name="WeizhongTu"
twz.email="tuweizhong@163.com"
twz.save()
# 方法 4,首先尝试获取,不存在就创建,可以防止重复
Author.objects.get_or_create(name="WeizhongTu", email="tuweizhong@163.com")
# 返回值(object, True/False)
备注:前三种方法返回的都是对应的 object,最后一种方法返回的是一个元组,(object, True/False),创建时返回 True, 已经存在时返回 False
2. 获取对象的方法(上一篇的部分代码)
Person.objects.all() # 查询所有 Person.objects.all()[:10] 切片操作,获取10个人,不支持负索引,切片可以节约内存,不支持负索引,后面有相应解决办法,第7条 Person.objects.get(name="WeizhongTu") # 名称为 WeizhongTu 的一条,多条会报错 get是用来获取一个对象的,如果需要获取满足条件的一些人,就要用到filter Person.objects.filter(name="abc") # 等于Person.objects.filter(name__exact="abc") 名称严格等于 "abc" 的人 Person.objects.filter(name__iexact="abc") # 名称为 abc 但是不区分大小写,可以找到 ABC, Abc, aBC,这些都符合条件 Person.objects.filter(name__contains="abc") # 名称中包含 "abc"的人 Person.objects.filter(name__icontains="abc") #名称中包含 "abc",且abc不区分大小写 Person.objects.filter(name__regex="^abc") # 正则表达式查询 Person.objects.filter(name__iregex="^abc")# 正则表达式不区分大小写 # filter是找出满足条件的,当然也有排除符合某条件的 Person.objects.exclude(name__contains="WZ") # 排除包含 WZ 的Person对象 Person.objects.filter(name__contains="abc").exclude(age=23) # 找出名称含有abc, 但是排除年龄是23岁的
3. 删除符合条件的结果
和上面类似,得到满足条件的结果,然后 delete 就可以(危险操作,正式场合操作务必谨慎),比如:
Person.objects.filter(name__contains="abc").delete() # 删除 名称中包含 "abc"的人 如果写成 people = Person.objects.filter(name__contains="abc") people.delete() 效果也是一样的,Django实际只执行一条 SQL 语句。
4. 更新某个内容
(1) 批量更新,适用于 .all() .filter() .exclude() 等后面 (危险操作,正式场合操作务必谨慎)
Person.objects.filter(name__contains="abc").update(name=‘xxx‘) # 名称中包含 "abc"的人 都改成 xxx Person.objects.all().delete() # 删除所有 Person 记录
(2) 单个 object 更新,适合于 .get(), get_or_create(), update_or_create() 等得到的 obj,和新建很类似。
twz = Author.objects.get(name="WeizhongTu") twz.name="WeizhongTu" twz.email="tuweizhong@163.com" twz.save() # 最后不要忘了保存!!!
5. QuerySet 是可迭代的,比如:
es = Entry.objects.all() for e in es: print(e.headline)
Entry.objects.all() 或者 es 就是 QuerySet 是查询所有的 Entry 条目。
注意事项:
(1). 如果只是检查 Entry 中是否有对象,应该用 Entry.objects.all().exists()
(2). QuerySet 支持切片 Entry.objects.all()[:10] 取出10条,可以节省内存
(3). 用 len(es) 可以得到Entry的数量,但是推荐用 Entry.objects.count()来查询数量,后者用的是SQL:SELECT COUNT(*)
(4). list(es) 可以强行将 QuerySet 变成 列表
6. QuerySet 是可以用pickle序列化到硬盘再读取出来的
>>> import pickle >>> query = pickle.loads(s) # Assuming ‘s‘ is the pickled string. >>> qs = MyModel.objects.all() >>> qs.query = query # Restore the original ‘query‘.
7. QuerySet 查询结果排序
作者按照名称排序
Author.objects.all().order_by(‘name‘) Author.objects.all().order_by(‘-name‘) # 在 column name 前加一个负号,可以实现倒序
8. QuerySet 支持链式查询
Author.objects.filter(name__contains="WeizhongTu").filter(email="tuweizhong@163.com") Author.objects.filter(name__contains="Wei").exclude(email="tuweizhong@163.com") # 找出名称含有abc, 但是排除年龄是23岁的 Person.objects.filter(name__contains="abc").exclude(age=23)
9. QuerySet 不支持负索引
Person.objects.all()[:10] 切片操作,前10条 Person.objects.all()[-10:] 会报错!!! # 1. 使用 reverse() 解决 Person.objects.all().reverse()[:2] # 最后两条 Person.objects.all().reverse()[0] # 最后一条 # 2. 使用 order_by,在栏目名(column name)前加一个负号 Author.objects.order_by(‘-id‘)[:20] # id最大的20条
10. QuerySet 重复的问题,使用 .distinct() 去重
一般的情况下,QuerySet 中不会出来重复的,重复是很罕见的,但是当跨越多张表进行检索后,结果并到一起,可能会出来重复的值(我最近就遇到过这样的问题)
qs1 = Pathway.objects.filter(label__name=‘x‘) qs2 = Pathway.objects.filter(reaction__name=‘A + B >> C‘) qs3 = Pathway.objects.filter(inputer__name=‘WeizhongTu‘) # 合并到一起 qs = qs1 | qs2 | qs3 这个时候就有可能出现重复的 # 去重方法 qs = qs.distinct()
print str(User.objects.all().query)
print str(Author.objects.filter(name="WeizhongTu").query)
2.1 比如我们要获取作者的 name 和 qq authors = Author.objects.values_list(‘name‘, ‘qq‘)
如果只需要 1 个字段,可以指定 flat=True Author.objects.values_list(‘name‘, flat=True)
3.1 比如我们要获取作者的 name 和 qq Author.objects.values(‘name‘, ‘qq‘) list(Author.objects.values(‘name‘, ‘qq‘))
3.2 查询 twz915 这个人的文章标题 Article.objects.filter(author__name=‘twz915‘).values(‘title‘)
注意:
1. values_list 和 values 返回的并不是真正的 列表 或 字典,也是 queryset,他们也是 lazy evaluation 的(惰性评估,通俗地说,就是用的时候才真正的去数据库查)
2. 如果查询后没有使用,在数据库更新后再使用,你发现得到在是新内容!!!如果想要旧内容保持着,数据库更新后不要变,可以 list 一下
3. 如果只是遍历这些结果,没有必要 list 它们转成列表(浪费内存,数据量大的时候要更谨慎!!!)
extra 中可实现别名,条件,排序等,后面两个用 filter, exclude 一般都能实现,排序用 order_by 也能实现。
别名: tags = Tag.objects.all().extra(select={‘tag_name‘: ‘name‘})
5.1 计数
我们来计算一下每个作者的文章数(我们每个作者都导入的Article的篇数一样,所以下面的每个都一样)
Article.objects.all().values(‘author_id‘).annotate(count=Count(‘author‘)).values(‘author_id‘, ‘count‘)
5.2 求和 与 平均值
5.2.1 求一个作者的所有文章的得分(score)平均值
Article.objects.values(‘author_id‘).annotate(avg_score=Avg(‘score‘)).values(‘author_id‘, ‘avg_score‘)
5.2.2 求一个作者所有文章的总分
Article.objects.values(‘author__name‘).annotate(sum_score=Sum(‘score‘)).values(‘author__name‘, ‘sum_score‘)
articles = Article.objects.all()[:10] 这样会进行多次数据库查询。
articles = Article.objects.all().select_related(‘author‘)[:10] 这样只进行一次数据库查询。
和 select_related 功能类似,但是实现不同。
select_related 是使用 SQL JOIN 一次性取出相关的内容。
prefetch_related 用于 一对多,多对多 的情况,这时 select_related 用不了,因为当前一条有好几条与之相关的内容。
prefetch_related是通过再执行一条额外的SQL语句,然后用 Python 把两次SQL查询的内容关联(joining)到一起
articles = Article.objects.all()[:3] 多次执行查询语句
articles = Article.objects.all().prefetch_related(‘tags‘)[:3] 到第二条 SQL 语句,一次性查出了所有相关的内容。
在复杂的情况下,表中可能有些字段内容非常多,取出来转化成 Python 对象会占用大量的资源。
这时候可以用 defer 来排除这些字段,比如我们在文章列表页,只需要文章的标题和作者,没有必要把文章的内容也获取出来(因为会转换成python对象,浪费内存)
Article.objects.all()
Article.objects.all().defer(‘content‘)
和 defer 相反,only 用于取出需要的字段,假如我们只需要查出 作者的名称
Author.objects.all().only(‘name‘) 使用only时一定包含主键id。
原文:https://www.cnblogs.com/nanfeiyan/p/10296388.html