首页 > 其他 > 详细

第一个爬虫与测试

时间:2020-05-13 17:47:16      阅读:50      评论:0      收藏:0      [点我收藏+]

第一个爬虫和测试

一、完善球赛程序,测试你写的球赛程序,所有函数的测试结果

实例代码

预测球队比赛结果代码:

def GameOver(a,b):
    if a>=10 and b>=10:
        if abs(a-b)==2:
            return True
    if a<10 or b<10:
        if a==11 or b==11:
            return True
    else:
        return False

测试:

技术分享图片
 1 def GameOver(a,b):
 2     if a>=10 and b>=10:
 3         if abs(a-b)==2:
 4             return True
 5     if a<10 or b<10:
 6         if a==11 or b==11:
 7             return True
 8     else:
 9         return False
10 try:
11     c=GameOver(15,13)
12     print(c)
13 except:
14     print("error")
View Code

技术分享图片

 

运行结果正确 

二、使用request库的get()函数访问百度网页20次并且打印返回状态,text内容,计算text()属性和content()属性所返回网页内容的长度

1.访问一次

a.代码

import requests
r = requests.get("http://www.google.cn",timeout=30)
print("状态 = {}".format( r.status_code))
print("text内容 = {}".format(r.text))
print("text编码方式 = {}".format(r.encoding))
print("二进制形式 = {}".format(r.content))

b.结果

技术分享图片

 

技术分享图片

 

技术分享图片

 

 

 2、访问20次

a、代码

import requests
for i in range(20):
    r = requests.get("http://www.google.cn",timeout=30)
    print("状态 = {}".format( r.status_code))
    print("text编码方式 = {}".format(r.encoding))
    print("text内容 = {}".format(r.text))
    print("二进制形式 = {}".format(r.content))

 b、结果

http://localhost:8888/notebooks/Untitled15.ipynb?kernel_name=python3

太长了可以自行查看??

三、HTML页面的简单操作

a、代码

import requests
from bs4 import BeautifulSoup
soup = BeautifulSoup("<!DOCTYPE html><html><head><meta charset=‘utf-8‘>                   <title菜鸟教程(rounoob.com)</title></head><body>                   <h1>我的第一标题</h1>                   <p id=‘first‘>我的第一个段落。</p></body>                     <table border=‘1‘><tr><td>row 1,cell 1                   </td><td>row 1,cell 2</td></tr><tr><td>row 2,cell 1                   </td><td>row 2,cell 2</td></tr</table></html>")

print(soup.head,"06")                 #获取并打印head标签的内容和学号后两位
print(soup.body)                      #获取并打印body的内容
print(soup.find_all(id="first"))      #获取并打印id为first的文本
print(soup.h1.string,soup.p.string)   #获取并打印html页面中的中文字符

b、结果

技术分享图片

 

第一个爬虫与测试

原文:https://www.cnblogs.com/Cute-pig/p/12883438.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!