久闻python大名却一直没去了解,趁学校培训这个机会 开始正式学习python
第一天初步介绍一点关于python的东西
安装了环境及编译器
环境是在之前就安装了
只安装编译器anaconda
之后按照国际惯例
编写了第一个python程序“Hello world!”!
print(‘hello world‘)
之后的几个程序:
print (100+200)
print (‘傻猪,i love you!‘*100)
今晚主要知识点:
利用python爬取网页内容
#爬虫 #引入库 from bs4 import BeautifulSoup import requests #获取要爬取的网页地址 #myurl 是自己定义的 myurl=requests.get(‘https://movie.douban.com/‘) #print(myurl) #获取网页源代码数据 v_text=BeautifulSoup(myurl.text,‘lxml‘) #print(v_text) #爬取电影标题 v_title=v_text.find (‘span‘,attrs={‘property‘:‘v:itemreviewed‘}).textprint(v_title) #爬取类型和简介 #v_lei=v_text.find(‘span‘,attrs={‘class‘:‘pl‘,‘property‘:‘v:genre‘}).text #print(v_lei) /*这一部分自己写不会。。。是一个集合,不能用find 应该用findAll 参考下面*/ #v_jianjie = v_text.find(‘i‘,attrs={‘class‘:‘‘}).text #print(v_jianjie) /*这部分爬取简介是正确的!*/ #v_jian = v_text.find(‘div‘,attrs={‘class‘:‘indent‘,‘id‘:‘link-report‘}).text #print(v_jian) /*神奇的逗号,爬取了两段内容。嘿嘿嘿*/ #爬取热映电影多个 v_ry=v_text.findAll(‘li‘,attrs={‘class‘:‘title‘}) #print(v_ry) for i in v_ry: print(i.text)
第一次写博客,感觉写的不太好。2333333~
原文:https://www.cnblogs.com/zhouya1/p/9136337.html