txt保存

时间：2019-11-22 18:03:36 阅读：89 评论：0 收藏：0 [点我收藏+]

import urllib.request
from bs4 import BeautifulSoup
import os
import time
#找到网址
def getDatas():
   url="https://movie.douban.com/top250"
   # url="file:///E:/scrapy/2018-04-27/movie/movie.html"
   # 打开网页
   res=urllib.request.urlopen(url)
   # 转化格式
   response=BeautifulSoup(res,‘html.parser‘)
   # 找到想要数据的父元素
   datas=response.find_all(‘div‘,{‘class‘:‘item‘})
   # print(datas)
   #创建存放数据的文件夹
   folder_name="output"
   if not os.path.exists(folder_name):
           os.mkdir(folder_name)
   # 定义文件
   current_time=time.strftime(‘%Y-%m-%d‘,time.localtime())
   file_name="move"+current_time+".txt"
   # 文件路径
   file_path=folder_name+"/"+file_name

   for item in datas:
       # print(item)
       rank=item.find(‘div‘,{‘class‘:‘pic‘}).find(‘em‘).get_text()
       title=item.find(‘div‘,{‘class‘:‘info‘}).find(‘div‘,{‘class‘:‘hd‘}).find(‘a‘).find(‘span‘,{‘class‘:‘title‘}).get_text()
       picUrl=item.find(‘div‘,{‘class‘:‘pic‘}).find(‘a‘).find(‘img‘).get(‘src‘)
       # print(picUrl)
       # 保存数据为txt格式
       try:
           with open(file_path,‘a‘,encoding="utf-8") as fp:
               fp.write("排名:"+rank+‘\n‘)
               fp.write("标题:"+title+‘\n‘)
               fp.write("图片路径:"+picUrl+‘\n\n‘)
       except IOError as err:
           print(‘error‘+str(err))
       finally:
           fp.close()
   pass

txt保存

原文：https://www.cnblogs.com/1208xu/p/11913030.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)