首页 > 编程语言 > 详细

python学习值爬取百度翻译

时间:2020-10-28 14:18:02      阅读:45      评论:0      收藏:0      [点我收藏+]

话不多说,上货!

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

  1.  
    # 功能: 进行爬虫项目编写
  2.  
    # 开发时间: 2020/10/26 10:12
  3.  
    import requests
  4.  
    import json
  5.  
    if __name__ == ‘__main__‘:
  6.  
    #进行UA伪装,将userAgent分装到一个字典对象当中去,user-agent可以到浏览器当中通过抓包工具来获取
  7.  
    headers={‘User-Agent‘:‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36‘}
  8.  
    url = ‘https://fanyi.baidu.com/sug‘
  9.  
    word=input("请输入要查询的单词\n")
  10.  
    data={
  11.  
    ‘kw‘:word
  12.  
    }
  13.  
    response=requests.post(url,data=data,headers=headers)
  14.  
    response.encoding=‘utf-8‘#有时候所爬取的网页会发生乱码的现象,所以要对其进行编码
  15.  
    page_text=response.text#获取请求的文本信息
  16.  
    #当服务器对象所响应的字符串数据类型为json的时候,可以调用json方法类获取json字符串对象
  17.  
    dic_obj=response.json()#将获取到的多组json字符串数据以字典的方式来进行存放
  18.  
    print(dic_obj)
  19.  
    #对爬取到的数据对象进行持久化存储
  20.  
    filename=word+‘.json‘
  21.  
    fp=open(filename,‘w‘,encoding=‘utf-8‘)
  22.  
    json.dump(dic_obj,fp,ensure_ascii=False)#因为获取的字符串对象是中文,所以不能够进行ASCII编码
  23.  
    print("存储完毕")

请输入要查询的单词
application
{‘errno‘: 0, ‘data‘: [{‘k‘: ‘application‘, ‘v‘: ‘n. 申请; 请求; 申请书; 申请表; (尤指理论、发现等的)应用,运用; 涂抹; 敷用; 施用;‘}, {‘k‘: ‘applications‘, ‘v‘: ‘n. 申请; 请求; 申请书; 申请表; (尤指理论、发现等的)应用,运用; 涂抹; 敷用; 施用;‘}, {‘k‘: ‘Application Engineer‘, ‘v‘: ‘网络 应用工程师; 产品应用工程师; 技术工程师; 應用工程師; 应用系统工程师;‘}, {‘k‘: ‘application form‘, ‘v‘: ‘ 申请表;‘}, {‘k‘: ‘application letter‘, ‘v‘: ‘网络 英语求职信; 申请信; 求职信; 英文求职信; 一封求职信;‘}]}
存储完毕

技术分享图片

想学习程序员的小伙伴可以加小编创的Q群867067945哦。进群可以领取一份免费的学习资料哦。里面都是想学习程序员的小伙伴哦,大家一起交流学习呀

python学习值爬取百度翻译

原文:https://www.cnblogs.com/chenyunhui1994/p/13890051.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!