首页 > 编程语言 > 详细

R语言爬虫:穿越表单

时间:2018-01-18 19:12:03      阅读:235      评论:0      收藏:0      [点我收藏+]

使用rvest包实现实现穿越表单以及页面的跳转

formurl <- "http://open.xmu.edu.cn/oauth2/authorize?client_id=1010&response_type=code"
session <- html_session(formurl) 
#创建会话
form <- html_form(session) 
#得到网页内的所有表单,以list形式返回
str(form)
form <- form[[1]] 
#提取我们想要的表单
UserName <- "*******" #这里填写你自己的学号
Password <- "*******" #这里把password替换成你自己的密码
form <- set_values(form,'UserName'=UserName,'Password'=Password) 
#填写表单内容
out_url <- submit_form(session,form,submit=NULL) 
#在会话中提交表单,实现表单穿越
class(out_url)
session2 <- follow_link(out_url,'Advanced Econometrics')
course.info <- session2 %>% html_nodes("ul.section") %>% html_text() 
#爬取属性为section的ul节点,获取其下面列表的所有文本内容
cat(course.info[1])

R语言爬虫:穿越表单

原文:https://www.cnblogs.com/xihehe/p/8311739.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!