首页 > 其他 > 详细

爬取京东商城商品信息

时间:2019-03-12 20:41:44      阅读:156      评论:0      收藏:0      [点我收藏+]
from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By #按照什么方式查找,By.ID,By.CSS_SELECTOR
from selenium.webdriver.common.keys import Keys #键盘按键操作
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait #等待页面加载某些元素
import time


def get_goods(driver):
    try:
        goods=driver.find_elements_by_class_name(gl-item)

        for good in goods:
            detail_url=good.find_element_by_tag_name(a).get_attribute(href)

            p_name=good.find_element_by_css_selector(.p-name em).text.replace(\n,‘‘)
            price=good.find_element_by_css_selector(.p-price i).text
            p_commit=good.find_element_by_css_selector(.p-commit a).text

            msg = ‘‘‘
            商品 : %s
            链接 : %s
            价钱 :%s
            评论 :%s
            ‘‘‘ % (p_name,detail_url,price,p_commit)

            print(msg,end=\n\n)


        button=driver.find_element_by_partial_link_text(下一页)
        button.click()
        time.sleep(1)
        get_goods(driver)
    except Exception:
        pass

def spider(url,keyword):
    driver = webdriver.Chrome()
    driver.get(url)
    driver.implicitly_wait(3)  # 使用隐式等待
    try:
        input_tag=driver.find_element_by_id(key)
        input_tag.send_keys(keyword)
        input_tag.send_keys(Keys.ENTER)
        get_goods(driver)
    finally:
        driver.close()


if __name__ == __main__:
    spider(https://www.jd.com/,keyword=iPhone8手机)

爬取京东商城商品信息

 

爬取京东商城商品信息

原文:https://www.cnblogs.com/HomeG/p/10519388.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!