Python爬虫（一）京东商品价格及详情页抓取

最新推荐文章于 2024-04-18 00:10:00 发布

原创

最新推荐文章于 2024-04-18 00:10:00 发布 · 1.4w 阅读

标签

#python

收录于

本文介绍了使用Python进行网络爬虫，以京东商品页面http://item.jd.com/2957726.html为例，详细讲解如何抓取商品的价格和详情信息，包括关键步骤和代码实现。

这是一个以http://item.jd.com/2957726.html为例的单页抓取案例

import urllib.request;  #载入urllib.request,用于获取页面html源代码
from pandas import Series;  #载入series包
from pandas import DataFrame;   #载入dataframe包
from bs4 import BeautifulSoup;  #载入beautifulsoup包
import json; #载入json包

response = urllib.request.urlopen('http://item.jd.com/2957726.html'); #获取html源代码
html = response.read(); #将源代码转入html
soup = BeautifulSoup(html); #解析html
data = DataFrame(columns=['Feature', 'Property']) #创建空白dataframe用于装载爬取信息

divSoup = soup.find(