要爬取的数据类别
计划获得一个地区某个医院的医生基础信息数据
对应的数据源网站及 URL
好大夫主站地址:http://www.haodf.com/
北京地区地址:http://beijing.haodf.com/
具体数据页面 url:http://www.haodf.com/doctor/DE4r0eJWGqZNDyuuyr3uFnyZYjeZpcO4.htm
有用的代码块
<h1><span="float:left:> 董强 </span></h1>
<a href="http://beijing.haodf.com" target="_blank">北京</a>
<a href="/hospital/DE4roiYGYZw0wWWuYe-Bqregr.htm" target="_blank">平谷区医院</a>
<a href="/faculty/DE4r08xQdKSLufRTkhY2Krrpb6FW.htm" target="_blank">呼吸科</a>
<td valign="top">副主任医师 </td>
数据保存
- 姓名
- 地区
- 医院
- 科室
- 职称
- 页面 url