Python爬取17w二手车保值率信息

大家对于“保值率”这个词肯定是如数家珍,它是指一款车型使用一段时间后,出售价格与购入价格的比值,是反映汽车性价比的重要部分。相比较于外观、内饰甚至动力表现,一辆车的可靠性、用车成本以及耐用度往往是车辆“硬实力”的体现,基于此,保值率成为了衡量一辆车综合水平的关键指标。汽车更新换代的速度越来越快,车主们换车的周期也越来越短,而且,由于政策限制,想把一辆车开到报废也并不容易。所以,汽车的保值率就显得尤其重要。

1.样本数据

本文将以汽车之家17万条二手车信息,来分析主流汽车品牌的保值率,直接比较挂牌价格和新车指导价,更加贴近现实。文末附带爬虫代码。

image

然后再通过比较不同车龄和行驶公里数下的保值率变化,给大家一个直观的对比不同品牌汽车的保值率,希望给买车或者对汽车感兴趣的朋友做参考。

image

注:部分品牌的样本数据过少,可能影响分析结果

2.不同车龄的保值率对比

车龄太短,保值率波动太小,车龄太长,受车况、保养的影响又较大,所以,三年保值率,比较能反映车辆品质对保值率的影响。下图以3年保值率做排序:

image

国产与日系从保值率方面看,差距还是比较大,日系双雄牢牢保持在前三名。但是国产也有为国争光的,那就是人民需要什么,他就造什么的五菱神车。三年保值率达到了66%。

美系车的保值率似乎一直比较一般,当然影响保值率的因素非常多,除了车龄,行驶公里数也是一个非常重要的因素。

3.不同公里数的保值率对比

未来比较公里数对汽车保值率的影响,我们把行驶公里数划分5个阶段,下图是按照5公里内的保值率排序:

image

特斯拉在这里的保值率比较高,可能收到样本数据太少的影响,请忽略。

4.车型保值率

接下来是很多人最关心的,到底哪些车型的保值率最高呢?

为了减少样本数量对结果的影响,我们选择车系的样本数量在1000以上的热门车型。然后按照:中大型轿车、紧凑型轿车、SUV 三个分类来对比:

image

雷克萨斯ES是雷克萨斯品牌销量最好的轿车,良好的品牌口碑、考究的做工以及4年10万公里的免费保养让雷克萨斯ES有着出色的跨级竞争能力。

image

“平民超跑”本田飞度位列小型轿车保值率排行榜第一名。飞度不仅有着低廉的价格,省油又实用的口碑也是不少人选择它的关键;这一系列的前五名也基本被日系占领。

image

保值率超过100%的奇葩现象确实存在,因为新车往往需要加价,导致实际价格高于官方指导价。越野利器“霸道”普拉多当仁不让成为了中大型SUV保值率第一名,强大而可靠的越野性能让普拉多声名鹊起,出色的口碑让它曾经一度成为平行进口车中的“销量王”。

5.部分爬虫代码

df = pd.DataFrame()  # 总列表

def get_data(brand, series_name):
    try:
        items = browser.find_elements_by_xpath('//div[@class="tp-cards-tofu fn-clear"]/ul[@class="viewlist_ul"]/li[@class="cards-li list-photo-li"]')
    except NoSuchElementException:
        time.sleep(6)
        print('遇到问题,重试')
        items = browser.find_elements_by_xpath('//div[@class="tp-cards-tofu fn-clear"]/ul[@class="viewlist_ul"]/li[@class="cards-li list-photo-li"]')
    
    car_list = {}
    df_temp = pd.DataFrame()
    for item in items:
        car_list['name'] = item.find_element_by_xpath('.//div[@class="cards-bottom"]/h4').text
        car_list['unit'] = item.find_element_by_xpath('.//div[@class="cards-bottom"]/p').text
        car_list['price'] = item.find_element_by_xpath('.//em').text   # 原车价格
        car_list['new_price'] = item.find_element_by_xpath('.//s').text  #新车价格

        df_temp = df_temp.append(car_list,ignore_index=True)    
        
    df_temp['brand'] = brand
    df_temp['series'] = series_name
    print('brand:',brand, df_temp.head(1), datetime.datetime.now())
    return df_temp

for i in range(len(df_brand)):
    browser = webdriver.Chrome()
    url = df_brand.iloc[i]['url']
    series_name = df_brand.iloc[i]['name']
    brand = df_brand.iloc[i]['brand']
    browser.get(url)
    #获取页数,除去上一页和下一页两个按钮,剩下的个数就是页数
    page_count = browser.find_elements_by_xpath('//div[@class="page fn-clear"]/a')
    if len(page_count) < 9:
        page = len(page_count) - 2
    else:
        page = browser.find_element_by_xpath('//*[@id="listpagination"]/a[8]').text
        
    print('汽车品牌:{},车系:{},总共有:{}页'.format(brand, series_name, page), url)
    df = df.append(get_data(brand, series_name),ignore_index=True)  # 获取第一页
    
    for i in range(int(page)-1):
        try:
            element = browser.find_element_by_link_text("下一页")
        except NoSuchElementException:
            time.sleep(6)
            print('########点击下一页遇到问题,重试')
            browser.refresh() # 刷新页面
            element = browser.find_element_by_link_text("下一页")
            
        element.click()
        df = df.append(get_data(brand, series_name),ignore_index=True)
        
    browser.close()

如果需要样本数据爬虫代码,可以到公众号:迷途小球迷 回复“汽车”即可获取。样本数据仅做学习用途,请勿做他用。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,324评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,356评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,328评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,147评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,160评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,115评论 1 296
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,025评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,867评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,307评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,528评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,688评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,409评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,001评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,657评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,811评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,685评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,573评论 2 353

推荐阅读更多精彩内容

  • 1 前言 二手车保值率估计是最近比较火的一个方向,也是大数据应用比较成功的一个方向。二手车保值率估计,顾名思义,就...
    棒棒唐_KT阅读 2,832评论 0 1
  • 久违的晴天,家长会。 家长大会开好到教室时,离放学已经没多少时间了。班主任说已经安排了三个家长分享经验。 放学铃声...
    飘雪儿5阅读 7,520评论 16 22
  • 创业是很多人的梦想,多少人为了理想和不甘选择了创业来实现自我价值,我就是其中一个。 创业后,我由女人变成了超人,什...
    亦宝宝阅读 1,808评论 4 1
  • 今天感恩节哎,感谢一直在我身边的亲朋好友。感恩相遇!感恩不离不弃。 中午开了第一次的党会,身份的转变要...
    迷月闪星情阅读 10,562评论 0 11
  • 可爱进取,孤独成精。努力飞翔,天堂翱翔。战争美好,孤独进取。胆大飞翔,成就辉煌。努力进取,遥望,和谐家园。可爱游走...
    赵原野阅读 2,726评论 1 1