2021电影杀出一匹黑马《你好,李焕英》,一路随着好口碑逆袭而上,截止今天2021年3月3日的票房达到了49亿,当前才第20天,每天依然以千万级的票房在持续刷新累计票房数据。
首先、先让我们来看一下豆瓣评分情况,当前打分已经达到8.1分,从不同打分层级来看,高分比例非常高,4星、5星分别占比:47%和31%,低分也非常少,1星、2星不超过3%,可见,绝大部分人都是非常认可的,大部分人几乎都没有给差评,那主要是因为什么呢?
其次、我们来看一下几个评论是怎么写的:
评论a:从李焕英排球赛输球可以看出没有刻意让主角光环通过赢球来升华
评论b:母亲这个大众且绕不过的共性牵动了所有游子的心
评论c:虽然有人认为是小品的延长版,但是从侧面让小品更加生活化,更加共情
最后、通过爬取评论简单看一下大家对这个电影最最关注的点到底在哪里?
从图中我们看到最关键最频繁的词是:妈妈、母亲、女儿、真的、喜剧。
显而易见:通过最生活化的方式,将母亲、女儿最真实的情感得到抒发,唤起大家再一次回归本真体会一次母爱,这个直击人心的单点突破了大众的内心防御,得到一致的口碑传播。
爬取核心代码如下:
html=requests.get(url,headers=headers)# print('第一层调用是否返回正常:',html)selector=etree.HTML(html.content)# print(selector)datas=selector.xpath('//div[@class="article"]')# print(datas)# datas = selector.xpath('/html/body/div[3]/div[1]/div/div/div/div[1]/div/header/a[2]/text()')fordataindatas:usernames=data.xpath('div[4]/div/div[2]/h3/span[2]/a/text()')# urls = data.xpath('div/div/div/h2/a/@href')tontents=data.xpath('div[4]/div/div[2]/p/span/text()')# print(usernames)forusername,tontentinzip(usernames,tontents):# print(username,tontent)词云核心代码text = open("lihuanying.txt").read()# 使用jieba进行分词,并对分词的结果以空格隔开,cut_all=True 设置为全模式wlist = jieba.cut(text, cut_all=True)# 使用空格连接mylist =" ".join(wlist)backgroud_Image = np.array(Image.open(path.join(d,"love.png")))# 对分词后的文本生成词云stopwords = [word.strip()forwordinmylist]stopwords.extend(['我','的','你','他','我们','确实','电影','自己','一个','观众','导演','他们','他们' ])mylistt = WordCloud(font_path='/System/Library/Fonts/Hiragino Sans GB.ttc', max_words=100, max_font_size=100,mask=backgroud_Image, stopwords=stopwords, scale=1).generate(mylist)# 显示词云图image_colors = ImageColorGenerator(backgroud_Image)plt.imshow(mylistt.recolor(color_func=image_colors))# plt.imshow(mylistt)# 是否显示x轴、y轴下标plt.axis("off")plt.show()mylistt.to_file('李焕英.jpg')
-- END --