装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方

装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方

常听说,现在的代码,就和唐朝的诗一样重要。

可对我们来说,写几行代码没什么,但是,要让我们真正地去写一首唐诗,那可就头大了。。既然如此,为何不干脆用代码写一首唐诗?

私信回复【PDF】可获取python电子书一套

准备:

  • python3.6
  • 环境推荐使用anaconda管理python包,可以对于每个项目,创建环境,并在该环境下下载项目需要的包。
  • 推荐使用pycharm作为编译器。

具体步骤:

使用爬虫爬取全唐诗,总共抓取了71000首。

装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方

使用正则表达式对爬取的数据进行处理

装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方

唐诗生成,处理韵脚

装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方

对于韵脚,本来是想找出所有的韵脚并做成字典形式存储起来,但韵脚总共有20多个, 后来发现其实20多个韵脚都是以元音字母开始的,我们可以基于这个规则来判断:

装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方

目前是最初级的五言律诗,且为名动名句式

装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方

藏头诗

其实思路很简单,既然我们有了语料库,那么,我们每次在排列组合词的时候,只需保证生成每句时,第一个名词的第一个字,是按序给定四字成语中的即可

装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方

来看一下结果:

四言诗:

<pre style="-webkit-tap-highlight-color: transparent; box-sizing: border-box; font-family: Consolas, Menlo, Courier, monospace; font-size: 16px; white-space: pre-wrap; position: relative; line-height: 1.5; color: rgb(153, 153, 153); margin: 1em 0px; padding: 12px 10px; background: rgb(244, 245, 246); border: 1px solid rgb(232, 232, 232); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: 2; text-align: start; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">所思浮云
关山车马
高楼流水
闲人肠断
</pre>

五言律诗:

<pre style="-webkit-tap-highlight-color: transparent; box-sizing: border-box; font-family: Consolas, Menlo, Courier, monospace; font-size: 16px; white-space: pre-wrap; position: relative; line-height: 1.5; color: rgb(153, 153, 153); margin: 1em 0px; padding: 12px 10px; background: rgb(244, 245, 246); border: 1px solid rgb(232, 232, 232); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: 2; text-align: start; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">西风时细雨
山川钓建章
龙门看萧索
几年乡斜阳
</pre>

藏头诗:

落花流水

<pre style="-webkit-tap-highlight-color: transparent; box-sizing: border-box; font-family: Consolas, Menlo, Courier, monospace; font-size: 16px; white-space: pre-wrap; position: relative; line-height: 1.5; color: rgb(153, 153, 153); margin: 1em 0px; padding: 12px 10px; background: rgb(244, 245, 246); border: 1px solid rgb(232, 232, 232); font-style: normal; font-variant-ligatures: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: normal; orphans: 2; text-align: start; text-indent: 0px; text-transform: none; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration-style: initial; text-decoration-color: initial;">落晖首南宫
花枝成公子
流水名朝廷
水声胜白石
</pre>

当然,现在生成的唐诗还是比较低级的,属于基础的古诗文词语排列组合。 接下来考虑优化模版,提取五言和七言常用句式作为模版。 另外考虑使用机器学习的方法,写RNN来让计算机自动生成充满韵味的诗。

作者:TheodoreXu

出处:https://segmentfault.com/a/1190000013154329

装逼必备:用Python爬虫打造一个人工智能诗人!生活仍有诗和远方
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 【编者按:如果有兴趣学习格律诗,请通读全文,全文共计26800字,不含卷首编者按的内容。特别提示:本文完全免费,如...
    大侠霍元乙阅读 12,937评论 84 131
  • 分享一篇文章,原文位于:用Python。 常听说,现在的代码,就和唐朝的诗一样重要。 可对我们来说,写几行代码没什...
    妄心xyx阅读 3,304评论 0 0
  • 诗词格律 第一节 诗律 一、先秦至隋唐诗体概说 (一)先秦诗歌 1、《诗经》 《诗经》是我国最早的一部诗集,是先秦...
    温柔的坚持_阅读 8,993评论 1 3
  • 上午刚发了表彰晚上我又忍不住的发了火,起因是因为一幅画。上周诺诺拿回来一张画纸,说老师让画从学校到我家的路,她...
    拾一片光阴阅读 1,522评论 0 0
  • 读高中的时候,有一段时间很多同学愿意用“既外向又内向”来形容自己的性格,据说是源自韩寒。不过再大一点才发现,这么说...
    日新说阅读 5,075评论 2 11

友情链接更多精彩内容