文章写不出来？可以用这个操作

内容的价值和意义

在物质匮乏的时代，产品功能是价值附着的唯一途径，然而，在新消费时代下，消费不再只是单纯的消费，而是成了生活的一部分。单纯的产品功能性满足很难吸引消费者的注意及购买转化，附着在产品功能之外的价值观更能打动消费者。

内容本身不是特别新鲜的东西，但是很长一段时间里他是和交易割裂开的。展示和搜索可以解决消费者已经确认的需求，占总需求量的5%~10%，而90%的需求是在社交关系中产生的。也就是说，如果商品只是以货架陈列的方式展示给消费者，并不会激起多少购物欲，顶多逛一逛就溜了。而如果有人吆喝或种草，卖东西时先设置好一个场景，播放一个视频，来一段直播，给一些有关产品评测、选货、避坑的文章，再加上大V和你认识的人在一起影响着你，你很容易心动或跟风，就买了比原计划多的多的东西。

当前流量越来越去中心化了，搜索、推荐、内容导购三分流量，通过内容包装给一款产品赋予新的价值，以“内容驱动”为导向的购物逻辑已经被新一代消费群体所喜爱并接受。比如江小白的“文案瓶”、杜蕾斯的热点海报、网易的刷屏H5、“口红一哥”李佳琪的直播……扛着新消费大旗的品牌们，让传统品牌毫无招架之力。

为什么要如此热烈的拥抱内容？大概有以下几个原因：

从大环境上来说，导购网站（小红书、微淘）来势汹汹，逐渐形成壁垒，成为一部分人购物的第一入口，蚕食互联网流量。

从平台角度讲，产品站内流量饱和，新用户增长放缓，怎么留存这些用户，让流量产生更大收益？只能增加用户停留时间和黏性，形成没事儿也来逛逛的心理习惯。

然而，传统的内容生产由人力完成，其成本是很高的。我们通常会讲“流量贵”，但其实内容更贵，成本运作肯定是一笔不小的投入，耗时耗力，且难以覆盖新消费群体的个性化定制需求。那么因为成本高、效率低，我们就放弃做内容了吗？显然不是。依托人工智能语义技术的不断成熟，通过机器学习领域，给AI赋能助力业务，智能生产内容势在必行。

NLP（自然语言处理）

AI机器学习领域发展至今，已经在计算机视觉、NLP（自然语言处理）、语音识别领域取得了大幅度进步，而智能生产内容正是基于NLP领域的研究。NLP的发展经历了如下的三个阶段：

第一个阶段的NLP主要基于规则。通过人工或者自动半自动地收集规则,机器可以完成一系列NLP任务。以机器翻译为例，只要输入的新句子能够匹配。事先设定规则，假定这些规则是正确的话,系統可能会输出-条看似还不错的结果。但如果上述任一条件不满足的话,系统可能会输出让人不知所云的结果。而自然语言太过复杂,通过有限的规则来刻画，几乎是不可能的事情。因此,基于规则的方法可能会在某个特定的小领域取得不错的结果,一旦推广到更宽泛的领域,效果往往很不理想。

第二个阶段的NLP主要基于统计,更明确地说,基于数据+统计机器学习方法。进入二十一世纪,计算机硬件能力的快速提升和数据量的增长,使得数据驱动的方法悄然成为主流。在这个阶段的NLP当中,人工特征工程+统计机器学习成了很多NLP任务的标配。

第三个阶段的NLP主要是基于深度学习。本质上说,深度学习也是一种统计机器学习方法，因此这个阶段本质上也是数据+统计机器学习。但是,深度学习已经在很多领域表现优异,其名头已经盖过传统的统计机器学习。因此,说这个阶段基于深度学习毫不为过。上一个阶段最让人头疼的就是特征问题,本质上就是NLP的对象(字、短语、段落、篇章等)如何表示的问题。而深度学习的最大好处就是能够自动学到对象的表示,从而避免了人工特征工程的大工作量和难以保证的结果。

NLP应用能够快速增长，很大程度上要归功于通过预训练模型实现迁移学习的概念。已经被运用的顶级的预训练模型有：ULMFiT模型、Transformer模型、BERT模型、Transformer-XL模型、GPT-2模型、ELMo模型、Flair模型、StanfordNL .P模型。下面就8大模型的介绍应用：

1.ULMFiT（普遍语言模型精调）

它使用新的自然语言生成技术实现了最先进的结果。该方法包括在Wikitext 103数据集上训练的预处理语言模型进行微调，使其不会忘记以前所学的内容,从而将其微调为一个新的数据集。

2.Transformer

该架构是自然语言处理领域最近几乎所有主要发展的核心，2017 年由谷歌推出，据了解，它应用了一种自注意力(self- -attention)机制，可以直接模拟句子中所有单词之间的关系。

3.GoogleBERT

BERT是第一个无监督、深度双向的自然语言处理模型预训练系统，它只使用纯文本语料库进行训练。它的设计目标是能够进行多任务学习，也就是说，它可以同时执行不同的自然语言处理任务。

4.GoogleTransformer-XL

它是由谷歌Al团队开发的，是一种新型的自然语言处理架构，可以帮助机器理解超出固定长度限制的上下文。Transformer- XL比普通的Transformer要快上1800倍。

5.0penAIGPT-2

OpenAI在2月份的时候发表了-篇博文,声称他们已经设计了一个自然语言处理模型，表现非常出色。

GPT-2经过训练后，可以预测40GB互联网文本数据的下一个出现的单词。这个框架也是基于Transformer的模型，该模型在800万个Web页面的数据集进行训练。

6.ELMo（语言模型的词嵌入）

它是（Embedding from L anguage Models的缩写)在构建自然语言处理模型的上下文非常有用，它是一种用向量和嵌入表示单词的新方法。这些ELMo词嵌入有助于我们在多个自然语言处理任务上获得最先进的结果。

7.Flair

它并不完全是词嵌入，而是词嵌入的组合。这是一个非常简单的框架，用于最先进的自然语言处理(NLP) 。Flair 具有简单的界面，允许开发者使用和组合不同的文字和文档嵌入，包括BERT嵌入和ELMo嵌入等。

8.StanfordNL.P

这是一个经过预训练的、最先进的自然语言处理模型的集合。据作者声称，StandfordNLP 支持超过53种语言，它为非英语语言中应用自然语言处理技术提供了很多可能性，比如印地语、汉语和日语。

GPT-2

NLP发展至今， OpenAI GPT-2在文本生成方面表现惊艳，且性能稳定、优异吸引了业界的关注，在上下文连贯和表达情感方面超乎了人们的想象。

GPT，全称是Generative Pre-training，就是预训练模型。GPT-2即第二代预训练模型。该模型在没有任务特定训练的情况下，能够做到初步的阅读理解、机器翻译、问答和自动摘要。可以根据一小段话自动「脑补」出大段连贯的文本，如有需要，人们可以通过一些调整让计算机模拟不同的写作风格，看起来可以用来自动生成「假新闻」。在很多任务上达到了业内最佳水平。

考虑到可能存在的对该技术的恶意使用，OpenAI 没有发布训练模型，而是仅发布较小版本和示例代码，供研究、实验使用。不发布数据集、训练代码和 GPT-2 模型权重。因此，我们想使用该模型应用于业务场景中，是需要开发人员基于开放的模型基础上继续研究的。

GPT-2是基于 transformer 的大型语言模型，包含 15 亿参数、在一个 800 万网页数据集上训练而成。训练 GPT-2 有一个简单的目标：给定一个文本中前面的所有单词，预测下一个单词。数据集的多样性使得这一简单目标包含不同领域不同任务的自然事件演示。GPT-2 是对 GPT 模型的直接扩展，在超出 10 倍的数据量上进行训练，参数量也多出了 10 倍。

GPT-2展示了一系列普适而强大的能力，包括生成当前最佳质量的条件合成文本，其中我们可以将输入馈送到模型并生成非常长的连贯文本。此外，GPT-2 优于在特定领域（如维基百科、新闻或书籍）上训练的其它语言模型，而且还不需要使用这些特定领域的训练数据。在知识问答、阅读理解、自动摘要和翻译等任务上，GPT-2可以从原始文本开始学习，无需特定任务的训练数据。虽然目前这些下游任务还远不能达到当前最优水平，但 GPT-2 表明如果有足够的数据和计算力，各种下游任务都可以从无监督技术中获益。

GPT-2的工作原理：运行GPT-2模型，即在它随机工作的情况下，我们简单地提供一个预先定义好的起始单词。单词经过层层处理，最终得到一个向量。向量可以对于词汇表的每个单词计算一个概率，概率最高的单词选作为下一个单词。GPT-2 的每一层都保留了它们对第一个单词的解释，并且将运用这些信息处理第二个单词，以此向前递进，最终生成句子。

OpenAI预期 GPT-2 这样的系统可用于创建：

AI写作助手

更强大的对话机器人

无监督语言翻译

更好的语音识别系统

面世的智能生产应用

百度：智能创作平台

百度智能创作被应用于媒体和内容创作行业，可从素材发现、创作工具角度，提供热点发现、事件脉络、热词分析、文本纠错、用词润色、文本审核、文章分类、文章标签等技术，配置专属写作模板，快速实现批量和自动生成文章的能力。支持聚合写作、关键词创作等多种内容自动生成能力；提供包括图文、视频内容在内的多模态自动创作能力，快速实现文本到视频、视频到文本的多种内容创作能力，全面赋能内容创作。

当前，智能写诗、智能春联被应用于市场营销活动，帮助企业吸引更多的用户参与，提升营销的传播价值和用户体验。

阿里巴巴：智能写手、阿士比亚

生成智能利益点：会场名称、利益点文案和商品图片素材。

生成单品盘点类型清单：已实现生成概括主题又吸引用户点击的标题，以及单品推荐理由。

当前阿里已经应用于淘宝每年双11大促活动主要的通道入口，如手淘 - 搜索双十一Tab和淘攻略，以及阿里1688平台运用。

京东：李白写作

已经被应用于电商、咨询平台。

电商运用：通过庞大的互联网数据，用强大的NLP、图像处理、深度学习等技术，为电商平台输出高质量的商品特点介绍，详细说明，推荐语，导购文章等内容，打造丰富的营销生态体系。已被成功应用到京东首页发现好货，会买专辑等频道的文章写作，并带来了不错的效果。

资讯平台运用：通过自主研发的中文分词、语法纠错、通顺性检测、上下文联想等技术，结合海量的行业语料和系统素材库，为资讯平台量身定制不同类型的文章，如快报，评测，知识百科等。

长按下方二维码，即可了解新贝学院更多内容