语音合成学习（三）学习笔记

Gradio--搭建可视化演示环境

一、介绍

简介

Gradio定位是快速构建一个针对人工智能的python的webApp库，在Hugging Face等提供各种模型推理展示的平台广告使用，阿里的魔塔展示也是基于此。

大家思考下，Gradio作为一款python库，底层逻辑是什么？

结果：Gradio展示的还是web元素

过程：所以Gradio是即懂python又懂web开发（css/js/html)的开发者，通过python对这些web技术做了封装

pipline：python语言--> css/js/html

Gradio是MIT的开源项目。

使用gradio，只需在原有的代码中增加几行，就能自动化生成交互式web页面，并支持多种输入输出格式，比如图像分类中的图>>标签，超分辨率中的图>>图等。

同时还支持生成能外部网络访问的链接，能够迅速让你的朋友，同事体验你的算法。

总结起来，它的优势有：

自动生成页面且可交互

改动几行代码就能完成

支持自定义多种输入输出

支持生成可外部访问的链接进行分享

目前已经有很多优秀的开源项目使用Gradio做demo页面。那么该怎么使用Gradio，让我们一起来玩玩～

二 Get start

0.安装Gradio

pip install gradio 或
为了更快安装，可以使用清华镜像源。
pip install gradio  -i https://pypi.tuna.tsinghua.edu.cn/simple

1.写个简单的例子

# app.py
import gradio as gr

def greet(name):
    return "Hello " + name + "!"

demo = gr.Interface(fn=greet, inputs="text", outputs="text")

demo.launch(server_name="0.0.0.0")

# 启动
# python web.py
# Running on local URL:  http://0.0.0.0:7860
# To create a public link, set `share=True` in `launch()`

image.png

上面的代码就是简单一个webApp，功能是输入一个文本，输出一个文本。代码中关键点：

导入包 import gradio as gr
gr.Interface 构建一个app，确定输入inputs和输出outputs的类型，已经处理输入inputs的函数（这个函数返回一个outputs的类型）
提供一个app的功能模块函数
launch 启动一个web容器，对外提供服务

梳理下web渲染流程

根据输入输出类型（如text）封装html组件（with css样式，布局等）
点击submit：通过js获取输入的值传递（ajax）给后台处理函数（greet），通过js回调函数接收函数的返回值，然后通过js赋值给html元素

上面只是介绍了Gradio的简单的使用，Gradio提供了丰富的html组件，如文本框，图像，视频，下拉框，单选框等等。

核心参数

gradio的核心是它的gr.Interface函数，用来构建可视化界面。inputs和outputs都是可以多个，Gradio根据类型展示相应的组件

fn：放你用来处理的函数
inputs：写你的输入类型，这里输入的是图像，所以是"image"
outputs：写你的输出类型，这里输出的是图像，所以是"image"

最后我们用interface.lauch()把页面一发布，一个本地静态交互页面就完成了！另外，可以通过.launch(share=True)来分享功能，这个功能可以生成一个域名，可以在外部直接访问。

interface.launch(inbrowser=True, inline=False, validate=False, share=True)

inbrowser - 模型是否应在新的浏览器窗口中启动。

inline - 模型是否应该嵌入在交互式python环境中（如jupyter notebooks或colab notebooks）。

validate - gradio是否应该在启动之前尝试验证接口模型兼容性。

share - 是否应创建共享模型的公共链接。

2. 本人模拟了一个输入文本转换语音的例子

输入文本输出了指定的使用训练好的模型

image.png

三 gradio依赖包的版本

踩坑记录

安装的gradio 是3.0版本  当前环境 tensorflow  1.9.0 ，执行时候报错

image.png

原来是相互依赖，需要升级numpy的版本（当前训练模型合成语音的项目环境需要numpy ==1.14.0）。于是，查一下版本不匹配为了不影响训练合成功能，进行gradio降级 => 安装gradio2.0版本，搭建webUI界面显示了，重新执行了文件，但是出现了语音无法合成，排查许久才发现，自动把numpy升级了。针对合成和执行实现web不能同时实现的问题：

<u>最终解决是通过多个包和版本一起指定</u>安装完美解决（gradio和numpy 有依赖关系）

以上主要是对如何使用gradio的简单介绍，也是用的较多的搭建可视化组件。

语音合成学习（三）学习笔记

语音合成学习（三）学习笔记

语音合成学习（三）学习笔记

Gradio--搭建可视化演示环境

一、介绍

简介

二 Get start

0.安装Gradio

1.写个简单的例子

2. 本人模拟了一个输入文本转换语音的例子

三 gradio依赖包的版本

踩坑记录

相关阅读

推荐阅读更多精彩内容