今天做了一个AI读书的项目,我打算每天都会做一个读书的视频,上传到youtube上。
希望流量大起来后,能有一些订阅收入。
这个项目主要是做视频比较麻烦,但是我基本全靠AI来实现,每个视频花费的时间可控。
生成一个视频的步骤如下:
- 生成稿件
- 生成音频
- 使用Aegisub生成字幕
- 选一张封面图片
- 使用FFmpeg生成视频
生成稿件
对于选中的一本书,我会让AI帮忙生成一段文稿。出了让AI生成,我也会用一些AI Search工具,借助搜索引擎对内容进行一个增强,可以获得质量更高的文稿。
生成音频
ChatTTS
在这里我使用了ChatTTS来生成音频,第一次见到ChatTTS的时候,惊为天人,现在TTS的效果居然能这么牛逼,能有各种音色、会有口头禅语气词,完全分辨不出来居然是AI生成的。
我使用了colab工具,可以使用到免费的GPU资源,也不占用自己的机器,生成速度也非常快。
Aegisub生成字幕
使用FFmpeg生成视频
安装好之后,使用下面的命令,就可以生成视频。注意封面图片最好是1280 × 720,这样比较适配视频
ffmpeg -loop 1 -i alive.jpeg -i alive.wav -vf "subtitles=alive.ass:force_style='FontSize=24,MarginV=40',scale=-2:1080:force_original_aspect_ratio=decrease,pad=1920:1080:(ow-iw)/2:(oh-ih)/2" -c:v libx264 -profile:v high -level:v 4.2 -pix_fmt yuv420p -tune stillimage -c:a aac -b:a 192k -movflags +faststart -shortest alive.mp4
整体流程熟悉后,主要的工作量是“生成稿件”和“使用Aegisub生成字幕”两部分。
其中生成字幕完全是体力劳动,我可以找个人帮忙完成。
“生成稿件”的workflow如果比较流畅,也不需要花太多时间。
接下来一周,把这件事的workflow建立起来,然后坚持下去。