理解一个行业,定义和案例不可少,案例或许我也算一个,定义还在形成中,整理如下。排序兼顾提出时间和重要程度。

1.【人工智能生成合成内容】是指利用人工智能技术生成、合成的文本、图片、音频、视频、虚拟场景等信息。人工智能生成合成内容标识包括显式标识和隐式标识。
2.【AI音乐】指由AI工具参与音乐创作中某个、某些或所有环节的部分或全部(歌词、作曲、编曲、混音和后期处理等)而产生音乐的统称。
3.【“文生”AI音乐】指主要通过文字描述的指令类型生成的AI音乐。注意这里的文字描述不是指歌词。
4.【“词生”AI音乐】指主要通过歌词这一指令类型生成的AI音乐。这个简单明了。
5.【“曲生”AI音乐】指主要通过主旋律的指令类型生成的AI音乐,包含乐器演奏、人声哼唱等。说白了,就是已经有曲子了。
6.【“乐生”AI音乐】指主要通过音乐这一指令类型生成的AI音乐,包含纯音乐、歌曲、伴奏等。
7.【“谱生”AI音乐】指主要通过乐谱这一指令类型生成的AI音乐。
8.【“图生”AI音乐】指主要通过图片的指令类型生成的AI音乐,包括照片、画作等。
9.【“影生”AI音乐】指主要通过视频的指令类型生成的AI音乐。
10.【“纯生”AI音乐】通过单一指令类型生成的AI音乐。
11.【“杂生”AI音乐】融合了两种及以上指令类型而形成的AI音乐(也可称为“什生”、“合生”等)。
12.【“人+AI”音乐】指作品中人力投入的占比大于AI占比的AI音乐。
13.【“人与AI/AI与人”音乐】指作品中人力投入的占比与AI占比等同或几乎接近的AI音乐。
14.【“AI+人”音乐】指作品中人力投入的占比小于AI占比的AI音乐。
15.【AI音乐人】指主要以AI(包括但不限于AIGC)为工具进行音乐创作和情感表达的创作者。
16.【指令】广义指能够触发AI系统工作的指示、命令。指令可以由人和AI等主体下达,限于音乐情感表达的本质, 用在这里单指人基于包含创作动机、情感表达、音乐理念、审美和需求等内容的思想以各种AI可识别的信息为载体的指示、命令。“词生”AI音乐中常用指令可分为两大类,一类是歌词,一类是标签。
17.【明指令】即能够直接体现在AI音乐作品中的指令类型,又称为“明确指令”。由“明指令”生成的AI音乐称之为“明指令”AI音乐。
18.【暗指令】即无法直接体现在AI音乐作品中的指令类型,又称为“模糊指令”。由“暗指令”生成的AI音乐可称为“暗指令”AI音乐。
19.【灰指令】即居于明指令与暗指令两者之间的或兼具两者特点的指令类型。由“灰指令”生成的AI音乐称之为“灰指令”AI音乐。
20.【指令人】指AI音乐工具使用端的控制者,AI音乐制作过程所需指令的发起者和通过下达指令制作AI音乐的创作者。指令人是AI音乐制作过程的能动性起点,是各生成阶段指令的编写和下达者。
21.【直接参与】指在AI音乐创作过程中,创作者直接提供构成作品的技能、素材或材料等明确指令的必要组成部分或能力支持。如,作词、作曲、编曲、混音等。
22.【间接参与】指在AI音乐创作过程中,创作者通过模糊指令、判断选择等表达思想、情感、审美、需求等,不直接干预音乐本身。
23.【AI税】 指对版权归属于个人所有的AI辅助或完全产出内容的版权收益在原有税费基础上进行一定比例的专项税费加征,以进行再分配。
24.【自媒体发行】即影音等作品通过各类UGC平台和渠道传播销售。包括但不限于各AI工具个人主页、图文、音频、视频、社群平台公开发布。一方面避免传统发行渠道约束的现状;另一方面探索适合AI音乐分享的新路径。
25.【半纯音乐】指介于歌曲与纯音乐之间的音乐形式。在专辑维度有两种意义,第一种即专辑中所有曲目都为半纯音乐;第二种即专辑由歌曲和纯音乐组成。至于“半”并非严格到5:5,仅是一种形象化表达。
26.【扑克单曲(Poker Single)】通俗来讲,就是一张单曲里含有一首歌的多个版本(数量大于等于3),以充分表达歌曲的内涵,以及满足不同听众的需求。具体来讲,指单曲(通常为一首,按一副国际版扑克规格对应为最多4首)同时含有一首/多首歌曲的多个版本(版本数大于等于3首,最多13首),且单曲里有且只有1首主打歌/版(对应“大王”)和1首次打歌/版(第二主打歌/版)(对应“小王”),以充分表达歌曲内涵及满足不同听众的需求。注:生成AI音乐指令内容的核心部分(关键素材)相同即可视为同属于一首。
27.【扑克迷你专辑(Poker EP)】是最大为扑克单曲两倍的歌曲量,即两副扑克的总量。内含5-8首歌,4首主打(大王、小王各两个),最多108版。
28.【扑克专辑(Poker Album)】是最大为扑克单曲三倍的歌曲量,即三副扑克的总量。内含9-12首歌,6首主打(大王、小王各三个),最多162版。
29.【人工智能生成合成内容标识】表明某个内容是人工智能生成合成内容的信息。注:标识可包含生成合成服务提供者和内容传播服务提供者等信息。
30.【显式标识】是指在生成合成内容或者交互场景界面中添加的,以文字、声音、图形等方式呈现并可以被用户明显感知到的标识。音频内容显式标识应采用语音标识或音频节奏标识。
31.【隐式标识】是指采取技术措施在生成合成内容文件数据中添加的,不易被用户明显感知到的标识。标识信息包含生成合成服务提供者的名称或编码。
32.【文学词】这类词至少具备几个特点,一个是创造性,另一个是生动性,可能还有一个深刻性。
33.【常态词】即主题比较明确,表达有一点点的新颖。
34.【拼凑词】这类词就是东一榔头西一棒子拼凑出来的,逻辑之间需要一定的脑补才能勉强联起来,看不懂但未必深奥的词。
35.【歌词锚点】指“词生”AI音乐创作中确定大概词格和内容的依据。锚点越清晰、全面,创作过程越有的放矢,创作出来的词越具有音乐适配性。歌词锚点根据歌词的构成部分,分为词格类和内容类。
36.【词格】宏观上,词格本身也是歌词内容的一部分,词格根据单位从小到大可分为字格、词格(狭义,非歌词整体格式)、句格、段格和全格,此外还有断格;微观上,词格是以两个字格及以上为单位,以断格为分隔,以句格为上限,是词格里的基本单位。常对应曲中的一个节奏型、一组旋律、一个小节甚至是一个乐句等,时值、节奏、小节数不等。
37.【字格】以一格为单位,一格一字,词格里的最小单位,代表字的数量,歌词有多少字格就有多少个字。常对应曲中的一个音,也可为两个音或更多,时值、节奏、小节数不等。
38.【句格】以一个词格及以上为单位。常对应曲中的一个乐句,也可以是不足一个乐句或跨越两个乐句的一部分等,时值、节奏、小节数不等。句格之间,常有每句重复、每两句重复。
39.【段格】以两个句格及以上为单位,多以四个句格为一段格。有重复段格和不重复段格,重复段格多为主歌段和副歌段;不重复段格多为过渡段、说唱段、旁白段等。常对应曲中的一个乐段,通常为八小节,也可见四小节、十二小节等。
40.【全格】即以段格为单位按照某种次序构成整首歌词的结构。通常对应基本的乐曲结构(前奏、间奏、尾奏、独奏和其他无词的段落等部分除外,如有)。
41.【断格】即空格,出现在字格、词格和句格之间。常对应曲中主旋律某个音的音肚、音尾或换气口处等。需要注意的是空格处只是没有字,并非没有节奏和音(休止除外)。以上所有内容的总和构成了我们所说的一首歌词的词格。
42.【套用词格】扒带现有歌曲的词格,直接填自己的内容。无须担心会撞歌,由于拍号、节奏等变量表现在词格中各个维度,同一词格便可用于无数不同的曲子,也能适配多种风格。
43.【改编词格】将一首歌的词格按自己表达需求进行改编,或将不同歌曲的词格进行组编等。
44.【原创词格】根据自己内心的表达需求,有意识地尽量参考各种锚点进行词格创作,通常与内容同时产出。
45.【字数对仗】即保持所需对仗处字数的相等或相差无几。如果对仗处超过一句则有两种对仗方式,一种是严格意义上的每句字数都相等或相差无几;另一种,则是指统计总字数是否相等或相差无几。
46.【词式对仗】即词的形式相对仗。如叠词对叠词、成语对成语、谚语对谚语、典故对典故等。
47.【词性对仗】即根据词在句中的功能进行对仗。如名词对名词、动词对动词、形容词对形容词、副词对副词、连词对连词等。
48.【词义对仗】即根据词的属性、所属范围、含义(同义、近义、反义等)、色彩等进行对仗。如《声律启蒙》的“云对雨,雪对风”中的“云”“雨”“雪”“风”都属于自然现象;“来对往,密对稀”是反义对;“城对市,巷对街”是近义对等。
49.【拆词】即将词汇拆开,可用在同一句格中的不同位置,同段中或重复段中的对仗位置。适用于由同义、近义、反义、并列等组成的词,以及叠词等。主要作用是增加对仗字、词量。
50.【倒词】即将词的内部顺序从某个位置进行颠倒,且颠倒后的词义与颠倒前基本相同。适用范围同拆词。主要作用为方便与前后词的通读(唱),或者是增加新鲜感。
51.【元结构】标记每段歌词及乐段的功能。包括是否有前奏、间奏、尾奏、独奏,有几段,在什么位置等等信息。可用“[元结构]”方括号强调,如还有更多要求,方括号可以并列使用,如“[元结构][要求1][要求2]”。
52.【速度】由粗到精分为三类,第一类是定性的,比如缓慢的、中速的、极快的等;第二类是指定一个范围区间,如广板(40-60)、行板(76-108)、中板(108-120)等;第三类是直接定量,每分钟多少多少拍,如速度46、88、132等。
53.【生词】生成歌词的AI工具名。
54.【生曲】生成歌曲的AI工具名。
55.【生影】生成视频的AI工具名。
——不定期更新
主要参考内容
GB 45438-2025《网络安全技术 人工智能生成合成内容标识方法》
AI音乐时代真的来了,国内首张全AI作曲专辑《齐天大笑》发行,你听了吗?