AI技术干货|生成式人工智能详解4:定义生成式人工智能
金博士| 流媒体网| 2023-07-13
【流媒体网】摘要:生成式人工智能模型有多种类型,它们的工作方式取决于输入和输出数据的形式。

  通过本文的阅读和学习,您将学习到以下内容:

  - 定义[[生成式人工智能(Generative AI)]]:生成式人工智能是一种通过对大量数据进行学习,从而能够创建新的、与原始数据类似的内容的人工智能技术。这些新生成的内容可能包括文字、图片、音乐等。

  - 解释生成式人工智能的工作原理:生成式人工智能的基础是机器学习模型,特别是深度学习模型,这些模型通过学习大量的训练数据来理解其中的模式和规律。然后,当给这些模型提供一个初始输入或"提示"时,它们就可以生成与训练数据有相似特征的新的内容。

  - 描述生成式人工智能的模型类型:生成式人工智能的模型有很多种,包括生成对抗网络(GANs)、变分自编码器(VAEs)、自回归模型如Transformer等。不同类型的模型有不同的特点和应用场景。

  - 描述生成式人工智能的应用:生成式人工智能有许多应用,包括创建新的艺术作品、生成文本、进行图像编辑和增强、生成音乐、生成视频等。此外,生成式人工智能在设计和建筑、电子游戏、医药研发等领域也有广泛的应用。

  前文回顾:

  AI技术干货|生成式人工智能详解1:人工智能、机器学习和深度学习的比较

  AI技术干货|生成式人工智能详解2|生成式人工智能的基石:监督与非监督机器学习

  AI技术干货|生成式人工智能详解3:理解深度学习是理解生成式人工智能的关键步骤

  我们现在来进行正式定义什么是生成式人工智能。

  生成式人工智能 (Generative AI) 是一种特殊的人工智能技术,它利用从预存在的数据中吸取的知识来生成新的、原创的内容。这一从已存在数据中提取信息并进一步构建统计模型的过程,被称为“训练”。在给定一个特定的提示或输入后,生成式人工智能会应用训练过程中得到的模型预测期望的输出,从而创造新的内容。其关键在于,生成式人工智能掌握了数据的内在结构,并且能够生成新的样本,这些样本与训练数据具有相似的特性。

  如之前所述,一种生成式人工智能的类型是生成式语言模型,这种模型能够根据其在训练过程中所接触到的数据样本,创造出全新的、原创的文本。大型语言模型是生成式人工智能的一个实例,因为它们能够生成看似自然的语言文本,这些文本是之前未出现过的文本组合。

  另一种类型的生成式人工智能是生成式图像模型,这种模型以图像为输入,可以输出文本、新的图像或视频。例如,若选择文本作为输出,生成式人工智能可以产生对视觉问题的回答;若选择图像作为输出,则可以生成图像补全任务;若选择视频作为输出,则可以生成动画。

  这种人工智能技术已经在学术研究、实际应用、艺术创作,以及娱乐行业中发挥了其重要的作用,并且正在逐步渗透到我们的日常生活中。生成式人工智能开辟了一片新的研究领域,创造了前所未有的应用场景,对于我们的工作、生活、学习等诸多方面都产生了深远影响。生成式人工智能不仅可以自动生成新闻文章、创作艺术作品,还能为电子游戏和虚拟现实环境创建动态、逼真的背景和角色。更为重要的是,生成式人工智能还可以用于预测和模拟各种复杂系统的行为,这将极大地帮助我们理解和解决各种复杂问题。

  生成式语言模型通过训练数据学习关于语言的模式,然后,给定某些文本,它们预测接下来会是什么。因此,生成式语言模型是模式匹配系统。它们根据你提供的数据学习模式。

  以一个例子来说明。基于模型从训练数据中学习到的内容,它提供了如何完成这个句子的预测:"我正在做一个涂有花生酱和果冻的三明治。”

图 1 让ChatGPT补充句子

  这里我们使用的是ChatGPT模型,这是一个在大量文本数据上进行训练的模型,它能够对各种各样的提示和问题产生与人类相似的文本回应。再比如,当我们给出"生活的意义是--"这样的提示时,该模型会给出一个和上下文相关的答案,并展示出概率最高的回应。

图 2 向 ChatGPT 提问的例子

  变换器及其“幻觉”问题

  生成式人工智能之所以强大,很大程度上要归功于一种被称为变换器(Transformer)的模型。可以说,变换器在2018年为自然语言处理领域带来了一场真正的革命。从一个较为宏观的视角来看,一个变换器模型主要由两个部分组成,即编码器和解码器。编码器的任务是对输入序列进行编码,并将得到的编码结果传递给解码器,解码器则需要学习如何根据相关的任务对这个表示进行解码。

  在变换器的运行过程中,存在一种被称为"幻觉(hallucinations)"的现象,也就是模型生成的一些无意义或者存在语法错误的词语或者短语。这种"幻觉"可能由各种原因导致,例如模型没有在足够的数据上进行训练,或者模型在嘈杂或者错误充斥的数据上进行训练,再或者模型没有获得足够的上下文,或者没有给模型设定足够的约束。

  对于变换器来说,"幻觉"可能会构成一个相当严重的问题。首先,它们可能会导致生成的文本变得难以理解。此外,它们还可能导致模型生成错误的信息,甚至是具有误导性的信息。

  因此,如何管理和避免这种"幻觉"现象是一个重要的研究课题。研究者们正在从各种角度尝试解决这个问题,例如通过更精细的数据清洗,或者更准确的模型训练,以及通过设定更多的上下文信息和约束等。此外,还有一些研究者正在研究如何让模型能够更好地理解并解释自己的行为,这也是一种尝试减少"幻觉"现象的方法。

  总的来说,生成式人工智能和变换器模型的发展正在不断推动我们的技术边界,但同时也带来了一些新的挑战和问题。通过不断地研究和探索,我们有理由相信,我们将会找到更好的解决方案,使得生成式人工智能能够为我们提供更多的帮助。

  提示工程 (Prompt Engineering)

  一个提示(prompt)是提供给大型语言模型作为输入的一小段文本。通过各种方式,我们可以利用它来控制模型的输出。提示设计是创建一个将从大型语言模型生成期望输出的过程。

  如前所述,生成式人工智能在很大程度上依赖于你输入的训练数据。它分析输入数据的模式和结构,从而进行学习。然而,通过浏览器的提示访问,你作为用户可以生成自己的内容。这就是说,尽管生成式人工智能的学习过程依赖于提供的训练数据,但用户还可以通过设计和利用提示来控制其生成的内容。

  如前文提到的,生成式人工智能的学习过程在很大程度上依赖于提供的训练数据。它通过分析这些输入数据的模式和结构来进行学习。然而,用户可以通过使用特定的提示(Prompt)来生成自己想要的内容。这意味着,虽然生成式人工智能的学习过程基于训练数据,但用户仍有机会通过巧妙地设计和应用提示来操控其生成的内容。

  对于生成式人工智能来说,提示并非只是一个输入,它也是一个强大的工具。正确设计的提示可以引导模型生成符合特定目标或需求的内容。例如,你可以创建一个提示要求模型生成一段故事、一篇文章、一个答案,甚至是一段代码。

  但是,设计有效的提示需要一定的技巧。提示需要既明确又具有针对性,以便引导模型生成符合期望的内容。此外,对于模型的理解以及对训练数据的理解也是设计有效提示的关键。如果你知道模型如何学习,以及它主要依赖的训练数据的性质,你将能够设计出更有效的提示。

  总的来说,提示设计是生成式人工智能领域的一个重要而有趣的研究方向。随着我们对这些模型理解的深入,以及技术的进步,我们将能够创建更有效的提示,从而利用生成式人工智能解决更多的问题。

  生成式人工智能模型的种类

  生成式人工智能模型有多种类型,它们的工作方式取决于输入和输出数据的形式。以下是一些主要的模型类型:

  1. 文本到文本(Text-to-Text):这类模型接受自然语言输入,然后产生文本输出。它们被训练用来学习一对文本之间的映射关系,例如从一种语言翻译到另一种语言。

  2. 文本到图像(Text-to-Image):这类模型在大量配有简短文字描述的图像上进行训练。使用扩散(Diffusion)方法是实现这一目标的一种策略。这类模型能够从描述性的文字生成对应的图像,广泛应用于多媒体内容生成、虚拟现实等领域。

  3. 文本到视频(Text-to-Video)和文本到3D(Text-to-3D):文本到视频模型的目标是从文本输入生成视频展示。输入文本可以是单个句子,也可以是完整剧本,而输出则是与输入文本相对应的视频。类似地,文本到3D模型生成与用户文本描述相对应的三维对象,这在游戏或其他3D虚拟世界中有着广泛的应用。

  4. 文本到任务(Text-to-Task):这类模型被训练为根据文本输入执行预定义的任务或行动。这个任务可以涵盖各种行为,如回答问题、进行搜索、做出预测,或采取某种特定的行动。例如,一个文本到任务的模型可能被训练来导航网页用户界面,或者通过图形用户界面对文档进行修改。

  以上只是生成式人工智能模型的部分类型,实际上,随着研究的深入,我们有可能会发现更多新的模型类型和应用场景。生成式人工智能的可能性很多,它正逐渐改变我们的生活和工作方式。

VIP专享文章,请登录或扫描以下二维码查看

“码”上成为VIP会员
没有多余的门路、套路
只有简单的“值来值往”一路!

深度分析、政策解读、研究报告一应俱全
极致性价比,全年精彩内容不容错过!
更多福利,尽在VIP专享


分享到:
版权声明:凡注明来源“流媒体网”的文章,版权均属流媒体网所有,转载需注明出处。非本站出处的文章为转载,观点供业内参考,不代表本站观点。文中图片均来源于网络收集整理,仅供学习交流,版权归原作者所有。如涉及侵权,请及时联系我们删除!