海外 ChatGPT 专题

AI资讯2年前 (2023)发布 GPTHub
16 0

ChatGPT 风口已至,商业化落地加速

事件:美国AI公司OpenAI推出基于大语言模型的对话模型ChatGPT,可

提供高质量的回答,并能实现创作、编程等复杂功能,备受市场关注。不

到两个月的时间,ChatGPT全球日活用户已突破千万。

ChatGPT是突破式的创新技术

ChatGPT是OpenAI公司推出的全新聊天机器人模型。通过引入人类反馈的

强化学习,大幅提升了AI在人机对话时的准确度和可控性,具有强大的语

言理解能力和语言表达能力。GPT模型仍在持续迭代,更先进大语言模型

GPT-4有望在2023年推出,有望进一步推动AIGC产业发展。

ChatGPT应用及商业化落地加速

科技公司纷纷涌入AIGC赛道,优秀的AIGC大模型层出不穷,我们认为基于

AI文本生成的模型ChatGPT有望率先应用落地。AIGC赛道相关公司受到资

本青睐,AIGC头部初创公司OpenAI最新估值约为290亿美元。作为AIGC领

域领先的模型ChatGPT在对话机器人、智能创作等领域应用广泛,亚马

逊、微软、Jasper等公司已经开启商业化之路,商业化前景广阔。

建议关注

作为AIGC领域顶尖的模型,ChatGPT有望对现有生产力工具进行变革,引

领赛道发展。我们看好AIGC领域前景,给予“强于大市”评级。根据AIGC

领域产业链上下游,我们建议关注AIGC上游数据服务商海天瑞声

(688787.SH),中游技术领先的公司科大讯飞(

002230.SZ)、拓尔思

(300229.SZ)、百度(09888.HK),下游应用率先受益的公司昆仑万维

(300418.SZ)、中文在线(300364.SZ)、视觉中国(000681.SZ)、掌

阅科技(603533.SH)、阅文集团(0772.HK)、汉仪股份

(301270.SZ)。

风险提示:政策监管风险、AIGC技术发展不及预期风险、商业化落地

不及预期风险

建议关注标的

海外 ChatGPT 专题

 

1 ChatGPT 突破式创新技术

1.1 基于大语言模型(LLM)的对话模型

ChatGPT OpenAI 公司推出的全新聊天机器人模型。可以实现像人一样的交

流,甚至完成写邮件、文案创作等功能。ChatGPT 还是基于 transformer 模型,通过

引入人类反馈的强化学习(RLHF),大幅提高了 AI 在人机对话时的准确度和可控性。

与其他 AI 对话机器人相比,ChatGPT 具有强大的语言理解能力和更丰富的语言表达

能力,并且能够生成更自然、更流畅的文本,可以回答非常复杂的推理问题。ChatGPT

核心能力如下:

(1)问题的理解能力大幅提升,提升了模型和人类意图的一致性,具有记忆能

力,可以实现连续多轮对话;

(2)结果的准确性大幅提升,主要表现在回答的更加的全面,同时可以主动承

认错误、发现无法回答的问题;

(3)具备识别非法和偏见的机制,针对不合理提问提示并拒绝回答;

(4)理解用户需求并创造内容,甚至可以协助进行代码编写。

海外 ChatGPT 专题

ChatGPT 的出现将 AI 生成推到了前台,但 ChatGPT 只是 AI 生成模型的一种。

海外学者 Roberto 和 Eduardo 将 AI 生成模型分成 9 大类,内容形态包括图像、视

频、音频、文本、3D 模型等。

海外 ChatGPT 专题

1.2 GPT 模型加速迭代

GPT 功能越来越强大。从 2018 年 6 月 GPT-1 发布以来,模型参数量、预训练

数据量越来越大,当前已经发展到 GPT-3.5(ChatGPT 原型)。性能更加强大的 GPT-

4 也正在训练测试中,有望在 2023 年正式发布。

海外 ChatGPT 专题

无监督学习 GPT-1GPT-1 诞生于 2018 年,采用了 Transformer 为核心结构,

通过自左向右生成式的构建预训练任务,然后得到一个通用的预训练模型,这个模型

和 BERT 一样都可用来做下游任务的微调。GPT-1 在未经调试的任务上有一些效果,

但其泛化能力远低于经过微调的有监督任务,且 GPT-1 使用的模型规模和数据量都

比较小,这也就促使了 GPT-2 的诞生。

多任务学习 GPT-2GPT-2 诞生于 2019 年,同样基于 Transformer,相比于

GPT-1,GPT-2 采用了更多的网络参数和更大的数据集,最大模型共计 48 层,参数

量达 15 亿。在性能上,在各种任务如阅读、对话、写小说等方面,效果都有所提高,

也在当时达到了最佳的效果。

海量参数模型 GPT-3GPT-3 采用 1750 亿个参数,规模是 GPT-2 的 117 倍,

在不经过微调便可以识别数据中隐藏的含义。作为一个无监督模型,GPT-3 几乎可以

完成自然语言处理的绝大部分任务,例如面向问题的搜索、阅读理解、语义推断、机

器翻译、文章生成和自动问答等等。同时,GPT-3 在两位数的加减运算任务的准确率

几乎达到了 100%,甚至还可以依据任务描述自动生成代码。以下显示了各类 NLP 模

型的大小,其中 GPT-3 是 Turing NLG 的十倍,远远超过 GPT-1 和 GPT-2。

虽然 GPT-3 已经非常强大,可以完成诸如将网页描述转换为相应代码、模仿人

类叙事、创作定制诗歌、生成游戏剧本等复杂任务,但是 GTP-3 并不完美。最主要

的问题之一就是聊天机器人和文本生成工具无法判断内容的质量和好坏,可以学习网

络上所有文本,可能产生恶意的甚至攻击性的语言输出,影响落地应用。

基于人工标注数据和强化学习的 GPT-3.5ChatGPT 原型)。ChatGPT 在一个

开源数据集上进行训练,不过采用了更大规模的训练参数,ChatGPT 的训练参数是

GPT-3 的 10 倍以上。除了训练参数规模的变化,ChatGPT 还采用了颠覆式的迭代

方式:人工标注数据和强化学习,其本质是加上了在 GPT-3 上去掉的微调步骤,从

而实现了在与人类互动时从反馈中强化学习。因此,ChatGPT 不仅可以理解人类不

同指令的含义,也会甄别高水准答案,还能处理多元化的主题任务。既可以回答用户

后续问题,也可以质疑错误问题和拒绝不适当的请求。

ChatGPT 仍存在很多局限性,需持续优化。ChatGPT 输入不能有错,有时解释

不够人性化,偶尔会给出看似正确但荒谬的答案等。虽然目前的 ChatGPT 无法给我

们生产方式带来根本性的变革,但有可能改变人们与计算机的互动方式,推动从用户

创作(UGC)到 AI 创作(AIGC)的转型。

据投资公司 Radical Ventures 预测,GPT-4 或采用更大规模的数据集,可能在

10 万亿个 token 的数据集上进行训练,同时它的参数有望比 Megatron-Turing 的要

少。GPT-4 有可能是多模态的,支持文本、图片、视频等多种数据类型的输入。意味

着 GPT-4 可以根据文本提示词(prompt)生成图像,或者是可以输入视频然后通过

文本的形式回答问题。

2 ChatGPT 应用及商业化落地加速

2.1 巨头涌入推动赛道发展

ChatGPT 日活量突破千万。ChatGPT 在 2022 年 11 月 30 日宣布公测之后,迅

速走红全网,上线 5 天该模型的全球用户数量已突破百万。根据 ARK 风险投资公司

统计数据,上线不到 40 天,ChatGPT 的日活用户已突破千万。

海外 ChatGPT 专题

优秀的 AI 生成模型层出不穷。除了 ChatGPT,2022 年还涌现很多优秀的 AI 生

成模型,以谷歌、DeepMind、OpenAI、Meta 等为代表。AI 文本生成作为当下最通

用的交互媒介,我们认为当前以 ChatGPT 为代表的 AI 文本生成模型有望率先应用

落地。

海外 ChatGPT 专题海外 ChatGPT 专题海外 ChatGPT 专题

国外头部机构引领技术和商业应用,国内整体进度落后 2~3 年。根据北京智源

人工智能研究院介绍,当前国外研究机构在这个领域具有较大优势,领先国内 2~3 年,

尤其是基础技术研究方面。如 2022 年清华大学联合智谱 AI 发布的中英双语模型

GLM-130B,参数规模与 OpenAI 在 2020 年发布的 GPT-3 接近,拥有 1300 亿参数

的开源开放中英双语双向稠密模型。过去 3 年来,OpenAI 搭建大模型基础框架,通

过 GPT-1/GPT–2/GPT-3/ChatGPT 引领行业发展。虽然国内最近两年也发布了很多

相关大模型,但本质上还是在 OpenAI 的基础上实现的,原创性及创新性方面还需持

续提升。

海外 ChatGPT 专题

生成式 AI 赛道火热,资金扎堆涌入。根据 PitchBook 统计数据,2022 年生成式

AI 赛道总共获得约 14 亿美元的融资,几乎达到了过去 5 年的总和。不仅包括 OpenAI、

Stability AI 等明星公司,其他初创企业如 Jasper、Regie.AI、Replika 等均获得资本

青睐,获得上亿美元融资。

海外 ChatGPT 专题

2.2 ChatGPT 应用前景广阔

ChatGPT 具有广泛的应用空间。ChatGPT 主要应用包括如下场景:

对话机器人:由于 ChatGPT 强大的的语言理解能力,可广泛应用于多种对话问

答场景,包括智能客服、虚拟人、机器人、游戏 NPC 等应用领域。

海外 ChatGPT 专题

智能创作:除了擅长对话问答之外,ChatGPT 还具备强大的文本内容创作能力,

可用于创意写作(诗歌、新闻、小说、学术等)、命题写作(风格模仿、文本续写、

主题拟定等)、摘要生成(学术类、小说类、新闻类等)等。尽管 ChatGPT 只是一个

对话式的语言模型,本身不能生成多模态内容,但可以把它输出的结果作为一个中间

变量输入其他模型,从而进一步拓展其应用。例如,通过 ChatGPT 和 Stable Diffusion

的结合使用,能够生成艺术性极强的画作。

海外 ChatGPT 专题

编程机器人:作为对话式大型语言模型,ChatGPT 擅长回答用户提出的问题,

其中最关键的是 ChatGPT 具备与编程相关的基础知识。可以将 ChatGPT 打造成

编程问答机器人,根据用户的需求编程或 debug,大幅提升编程效率、改善用户编程

质量。

海外 ChatGPT 专题

ChatGPT 助力用户提效,应用落地多面开花。ChatGPT 凭借出色的表现受到广

泛关注,众多公司都在商业化方面进行积极探索。Buzzfeed 近期宣布计划依靠

ChatGPT 加强内容创作,其股价两天上涨超过 300%。

海外 ChatGPT 专题

ChatGPT 在学术、房产等领域的应用逐渐落地。除了各大科技公司,ChatGPT

也开始应用于学术、房产等领域。根据在线课程供应商 Study.com 对 100 多名教育

工作者发起了一项调查,82%的大学教授知道 ChatGPT,而小学教育工作者的这一

比例为 55%,超过三分之一(

34%)的教育工作者认为应该在学校和大学中禁止

ChatGPT,而 66%的教育工作者支持学生访问它。不过在学术领域,ChatGPT 可能

加剧学术不端现象,因此在相关领域开始被抵制。知名期刊《Science》、《Springer

Nature》声称不能将 ChatGPT 列为作者,一些美国大学则宣布增加手写论文和口头

考试的比重。美国房产中介也开始使用 ChatGPT,用于房源信息撰写、房贷计算等。

海外 ChatGPT 专题

ChatGPT 商业化加速。随着 ChatGPT 的应用落地,商业化探索也成为关注焦

点,云服务、内容营销、咨询服务等均有望实现商业化落地。OpenAI 很注重商业应

用,GPT-3 已经拥有大量客户。随着微软、谷歌等巨头加码,ChatGPT 应用场景有

望进一步拓宽,相关领域商业化落地有望加速。

海外 ChatGPT 专题

3 建议关注

AIGC 赛道未来可期。作为 AIGC 最顶尖的模型之一,ChatGPT 有望对现有生

产力工具进行变革,大幅提升内容生产效率。我们认为 AIGC 赛道有望迎来投资热潮,

建议关注如下标的。

3.1 AIGC 赛道上游公司

全球 AI 训练数据服务领军者海天瑞声。海天瑞声是全球 AI 训练数据服务商,深

耕行业 20 年,2022 年被国际知名杂志《Corporate Vision》评选为 2022 年最具创

新性人工智能数据资源提供商。随着行业快速发展,基于大模型的 AIGC 需要海量数

据进行标注和训练的需求有望进一步增加,公司作为上游核心数据服务商有望率先受

益。

3.2 中游技术领先的公司

以语音识别为核心的企业科大讯飞。科大讯飞在人工智能领域深耕二十多年,主

营业务包括语音及语言、自然语言理解、机器学习推理及自主学习等人工智能核心技

术研究。在 AI 大模型领域积累多年,且在智慧城市、智慧教育、智慧医疗、智能汽

车等多个领域实现深度应用。随着 AIGC 赛道的火热,公司有望迎来新一轮增长。

国内 NLP 代表的企业拓尔思。拓尔思专注语义识别、大数据和数据安全,是国

内最早从事自然语言处理(NLP)研发的企业之一,在语义智能领域具备自主可控的

底层技术,可以提供预训练模型和阅读理解等技术成果。

AI 龙头企业百度。布局 AIGC 多年,推出文心大模型,极大促进国内 AIGC 的

发展。凭借 AI 算法、算力、数据以及资金优势,有望在 AIGC 领域占据一席之地。

3.3 下游应用率先受益的公司

昆仑万维。发布全系列 AIGC 算法与模型——昆仑天工,涵盖文本、图像、编程

和音乐四大 AIGC 热门领域。将自身强大的 AI 能力赋能内部业务,同时向 B 端和 C

端客户输出,帮助客户降本提效。

中文在线。是国内领先的数字文化内容产业集团,中国数字出版第一股。以自有

原创平台、知名作家、版权机构为正版数字内容来源,积累数字内容资源超 510 万

种,网络原创驻站作者 440 万名。旗下拥有 17K 小说网、四月天小说网、万丈书城、

科幻厂牌“奇想宇宙”、悬疑厂牌“谜想计划”等原创平台。率先将 AIGC 技术运用

到文本转语音、AI 辅助创作等领域,显著降低创作门槛。拥有良好内容生态并先行布

局 AIGC 的中文在线,将持续受益中国 AIGC 发展。

视觉中国。国内最早将互联网技术应用于版权视觉内容服务的平台型文化科技企

业,服务覆盖 195 个国家的 2000 万内容创作者,签约供稿人超过 50 万,专业创意、

媒体机构合作伙伴近 300 家;拥有超过 4 亿张图片、视频和音乐版权素材,服务各

类用户近 200 万。近期与百度签署战略合作协议,共同推动 AIGC 落地新场景。

掌阅科技。作为全球领先的数字阅读平台之一,与国内外上千家出版公司、文学

网站建立了良好的合作关系,为全球 150 多个国家和地区的用户提供高品质的图书

内容和智能化的服务体验。公司高度重视 AIGC 发展,不断加强 AIGC 领域的技术储

备和产品开发,积极探索将 AIGC、WEB3.0 等技术在阅读领域应用的商业模式。

阅文集团。公司旗下囊括 QQ 阅读、起点中文网、新丽传媒等业界知名品牌,

汇聚了强大的创作者阵营、丰富的作品储备,覆盖 200 多种内容品类,触达数亿用

户。有望借助公司自身丰富的语料库开发大型 AI 语言训练模型,辅助创作更具吸引

力的网文,丰富内容创作来源,吸引更多用户,助力业务进一步增长。

汉仪股份:字体版权龙头公司,提供全球化语种的字库定制服务,与华为、小米、

阿里等公司均有合作。在 AIGC 领域具有天然优势,依靠 AIGC 技术可大幅提升字体

设计效率,助力公司业务持续增长。

4 风险提示

1) 政策监管风险。由于 AIGC 发展处于早期,政策监管仍不明确,利用 AIGC

生成的内容可能存在侵犯其他内容知识产权的风险。

2) AIGC 技术发展不及预期风险。当前 AIGC 技术仍有局限,模型仍需持续

迭代优化,技术发展可能存在不及预期风险。

3) 商业化落地不及预期风险。新的技术需要商业化验证,目前 AIGC 的商

业化仍处于早期探索阶段,有存在不及预期风险。

© 版权声明

相关文章