ChatGPT 开启 AI 新纪元,加速应用场景落地,带动 AI 产业上游需 求

AI资讯2年前 (2023)更新 GPTHub
9 0

核心观点

ChatGPT 开启 AI 新纪元,加速应用场景落地,带动 AI 产业上游需

求:

2022 年 12 月 1 日,OpenAI 发布了自然语言生成式模型 ChatGPT,可以

通过人工智能模型来与用户对话,并自动理解用户的问题,提供更精确、更有

价值的信息。ChatGPT 建立在 GPT-3 的后续改进版本 GPT-3.5 基础上,通过

引入强化学习模型,大幅提高了 AI 在人机对话时的准确度和可控性,实用性

得到广大用户的积极反馈。ChatGPT 下游应用场景包括代码机器人、小说衍生

器、对话类搜索引擎、语音工作助手、对话虚拟人等,具备代替人工的创造力;

ChatGPT 也将带动上游算力、数据标注、自然语言处理需求,可谓开启 AI 新

纪元。

算法模型引入人类反馈,技术发展迎来拐点:ChatGPT 受到广泛认可的重

要原因是引入新技术 RLHF(Reinforcement Learning with Human Feedback),

即基于人类反馈的强化学习。RLHF 解决了生成模型的一个核心问题——

alignment(对齐),即如何让人工智能模型的产出和人类的常识、认知、需求、

价值观保持一致。该技术突破使得 ChatGPT 对话更加贴近人类,语段间逻辑

关联度显著提升。

ChatGPT 平台型技术将带动全行业 AI 发展提速:

ChatGPT 是 AIGC 技

术进展的里程碑,该模型使得利用人工智能进行内容创作的技术成熟度大幅

提升,有望成为新的全行业生产力工具,提升内容生产效率与丰富度。部分行

业如搜索引擎、文稿创作、艺术设计等可能出现行业格局与商业模式的骤变,

全行业“AI+”浪潮已至。数据、算力、算法作为 AI 三要素,相互耦合,共

同促进,将带动 AI 行业整体协同发展。

投资建议:建议关注数据领域的海天瑞声等;算力领域的海光信息、龙芯中

科、宝信软件等;算法领域的海康威视、大华股份、科大讯飞、奥普特以及 AIGC

领域的万兴科技等。

风险提示:AI 技术迭代不及预期的风险;商业化落地不及预期的风险;政策

监管风险

1 ChatGPT:颠覆性的生产力工具

ChatGPT 让人工智能真正融入人类创造,成为颠覆性的生产力工具。2022 年 12

月 1 日,OpenAI 发布了自然语言生成式模型 ChatGPT,这是一种基于 GPT-3

(Gererate Pre-Training,生成式预训练模型)技术的聊天机器人,它可以通过人工

智能模型来与用户对话,并自动理解用户的问题,提供更精确、更有价值的信息。

相比 GPT-3,该模型回答问题方式更加贴近人类,具备记忆能力,可实现连续对

话,同时还具备修改代码、撰写论文、诗歌创作等能力,开放测试 5 天内注册人

数即超过百万人。OpenAI 的联合创始人马斯克也在感叹:“我们离强大到危险的

人工智能不远了。”

ChatGPT 开启 AI 新纪元,加速应用场景落地,带动 AI 产业上游需  求

ChatGPT 是基于 OpenAI 此前发布的 GPT-3 的进一步创新,是站在巨人肩膀上

的明星技术。OpenAI 是一家通用人工智能研究公司,于 2015 年成立。OpenAI 开

发、维护和训练了一批可用于写作、阅读、编程和图像处理的 AI 模型,包括 Muse

Net、GPT-3、ChatGPT 等,ChatGPT 是 OpenAI 原创性自动问答系统 InstructGPT

的延续,建立在 GPT-3 的后续改进版本 GPT-3.5 基础上,通过引入强化学习模型,

大幅提高了 AI 在人机对话时的准确度和可控性。ChatGPT 下游应用场景包括代

码机器人、小说衍生器、对话类搜索引擎、语音工作助手、对话虚拟人(客服、

外呼、营销)等。从上游需求的增加来看,算力、数据标注、自然语言处理等可

能受益。

ChatGPT 开启 AI 新纪元,加速应用场景落地,带动 AI 产业上游需  求

2 技术拐点:基于人类反馈的强化学习

ChatGPT 受到广泛认可的重要原因是引入新技术 RLHFReinforcement

Learning with Human Feedback),即基于人类反馈的强化学习。RLHF 解决了生

成模型的一个核心问题——alignment(对齐),即如何让人工智能模型的产出和人

类的常识、认知、需求、价值观保持一致。为实现 ChatGPT 模型训练,需要以下

三个步骤:

根据采集的数据集对 GPT-3 进行有监督的微调(

SFT):由人工智能训练师

提供对话,在对话中他们扮演用户和人工智能助手。训练师根据模型编写的

建议,编写自己的回答。将这个新的对话数据集与 Instruct-GPT 数据集混合,

并将其转换为对话格式;

收集人工标注的对比数据,训练奖励模型(Reword ModelRM:收集人工

智能训练师与聊天机器人的对话,并让训练师对模型的不同回复进行排名。

利用奖励模型,可以使用近端策略优化对模型进行微调。最后对以上过程进

行多次迭代计算;

使用 RM 作为强化学习的优化目标,利用 PPO 算法微调 SFT 模型:再次随

机挑选人类提问,并基于 PPO 的强化学习算法对监督训练后精调过的模型进

行再次微调。将挑选的问题输入 PPO 模型,并用 RM 奖励信号对模型进行训

练。

ChatGPT 开启 AI 新纪元,加速应用场景落地,带动 AI 产业上游需  求

ChatGPT 目前使用有局限性,模型仍有优化空间。ChatGPT 模型的能力上限,很

大程度是由奖励模型决定,该模型需要巨量的语料来拟合真实世界,对标注员的

工作量以及综合素质要求较高。当前 ChatGPT 可能会出现“创造不存在的知识”、

“主观猜测提问者意图”等问题,模型的优化将是一个持续的过程。

ChatGPT 开启 AI 新纪元,加速应用场景落地,带动 AI 产业上游需  求

 

3 变革前夕:“AI 创造”产业化在即

3.1 平台化产品赋能全行业,“AI+”势不可挡

ChatGPT 平台型技术突破,带动全行业 AI 发展提速。ChatGPT 是 AIGC(AI

Generated Content 人工智能生成内容)技术进展的里程碑,该模型使得利用人工

智能进行内容创作的技术成熟度大幅提升,有望成为新的全行业生产力工具,提

升内容生产效率与丰富度。未来文学创作、图片绘制、视频制作、游戏内容生成

都可使用 AI 实现。

ChatGPT 开启 AI 新纪元,加速应用场景落地,带动 AI 产业上游需  求

3.2 行业加速迭代,格局迎来骤变

谷歌紧急召回创始人,人工智能发展催化行业变革。2022 年 12 月,谷歌紧急召

回创始人拉里·佩奇和谢尔盖·布林,讨论应对 ChatGPT 的相关计划。根据

statcounter 数据,2020.01-2022.11 谷歌的全球市场份额超 90%,是全球搜索引擎

市场的绝对霸主,而 ChatGPT 的出现对谷歌搜索引擎形成了挑战。

ChatGPT 开启 AI 新纪元,加速应用场景落地,带动 AI 产业上游需  求

ChatGPT 可能导致搜索引擎商业模式发生骤变。谷歌具备自然语言(NLP)的技

术储备,比如对话系统 LaMDA 就是成果之一,当前搜索引擎给出的链接往往更

加全面,而 ChatGPT 组织信息的方式更加简练,能够帮助整合信息、梳理段落要

点,因此使用方面 ChatGPT 并不具备压倒性的替代优势。然而谷歌的收入结构当

中广告占据了 58%,一旦引入生成式 AI 搜索引擎,用户就会减少在链接间跳转、

浏览的时间,也就减少了广告投放的空间,这会使谷歌搜索引擎的盈利模式发生

根本性的变化。对于小型搜索引擎公司而言,ChatGPT 带给了他们弯道超车的机

会。

ChatGPT 开启 AI 新纪元,加速应用场景落地,带动 AI 产业上游需  求

3.3 人工智能浪潮已至,数据、算法、算力耦合共振

AI 三要素相互耦合,共同生成 AI 模型。一个传统的 AI 模型包括训练和推断(预

测)两大部分。训练环节指将训练数据(通常为现有的历史数据)输入进算法中,

通过 AI 芯片(GPU、FPGA 等)提供算力支撑,以及数据工程师的分析调参,最

后生产满足特定功能的 AI 应用模型。推断环节指通过向训练完成的 AI 应用模型

中输入实际应用场景中的新数据,并生产对应的推断结果。在这一过程中,数据、

算法和算力扮演着同等重要的角色,三要素的耦合关系是探索 AI 未来发展道路

的重要基础:

数据是 AI 模型的汽油数据是一切人工智能的基础。数据因其可具象性

强,也是最容易被理解的竞争壁垒(特斯拉在自动驾驶数据的积累、科大讯

飞在智慧教育的题库数据积累等)。未来数据的突破口在于 1)数据积累的行

业下沉(智能化渗透率的提升,传感技术的升级等);2)现有数据的打通(实

现将不同行业,政府与企业间的数据互联互通);因此,在特定行业具备数据

积累先发优势和跨行业数据整合能力的公司有望保持领先。

算力是 AI 模型的发动机算力是最容易被直观量化的指标(英伟达每年推

出的新 GPU 参数),但也是目前最大的瓶颈。算力的瓶颈并不体现在算力的

绝对大小,而在于实现该算力的成本。特别是在算法场景众多、迭代速度较

快的 AI 领域,如何设计出同时满足通用性和高算力的 AI 芯片仍是当下炙手

可热的话题。因此,具备由单一芯片模式往融合异构多芯片模式发展能力的

公司有望率先受益。

算法是 AI 模型的大脑算法是 AI 实现技术跃迁的根本,也是最难以被直

观理解的部分。从 AlexNet 重新复兴神经网络到 Transformer 开启大模型时

代,人工智能的每一次里程碑事件都伴随着算法层面的突破与创新。往后展

望,一个好的算法除了能更好的完成设定的任务外,还需具备 1)更强的通用

性(激活更多的可用数据);2)更优化的计算原理(减少算力的负担)。因此,

我们认为在 AI 领域具备科研资源和资金实力的公司将有望拔得头筹。

ChatGPT 开启 AI 新纪元,加速应用场景落地,带动 AI 产业上游需  求

4 投资建议

建议关注数据领域的海天瑞声等;算力领域的海光信息、龙芯中科、宝信软件等;

算法领域的海康威视、大华股份、科大讯飞、奥普特以及 AIGC 领域的万兴科技

等。

5 风险提示

AI 技术迭代不及预期的风险:

若 AI 技术迭代不及预期,NLP 模型优化受限,则

相关产业发展进度会受到影响。

 

商业化落地不及预期的风险:ChatGPT 盈利模式尚处于探索阶段,后续商业化落

地进展有待观察。

政策监管风险:目前 AIGC 相关技术还处于发展早期,后续若出台监管政策可能

会对行业发展有一定影响。

© 版权声明

相关文章