腾讯“散装”大模型

AI资讯2年前 (2023)发布 GPTHub
8 0
腾讯“散装”大模型

图片来源@AI全家桶

文|GPTHub

大模型浪潮下的互联网行业暗流涌动,大家都在翘首以盼谁能率先跑出中国GPT。

百度、360、阿里、昆仑万维、商汤、金山、科大讯飞……即使抛去高校国家队和创业公司,已经在大模型领域秀过肌肉的大厂也能拉出一张清单来。中国科技巨头历来喜欢追逐风口,大模型的航海时代自然也不会免俗,但有那么一家巨头却很沉得住气,至今未曾露出什么大动作。

作为早在2022年4月便正式亮出旗下混元大模型的腾讯,在计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向均有所建树,如今却给外界一种“失声”的感觉。

自今年2月起,腾讯在大模型领域为外界所感知的大动作仅有两次,一是2月27日针对类 ChatGPT 对话式产品已成立「混元助手(HunyuanAide)」项目组,腾讯史上最高专业职级拥有者张正友为项目Owner;二是4月14日发布新一代HCC(High-Performance Computing Cluster)高性能计算集群。

在友商纷纷下场展示实力与声量,争取在大模型时代获取更多认知,腾讯的失声很可能是一部慢,步步慢。更有意思的是,腾讯控股自3月29日起便跌跌不休,以Naspers为首的大股东更是在持续减持套现,这兴许也是资本市场对腾讯在大模型赛道失声现状的不满情绪体现。

难道,腾讯还在“等风来”?

“失声”是表象

北上广不相信眼泪,互联网大厂只相信效率。即使是OpenAI这个不停烧钱的公司也会不时对外放出一些意见以及信息,在信息爆炸的现代社会中试图短暂地获取关注力,而腾讯也是如此。

我们不妨以2月27日为节点,从腾讯对外宣布的动作中寻找其大模型训练进度的蛛丝马迹。据光子星球不完全统计,腾讯自2月27日起至今的动作集中在三方面,一个是AI商业化应用,另一个是视频号,最后是政企合作。

细数下来,其实腾讯在各方面的动作并不小。除了分别于移动、联通两大运营商达成云计算方面的合作外,3月30日,腾讯发布AI智能创作助手“腾讯智影”。4月,腾讯在上海智慧车站前夕发布智慧出行汽车云,发布了据称是国内性能最强的大模型计算集群,还与字节跳动破冰,探索视频合作。当时间到了5月,腾讯微视面向头部的抖音、小红书与快手招募创作者,于5月9日发布了“开悟”AI开放研究平台,更是开放QQ渠道为载体,让AI绘图工具Midjourney开启官方中文版内测。

与率先发布通用大模型并展开应用探索的诸位友商相比,腾讯的声量虽小却也谈不上“安静”。而且其中无论是“开悟”AI开放研究平台、“腾讯智影”AI智能创作助、计算集群的发布还是Midjourney相关动作,其实都与大模型训练有不小的关系。

智慧出行汽车云是基于云服务以及AI训练的“车云一体”服务,“开悟”本身是由AI Labs联合王者荣耀项目组推出的,本身是借用游戏场景进行AI训练的平台;“腾讯智影”这款支持虚拟数字人、文本配音、智能 AI 绘画、文章转视频的应用本身也属于大语言模型的功能范畴;Midjourney开放内测是对AI原生应用于C端落地的探索;高效的计算集群更是在大模型训练中不可或缺的基础设施。

再往下深挖,这三个项目其实也分属腾讯内部不同事业群。“车云一体”属于CSIG(云与智慧产业事业群),“开悟”属于IEG(互动娱乐事业群),“腾讯智影”应属于WXG(微信事业群),大模型计算集群分属TEG(技术工程事业群),QQ的应用探索属于SNG(社交网络事业群)。

这不免让我们联想到腾讯特色的“内部赛马”机制,这是在过去的腾讯业务线中,不同竞品之间养蛊最后确认胜者的流程。而光子星球自某位接近腾讯人士处获悉,CSIG、TEG与PGC均在训练业务范围内的大模型。

但考虑到大模型训练极高的投入,内部赛马将造成更大的沉没成本。因此,目前的“赛马”现象更大可能是TEG统领全局,由各个BG提供语料以及数据集标注,为各BG的业务线打造专属模型,最后再通过知识蒸馏汇总到混元AI之中。

这样的战略布局好处很明显,既可以最大限度调动全局并提供高质量数据集,也能在长时间的模型训练中探索商业场景落地的可行路径。但弊端也同样显著,大型组织架构中各个BG难以相互配合,庞杂组织架构难免的山头林立也让成果互通变得困难。

“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇。所以我们觉得(AI)非常重要,但这的确需要有很多的积累”,结合Tony在腾讯一季度财报会议上的讲话,腾讯在试图对外解释自己的“不紧不慢”,但在各家发力开卷的当下,未曾透露具体进度的回应总归显得有些苍白。

不受待见的AI Labs走上风口浪尖

无论最终腾讯通过田忌赛马落地了多少个BG的大模型应用,最终的目的一定是保证最顶端的“混元”能够帮助腾讯在AI时代站稳脚跟,甚至再现移动互联网时代的社交辉煌。

于是,一直以来在组织架构中显得有些边缘的AI Labs踏上舞台中央,享受着最集中的资源同时也承受着前所未有的压力。

这是因为,以腾讯AI Labs以及阿里达摩院为代表的大厂AI研究实验室通常进行的是较为前沿且高通用的算法研究,研究成果通常会通过API接口或SDK形式对其他BG输出,而业务性强的具体场景一般都需要算法的定制化,按需制作。相比以主导者的身份统筹业务BG,更多的可能是以中台的定位帮助业务BG打造搭载前沿技术的产品。

光子星球自一位接近腾讯人士处了解到,AI Labs一贯给其他BG的印象便是“不干实事、论文灌水”,之所以会让同僚们产生如此刻板印象, 是因为许多前沿研究仅有成果而未能投产,“并非研究人员划水”。其中比较典型的是经过AI Labs多次优化后的智能音箱,作为腾讯20周年庆的员工礼物于内部送出的同时项目也面临叫停的风险。

据了解,智能音箱项目于2018年4月上马,隶属于当时腾讯移动互联网事业群(MIG)旗下的智能创新业务事业部,其发布首日便在京东商城取得了两万台的首日销量。只是在智能音箱项目上线后8个月,CSIG作为当时腾讯的业务重心也推出了自己的智能音箱项目叮当带屏音箱,项目划分问题与不同BG间微妙的“市场竞争”关系耐人寻味,这或许也是智能音箱项目被叫停的原因。

“当一群本应专研算法,头脑风暴公司下一阶段核心竞争力的组织疲于应付各个业务BG的产品,甚至下场田忌赛马,即使如此还是不能落下学术产出,(公司)还能指望它做得多好?”一位接近腾讯人士说。

技术变现是大厂技术部门的永恒命题,关键在于着急与否。一位咨询顾问告诉光子星球,相比于进入大厂的中台,沦为“算法外包工”,无论是进入工业界的业务部门还是转身高校专研学术,都是性价比更高的选择。这或许也解释了曾经腾讯AI Labs主任、斯坦福博士张潼于2018年12月离职并重返学术界的原因。

如果未曾出现大模型这样目前公认的通往AGI的切实路径,AI Labs可能也不会走上风口浪尖。只是中台的角色定位不变的话,没有强有力的话语权支撑,AI Labs能否完成组织交付的任务还是要打一个问号。

 

毕竟曾经展开中台这个故事的阿里已经通过分拆上市解构了中台神话,就像亟需数字化的中小企业中业务部门与IT部门相互不对付,中台与各事业群之间的微妙关系已然让互联网企业组织架构走进了一个死胡同。

成也赛马,败也赛马?

人都是经验的奴隶,如果说AI Labs为中台乃是腾讯发展至今的惯性使然,显然这样的惯性并不止一种。其中比较典型的是腾讯长期坐镇南山巍然不动,“把半条命交给合作伙伴”的投资扩张逻辑,以及众所周知的内部赛马。

在MaaS(model as a service)愈发为人所重视的当下,大模型如果可以被视作一个产品的话,极大可能是通往新世界的船票。因此在大模型赛道,腾讯想必不会将哥伦布的角色拱手让人,尤其是模型层,只是在应用层可能会依靠合作伙伴建立生态圈,远有微信上的丰富应用,近也有QQ上开始内测的midjourney。

至于腾讯为何选择QQ生态而非微信生态,可想而知的原因可能是QQ用户群体相对年轻化,而且在PC端的产品呈现上显然是QQ更胜一筹。此外,这一选择也存在强烈的“试水”性质,毕竟midjourney本身还未曾以成熟的产品形式呈现,在QQ之前,仅以API形式接入了discord。

更值得一提的是大模型赛道的赛马,曾经赛马跑出的神话实际上早已在算法时代为头条系的崛起而破灭,因为赛马机制本质上是建立在冗余前提下,通过资源优势以面找点,重复造轮子,有点类似于数学中的穷举法。之所以神话破灭,是在于赛马在保险的同时也让腾讯丧失了曾经的敏捷,最典型的便是短视频应用至今只跑出来了视频号这个全村的希望。

不过,大模型赛道的赛马说不定还真能行。

因为大模型训练非一夕之功,更不是某个强烈需求敏捷能力的垂类。重资产投入、试错成本高昂的预期以及应用层呈现的千奇百怪很大程度上弥平了赛马机制的缺陷,一方面是应用多样化避免了重复造轮子造成的资源浪费,另一方面是大模型特有的知识蒸馏让试错不再可怕,即使OpenAI珠玉在前,大家对国内的各家大模型仍抱有宽容的态度,无论是公众层面还是公司内部。

所幸新一轮的赛马或许不需要决出个胜负,更重要的是胜负之外的结果。腾讯也应该感谢OpenAI开启的新时代,一个不再追求短平快,连方向路径都已昭然若揭的时代,让缺乏敏捷、缺乏对核心抓手的嗅觉的腾讯重回棋盘之上,与竞对一起自天元落子。

只是大模型也并非万能,最起码,腾讯组织架构的顽疾以及整体战略上的模糊尚待调整。

如果希望AI Labs是腾讯这艘船的哥伦布,那么拆除组织架构内的部门墙以及重塑对创新的态度将是重中之重。例如光子星球自一位接近腾讯人士处了解到,AI Labs曾出走多位顶尖人才,他们曾经在腾讯内部的创新成果也在出走后落地多个垂直领域,甚至其中不乏龙头的存在。

如果希望AI Labs这位哥伦布能真的发现新大陆,起码需要坚定地朝着正确方向前进。这一点恰是腾讯在开启赛马之路后丢失的能力,因为赛马的本质在于有力却不知何处使。现在的腾讯能否在赛马机制的路径依赖下突破以面找点,以各个BG在应用层积累的数据库为基础,在高效协同之下跑出一个大模型来,我们还在等待这份答卷。

只是留给腾讯的时间可能不多了,随着夏季到来,今年又恰是厄尔尼诺之年,用电问题将愈发严峻,届时大模型训练想必会受到不小的影响。

一步慢可能步步慢,赛马机制在短视频上的失败让曾经的“后发先至”从神话变成遮羞布,大模型将是腾讯能否正视自身问题,向世界证明自己仍具备打硬仗能力的最好机会。毕竟,就算是在腾讯如今最重视的市值管理上,大股东们还在减持套现。

© 版权声明

相关文章

必读要闻一:谷歌测试医疗聊天机器人,AI医疗时代有望正式开启 谷歌云业务部门表示,正在与Mayo Clinic合作测试一项新的服务,以定制专用的医疗领域的聊天机器人。 海外“AI+医疗”发展相对成熟,已推出AI影像、诊断、制药、管理、机器人等产品。长江证券认为,多维度共同驱动之下,“AI+医疗”有望成为医疗IT行业下一个核心增长点。国内相关企业或进一步加大AI领域的研发进度,未来存在商业化进一步升级的可能。 上市公司中,朗玛信息(300288)成功开发出具有自主知识产权的医疗健康人工智能产品“朗玛·39AI全科医生”的认知水平可以达到初、中级全科医生的水平。创业慧康(300451)与浙大计算机创新技术研究院、浙江省智慧医疗创新中心签订三方战略协议,推动AI大模型在临床医疗、公共卫生、个人健康等场景中的研究与开发。 必读要闻二:这类器件有望广泛应用于光模块等多个领域 机构指出,薄膜铌酸锂调制器具有大带宽、低功耗、小尺寸等优势,有望成为调制器未来的重要发展方向。光通信、光纤陀螺、超快激光器等领域均存在对薄膜铌酸锂调制器的需求,未来增长具备广阔的市场空间。 中信建投证券表示,薄膜铌酸锂器件将大大减小尺寸,有望广泛应用于光模块和光器件等多个领域,市场规模进一步提升。根据Light Counting的预测数据,薄膜铌酸锂调制器适配的600G及以上相干光模块DSP市场,有望从2021年的1.31亿美元,增长至2027年的9.92亿美元,6年CAGR为40.06%,薄膜铌酸锂调制器行业具备较高的成长性。 上市公司中,天通股份(600330)生产的铌酸锂单晶材料是薄膜铌酸锂调制器的上游关键原材料。光库科技(300620)具备了开发高达800Gbps及以上速率的铌酸锂调制器芯片和器件的关键能力。 必读要闻三:到2027年中国游戏市场总收入或将超过570亿美元 咨询机构Niko Partners发布的一份最新报告显示,2022年中国游戏市场收入达到455亿美元,包含手机、PC和主机游戏。中国游戏公司在全球手机游戏和PC游戏的收入占比分别为47%和39%。预计到2027年,中国游戏市场总收入将超过570亿美元。 随着游戏科技不断发展,相关科技的运用早已突破游戏行业本身,在AI、VR等诸多领域也已产生作用。中信建投表示,游戏行业是AIGC的天然适用场景,是AIGC最重要的商业化方向之一。随着未来AIGC技术不断成熟,其对游戏行业将带来变革式影响。 上市公司中,顺网科技(300113)边缘算力网络可提供足量及就近的边缘算力服务,承接来自于人工智能、云游戏、工业互联网等行业对于实时算力的需求。迅游科技(300467)的“迅游网游加速器”是基于公司独立研发的SCAP,在行业内具备较高的知名度和较强的竞争优势。 必读要闻四:这一模式或快速在AI行业渗透,可最大化合理利用资源 随着AI的快速发展,算力短缺问题凸显,算力租赁或成为AI企业破局点。 华福证券指出,对于大多AI企业和行业应用企业而言,轻资产的算力租赁模式与企业资金实力和业务场景最为匹配,该模式有望快速在AI行业渗透,掌握算力资源的企业将具备非常明显的先发优势。另一方面,算力租赁业务本身也是轻资产模式,通过管理城市云的闲置资源并进行调度最大化合理利用资源,租赁收益与政府分成实现双赢,有利于城市云的进一步落地。 上市公司中,世纪华通(002602)深度参与投资的位于上海松江的腾讯长三角人工智能先进计算中心及生态产业园区项目。首都在线(300846)在10余个国家或地区建设了云网一体化的云计算节点,可为云游戏、AI、XR、数字人、数字孪生、智能制造等各领域提供算力。 钛小股·钛媒体财经研究院 2023.06.12 下载钛媒体App,关注更多财经投资机会! 更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App