6月初外媒拷问谁是中国OpenAI,智谱AI与百川智能融资竞技争夺宝座
6月初,外国媒体问“中国是谁?”在经历了大型企业家精神的浪潮之后,海浪冲走了沙子,只有几个人被抛在后面。
几所大学交叉路口之外的帆建筑是Star企业家Wang 的 ,Sohu 是一名大学生的Zhipu AI。经过市场测试后,两者成为两个最有前途的候选人。
这两座建筑物的战斗似乎已经悄悄地开始。
从融资的角度来看,Zhipu AI和 今年已经完成了多轮大规模融资。
(光锥智能图:根据公共信息进行排序)
今年,Zhipu AI的总金额已超过25亿元人民币,而 的总金额已达到3.5亿美元(约合23亿卢比)。公共信息显示,Zhipu AI的最新估值超过100亿元人民币,最高的估值达到150亿元人民币,使其成为中国最快的估值之一,超过100亿元人民币。在最新一轮融资之后, 的估值超过了10亿美元(约66亿元人民币)。
从团队组成的角度来看,Zhipu AI和智能老师来自同一所学校。 Zhipu AI总裁Wang 和Sogou创始人Wang 都是的企业家团队。
从技术追赶的速度来看,两者并不相同。 Zhipu AI的GLM-130B发行后立即击败了GPT-3,最新的2在各个方面领先于Llama 2,开放了中国开源生态系统的发展。
所有迹象都表明,Zhipu AI和 已成为中国大型模型轨道所浮现的“黑马”。在激烈的比赛中,谁会赢?
信徒:Zhipu ai
Zhipu ai的关系可以追溯到2020年,这被认为是他心中真正的“ AI大语言模型的第一年”,由Zhipu AI首席执行官Zhang Peng(Zhang Peng)。
在 AI周年纪念日,在欢乐的气氛中,您有时会闻到GPT-3的诞生引起的丝毫焦虑。在严格意义上,GPT-3达到1750亿个参数,是第一个大型语言模型。
当时,张彭对GPT-3的出现感到震惊,并且也被认为是“是否跟随”。无论是当时还是现在,超大级参数大型模型的所有方向都是极具风险的事情。权衡权衡取舍后,Zhipu AI决定将其作为基准对象进行投资,并投资于超大规模预培训模型的研发。
(光锥智能图:根据公共信息进行排序)
在技术路径选择方面,Zhipu AI具有相同的独立思维能力。
当时,存在几个大型模型预训练框架,包括BERT,GPT和T5。这三个路径在培训目标,模型结构,培训数据源和模型大小方面具有自己的优势和缺点。
如果将大型模型培训过程与英语考试进行了比较,那么Bert擅长通过单词和句子之间的关系以及通过理解进行检查。评论材料主要来自教科书和维基百科; GPT擅长通过预测下一个单词并通过大量写作练习来准备考试,其评论材料主要来自各种网页; T5采用了正式化问题的策略,首先将问题转化为中文,然后解决问题。在审查期间,不仅阅读教科书,还刷了大量的问题库。
众所周知,选择了Bert和GPT。 Zhipu ai并没有盲目遵循它。基于这两条路线,它提出了GLM(模型)算法框架。该框架实际上实现了伯特和GPT的互补优势和缺点,“不仅可以理解,而且可以完成延续和填充空白。”
因此,GLM已成为Zhipu AI追求的最大信心,在此框架下,GLM -130B,-6B,-6B和其他GLM系列大型模型逐渐增长。实验数据表明,就语言理解精度,推理速度,内存共享和大型模型适应应用而言,GLM系列大型模型比GPT更好。
(照片来源:互联网)
目前,它是可以提供基本模型服务的国外最完整的组织。它的商业化主要分为两类:一个是API检索费用,另一种是基于订阅的费用。在商业化方面,Zhipu ai还遵循了一般思想,并且是国内大规模商业化的相对成熟的公司梯队。
根据 副本,根据中国公司的实施,Zhipu AI的业务模型分为API充电和私有化充电模型。
模型的总体类型是语言模型,超拟人化模型,向量模型和代码模型。每个模型选项都包括标准定价,基于云的私有化定价和本地私有化定价。相比之下,Zhipu AI缺乏语音和图像大型模型服务的提供,但增加了超级人性化的大型模型,这也满足了中国数字人类和智能NPC等行业的需求。
(光锥智能图:根据公共信息进行排序)
从开发人员那里了解到:“目前,Baidu 平台的特征是完美的, 非常灵活,而Zhipu AI是市场上主流制造商中最便宜的API公司之一。”
Zhipu ai的-Pro的费用为0.01元/公里,给出了18元的免费配额, - 莱特的费用降低至0.002 yuan/kilol。作为参考,GPT-3.5电荷为0.014元/公里,阿里巴巴 -turbo的费用为0.012 yuan/kian/公里,而Baidu Yiyan yiyan emie-bot-turbo费用为0.008 yuan/。
正如张彭(Zhang Peng)所说,Zhipu AI也正在经历“不再关注”的新阶段。
在产品业务方面,与仅关注的升级不同,Zhipu AI选择了三次攻击。
根据其官方网站,当前的Zhipu AI业务主要分为三个主要部分,即大型Maas平台,科学与技术情报平台和认知数字人。这形成了三个主要的AI产品矩阵,大型模型产品,产品和数字人类产品。其中,大型模型产品不仅涵盖了基本的对话机器人,还涵盖了编程,写作和绘画方面的机器人部门。
(照片来源:Zhipu AI官方网站)
同时,Zhipu AI仍在继续通过投资探索应用程序方面。到目前为止,Zhipu AI已投资于 并绘制了Wall ,并在今年9月再次增加了其在 的持股。
还从 的计算机科学系孵育。尽管其起源相同,但智能更倾向于应用程序。 IT开发的AIU兴趣互动社区是基于 AI的超人型模型。其产品的发展思想与外国AI相似。通过创建具有不同个性和个性的AI角色,与他们进行互动和聊天,它更倾向于C-End应用程序,并强调娱乐的属性。
从转向莉亚玛:智能
Light Cone 发现,与 相比, 更像是美洲驼。
首先,根据原始技术和经验,发行和迭代速度非常快。
建立了半年后, 发布了四个开源商业型号-7B/13B和-7B/13B一个接一个和两个封闭的源型号-53B和-53B。截至9月25日,已经打开了53B API接口。在过去的168天中, 以平均每月单位速度发布了大型型号。
(光锥智能图:根据公共信息进行排序)
Meta通过在一系列开源模型中重新获得声誉来赢得其AI位置。
根据测试结果,-7b基本和-13b基碱基以绝对优势在几种权威评估基准(例如MMLU,CMMLU和GSM8K)中引起的。与同一参数的其他大型模型相比,它们的性能也非常令人印象深刻,并且它们的性能明显优于相同尺寸模型的竞争对手。
事实证明,智能模型确实已经进行了考验。根据官方数据,开源社区的总下载超过500万次,每月下载量超过300万次。
Light Cone 发现, 系列模型的下载量最高,超过110,000个开源社区,并且在中国和外国开源模型中仍然具有竞争力。
(照片来源:面部官方网站)
其开源优势的原因也与其强大兼容性有关。 曾经在公开场合引入,其整个大型模型基础结构更接近Meta的Llama的结构,因此,就开源设计而言,它对企业和制造商非常友好。
“在开放消息来源之后,生态系统将建立在美洲驼附近。在国外有许多开源项目由骆驼促进。这就是为什么我们的结构更接近美洲驼的原因。”王小大说。
根据 的说法, 在建筑设计中使用热插入式(热),可以支持模型与模型的不同模块之间的随机切换。例如,在使用Llama训练模型后,它可以直接将模型放入而不会进行修改。这也解释了为什么大多数互联网制造商现在使用模型,而云制造商介绍了系列模型。
历史所采取的道路导致了过去和未来。这就是Wang 的大型企业家精神的方式。
从Sogou的身份和搜索技术经验中,Wang 在其业务的早期阶段就从许多人那里接受了此类评估,“ 最适合制作大型模型。”
通过搜索经验和框架建立大型模型已成为 的背景颜色。
的合资企业Chen 曾表示,搜索研发与大型模型开发有许多相似之处。 “ 迅速将搜索经验转移到了大型模型开发中,这类似于“火箭制造”系统项目,拆卸复杂系统,通过过程评估和提高团队有效性来促进团队协作。”
Wang also at the press : " had genes , it knew how to the best pages from the - web pages, so that they could and anti-spam. In data , also drew on and could the and work of 100 - data at an level."
其大型搜索的内核完全显示在-53B中。在处理大型模型的“幻觉”问题并结合搜索技术降水的问题时, 优化了信息获取,数据质量改进,搜索增强等。
在提高数据质量方面, 的核心思想是“始终获得最佳”,根据低质量和高质量标准对数据进行分类,以确保-53B始终使用高质量的数据进行预训练;在信息获取方面,-53B升级了多个模块,包括关键组件,例如指导意图理解,智能搜索和结果增强。通过深入了解用户说明,精确地推动查询单词的搜索,并最终结合了大型语言模型技术以优化模型结果的可靠性。
尽管它始于开源,但 已开始探索商业化路径。官方数据表明, 有两个方向。水平维度的目的是“建立中国最好的大型模型基础”,垂直方面的目标是在搜索,多模式,教育,医疗服务等领域中增强它。
当今的商业化集中在-53B上。官方网站显示,该模型的API检索采用了分摊收费标准。从0:00到8:00,费用为0.01元/公里,从8:00到24:00,费用为0.02元/公里。相比之下,白天的充电价格高于晚上。
(照片来源:智能官方网站)
结束
在大型模型发展的早期阶段,谁是中国的问题不是很有意义。 Zhipu AI和 等许多初创公司都意识到,盲目追随者并不适合。例如,Zhipu AI阐明了“不做中文GPT”的技术道路。此外,在开源趋势并形成包围的时候,其绝对技术优势似乎并不是无法破坏的。
Zhipu AI和智能曾提到,超级应用是中国大规模企业的更广阔的市场和舒适区,不再留下来。例如,一个接近Zhipu AI的人曾经向媒体透露,Zhipu AI团队已经牢固地遵守了2B路线,该路线针对信息和创新市场,在5个月内,它已迅速将其团队从200个扩大到500,认为随后的2B业务将为人力提供支持。
在商业化路径上, 选择了参考开源生态系统,并且也开始了小步骤的迭代。
从肉眼可以看出,在短短半年内, 和Zhipu AI已经通过了No-Man的土地,并进入了商业化的工业实施阶段。与AI1.0的企业家繁荣相比,技术抛光期持续了3年(2016-2019),这正是由于商业实施的障碍,大量AI公司在2022年共同下降,并在黎明之前下降。
从上一个阶段中学到的经验教训也是由于大型技术技术的多功能性,它更方便地实施。 和Zhipu AI代表的初创公司正准备为下一阶段的技术,产品和才能做准备。
但是,还为时过早,听到马拉松比赛中的第一个枪声。但是,至少赛道的第一阶段已经被分解了,在目标明确之后,竞争更加耐心和毅力。 ,Zhipu AI或IT也是如此。
本文来自由36KR出版的公共帐户,作者:Hao Xin。