张思鹏:智谱AI张鹏:做实正凶猛的工作 | AI·20人

张思鹏:智谱AI张鹏:做实正凶猛的工作 | AI·20人

经济察看报 记者 钱玉娟固然在公家视线里其实不算出名,但成立于2019年的智谱AI很早就起头投身大模子手艺研发,在ChatGPT火遍大江南北之前,那家公司已经在国内大模子研发范畴相当出名了张思鹏。本年6月,硅谷科技媒体TheInforma-tion对正在“百模大战”形态的中国市场加以清点,评出了“最有可能成为‘中国OpenAI’的5家企业”,智谱AI位列此中。

智谱AI在“百模大战”中成为镁光灯下的焦点,是在本年10月20日张思鹏。当它初次对外发出“年内获得超25亿人民币融资”的动静时,外界才发现,那家公司的估值已悄悄超越百亿人民币。

它凭仗什么成为本钱的“宠儿”张思鹏,并拿下国内AI(人工智能)大模子立异范畴的更高估值?

手艺基因

智谱AI的核心团队次要从清华大学 KEG(常识工程)尝试室走出张思鹏。智谱AI董事长刘德兵师从中国计算机行业专家、中国工程院院士高文;CEO(首席施行官)张鹏和总裁王绍兰则同为清华立异领军工程博士。此外,他们三人也都是KEG尝试室的核心成员,率领团队从尝试室走到市场,完成了“产学研”的第一步。

张鹏称,公司成立以前,团队在学校尝试室做的一件事就是“科技谍报阐发”,次要是操纵人工智能的办法,包罗数据发掘、语义阐发、机器进修、算法等常识工程下面的分收手艺,去发掘天然科学或手艺开展的客不雅规律张思鹏。

“一旦掌握了那个客不雅规律,人们即可以‘预测将来’张思鹏。”张鹏说,与早期没有太多科学办法,预测规划可能“拍脑袋决定”差别,他所在的尝试室团队会基于数据和阐发手艺,立异设想和研发了国内首个中英文平衡的跨语言常识图谱系统XLORE,还推出了AMiner系统。

在尔后长达十年的时间里,他们不断积极地通过财产的现实项目停止着手艺功效工程化落地应用的试探和探路张思鹏。

张鹏说,智谱AI成立时就有个愿景目的,“将来让机器像人一样思虑”,也有一个勤奋超越的目的对象,“对标OpenAI(开放人工智能研究中心)”张思鹏。其时仍是2019年,除了人工智能圈内,没有人晓得OpenAI是谁。

现实上,早期OpenAI的语言模子预训练框架GPT,优势其实不明显张思鹏。转折点发作在2020年6月,OpenAI发布了GPT-3,正逢周年庆的智谱AI,意识到了GPT模子的才能已发作越级式提拔。

在那时,张鹏团队选择全数投入到超大规模参数大模子张思鹏。不外,他们选择了与OpenAI差别的途径,将GPT那类单向向后预测的模子框架,与谷歌的BERT那类双向预测的模子框架的才能加以连系,那套预训练框架被定名为GLM,即通用语言模子。

抱负主义

模子立异是一个经年累月的过程张思鹏。在开展标的目的确定后,智谱AI用时一年,于2021年推出了自研的GLM百亿参数模子,其时国内鲜少有人晓得那一立异的意义所在。

次年7月,陪伴千亿级超大规模预训练模子GLM-130B的降生,智谱AI还基于那一千亿基座模子,起头了贸易化规划,打造了大模子MaaS(模子即办事)平台及AIGC(生成式人工智能)产物矩阵张思鹏。

那一年,斯坦福大学根底模子研究中心对包罗ChatGPT相关的InstructGPT模子等在内的全球范畴内将近30个大模子停止综合评定后生成了一个榜单,此中智谱AI的GLM-130B成为独一登榜的中国基座模子张思鹏。

提早看到趋向,使得智谱AI团队“一步早,步步早”张思鹏。各家大模子厂商根本在2023年年中纷繁鞭策模子开源,并论及生态问题,智谱AI则提早了一年时间。

2022年8月,智谱AI不只在GitHub(面向开源及私有软件项目标托管平台)上开源了GLM-130B,还发力模子开源生态建立张思鹏。2023年3月,在推出千亿基座的对话模子ChatGLM后,智谱AI面向研究者和小我开发者,继续开源62亿参数的单卡版模子 ChatGLM-6B。截至发稿前,ChatGLM-6B系列模子在开源社区的下载量已打破万万。

很多人描述2023年AI大模子范畴像是一场“军备竞赛”,科技范畴的巨头与创业团队,重金囤卡,投身此中,从模子立异到训练优化,智谱AI在此中自不会落后张思鹏。不到半年时间,ChatGLM从第二代进化至第三代。

开源生态的深切构建,以及手艺才能上与国际顶尖模子“掰手腕”,都让智谱AI在圈内愈发火爆张思鹏。在开发者承认之外,也吸引了美团、阿里、腾讯、顺为、红杉、高瓴等投资人看好,那也使得智谱AI成为了国内第一家估值破百亿的大模子创业公司。

智谱AI不断对峙算法等手艺自主研发及立异应用张思鹏。不外,“素质上来说,还没有分开Transformer那个模子系统的底座和根底”,张鹏说他如今有一个等待,智谱AI可以往下且深切地撼动当前模子框架的研究手艺,“做实正凶猛的工作”。

|对话|

立异背后

经济察看报:在2019年创建伊始,智谱AI就确定“对标OpenAI”张思鹏。智谱AI是若何提早看见趋向的?

张鹏:那是因为我们比力早地发现了人工智能手艺开展的规律张思鹏。其时我们察看到的一大趋向是,上一代人工智能手艺的研究已经根本趋平,那就像一条S曲线,增长之后,碰着天花板便会放缓。

人脸识别、图像识别等AI立异之后,下一代手艺是什么?我们想找到将来3至5年内会再呈现新的增长曲线张思鹏。其时我们发现,深度进修带起了第一波AI海潮,由此产生了像图神经收集等手艺办法后,又有了预训练如许一个十分通用且能获得比力好效果的下一代手艺。

能够看到,2017年Trans-former被提出来之后,2018年时,海外便呈现了谷歌的BERT以及OpenAI的GPT等立异张思鹏。其时,预训练等相关手艺在学术界开展速度飞快,工业界固然相对迟缓,还未觉得到变革,但手艺效应已经能印证,一个拐点即将到来。

那时,我们根本上也能够判断,人工智能手艺曲线已经进入了一个新的上升期张思鹏。其时是2018年后,在阿谁阶段我们在察看国际上做预训练相关工做的机构、团队的研究动做时,OpenAI进入了我们的视野。

OpenAI并非从第一天起头就在做大模子那件工作,我们同样也是如斯张思鹏。从最后研究预训练框架立异到后来坚决投入且专注于通用模子开发。别的,我们也较早地规划了AI产物矩阵,比OpenAI晚不了几,那让我们在贸易化标的目的上也有类似之处。

经济察看报:从研究者到企业家张思鹏,你若何适应角色的切换?

张鹏:我们开创团队里面的几小我绝大部门都是手艺工程师身世,能够必定地说,我们的语言系统和思维逻辑都比力接近张思鹏。别的也有一些具备丰硕市场经历的“队友”,所以,智谱AI现实上是一个团队一路来参议并造定一些战略。

别的,我们在学校里时,也并非单纯做研究张思鹏。我们的KEG尝试室开创人王克宏传授,从成立之初就跟我们说,要做“互联网情况下的大数据常识工程”,1996年时,那一理念极具前瞻性,王传授觉得互联网那件事是将来必然要做的,而有了互联网之后,此中的数据、常识等若何应用,则成为我们要做的事。

其时国内还没有几人晓得“常识工程”那个词的定义张思鹏。但王传授认为单纯做理论研究、不做工程,那件工作是没有将来的。他其时给尝试室的所有学生提了一个词“P2P”,他的解释是“PapertoProject”(从论文到项目),也就是必然要工程化手艺的功效。

所以,我们那个尝试室很有特点,不但做研究,还得做工程,要让研究落地张思鹏。那也培养了整个尝试室的气概:一帮工程师边做研究,边去拼命地做工程,把手艺应用到用户的需求场景里面去。

也正因如斯,我们那个团队走出来,去做公司的过程十分天然,转换也不是一夜之间的突变,是一个渐渐领会和扩增的过程,更是适应贸易逻辑和规则后,渐渐改变的过程,量变引起了量变张思鹏。

经济察看报:智谱AI在大模子研发的过程中张思鹏,碰到过哪些难题和焦虑?

张鹏:哪有不难的工作张思鹏。正因为难,才会有价值,凡是都是如许。

所有的人工智能手艺立异,城市在数据、算力、算法三大方面存在着各类挑战张思鹏。数据自不消多说,各人都在统一个起跑线上,难是一样的。算力次要是资本有限,那么多团队在做大模子那件事,原来有限的资本就会被分摊。

当你想要去打破那个天花板,持续往上做未知范畴或前沿手艺拓展的时候,就会发现,资本供应会变得越来越难张思鹏。

早期的一些模子,城市用到像英伟达的A100、A800之类的芯片做推理,那个工具如今有多贵,各人都晓得张思鹏。就算不买,租一台如许的高端办事器,也只能同时办事并发的几个或十几个用户的拜候。

为降低成本,我们在不竭提拔推理效率的同时,也通过与国产芯片厂商合做,用更廉价的算力、消费级的卡做推理张思鹏。如许,价格差别就会表现出来,当前“降本”的前提是办事量量不下降,用户体验上是更好的“提效”。

相较来说,算法立异,不断是我们对峙自主研究的标的目的张思鹏。

模子共识

经济察看报:目前AI财产开展有共识吗张思鹏?

张鹏:围绕大模子,各人关心的问题仍然良多,但令我感到比力深的一点是,各人关于大模子,根本已经没有量疑张思鹏。

生成式AI在国内实正炽热起来,是从本年3月份起头,到如今过去了也就大半年时间张思鹏。那么大的一个笼盖范畴,近乎现象级的手艺立异,在那么短的时间里,就让各人构成了一个共识,那让我觉得是很罕见的一件工作。

我说的那个是宏不雅角度的大共识,大语言模子或者说大模子那件工作,它必然是一个趋向张思鹏。出格是从人工智能开展的角度来说,在将来的一个时间段里,大模子立异必然是“准确”的。它是一个我们想要到达鞭策手艺开展和实现AI涌现的目的的有效办法。

经济察看报:共识之下有不合吗张思鹏?

张鹏:没有一条路是轻松的,尤其是那种变化性、打破性的事张思鹏。

各人之所以达成共识,前提是各人底子找不着别的一条路,目前看起来,那条路是独一或相对来说更有可能走下去的标的目的张思鹏。

要说难,算法、数据、算力,每一个都很难,以至在那三个维度之外,还有AI治理,涉及手艺的平安伦理等一系列社会问题等需要研究张思鹏。

有意思的点在于,你会发现,各人在对大模子构成共识的根底上,还会纷繁从各自的角度去对待那件工作,奉献本身的力量、聪慧,去处理相关一些问题张思鹏。

经济察看报:在百模大战中张思鹏,你认为智谱AI处于什么位置?

张鹏:起首在手艺上,从第三代基座大模子ChatGLM3的一些新停顿来说,我们有比力强的自信心张思鹏。

别的从贸易化的角度,我们也是国内最早提出贸易化落地途径的企业,从一起头就在做ToB(面向企业)和ToG(面向政府)的一些办事,大部门的客户都是上述机构类型张思鹏。对我们来讲,贸易化不是一个选择,是生成的基因里就带着的工具。

手艺立异的路受骗然会有一些参照,好比说比照OpenAI的途径,智谱AI在向世界最顶尖程度进修之余也测验考试超越,在与海外优势手艺才能“掰手腕”的同时,也连系当前国内市场和贸易情况的特点来做交融立异张思鹏。

那是一个不竭积累、不竭量变的过程张思鹏。

经济察看报:若何对待AI财产的将来张思鹏?

张鹏:中国市场有如许一个特点,业态的变革会十分猛烈与快速张思鹏。

AI行业需要时间开展,从现阶段的行业动态看,就任它纷繁扰扰吧张思鹏。我们有本身的目的,“让机器像人一样思虑”,也有本身的对标参照。开展过程中,做为一家贸易公司,智谱AI可能需要停止良多的战略调整,但那个调整绝对不包罗我们的次要目的和标的目的,在那一点上我们是很明白的、坚决不移的。

我不断跟团队讲,要有一种战略上的定力和一种战术上的灵敏性,那种连系才气很好地应对市场的各类变革张思鹏。

发布于 2023-12-11 17:15:37
分享
海报
17
上一篇:张予曦到底有多美?当她穿长袜秀“A型腿”,难怪王思聪会爱上她:张思鹏 下一篇:张思鹏:记者问张庆鹏:若何点评跌宕起伏又不测的角逐?张指:差别意你说不测
目录

    推荐阅读

    忘记密码?

    图形验证码