很快,陈凯就来到了魔都,和苏阳会面。
“苏总,我昨天看了你的招聘视频。”陈凯放下包,开门见山,“一亿年薪,世界第一。我想知道你凭什么说能做到。”
苏阳没有立刻回答。他起身走到办公桌旁,拿起一个银色的U盘,回到沙发边,把U盘放在茶几上,推到陈凯面前。
“这里面是盘古大模型的技术架构概要。不是PPT,不是概念,是可落地的工程方案。你先看。看完再决定要不要聊下去。”
陈凯看着那个小小的U盘,犹豫了一秒,然后拿起它,插进了自己的笔记本电脑。
文件打开。第一页:模型架构——混合专家模型,总参数量两万亿,激活参数量三千亿,上下文长度一百万字。
他的手指顿住了。两万亿参数。目前公开的全球最大模型,参数量也不过一万亿出头。而盘古直接翻倍。更关键的是那个“激活参数量”——这意味着模型虽然庞大,但每次推理只调用部分参数,既保证能力,又控制成本。
他的目光往下扫。推理速度:比现有主流模型快十倍。训练成本:行业平均水平的二十分之一。陈凯的呼吸开始变得急促。
第二页:核心技术——独创的稀疏注意力机制,长文本处理效率提升两个数量级;自研分布式训练框架,万卡集群线性加速;知识截止日期为最新,支持持续更新。
陈凯摘下眼镜,揉了揉眼睛,又重新戴上。这些东西,有些是他和团队在千问尝试过但没做成的,有些是他只在学术论文里见过、从未在工程上实现的,有些甚至是他想都没想过的。
第三页:应用场景。第四页:商业模式。第五页:……
陈凯一页一页地翻,翻到最后一页时,他的手在微微发抖。他抬起头,看着苏阳。苏阳正端着茶杯,不紧不慢地喝着,像在看一场已经知道结局的电影。
“苏总,这些技术方案……是谁做的?”陈凯的声音有些发涩。
苏阳放下茶杯,语气平静:“你不用管谁做的。你只需要回答我——你能不能把它做出来?”
陈凯沉默了很久。他想起在千问的那些日子,每次提出新的技术方案,都要被产品部门质疑“这能赚钱吗”,被管理层质问“竞争对手有没有做”,被财务部门驳回“预算超了”。技术理想在资本面前,一次次退让,一次次妥协。而眼前这个人,给他看了一份足以颠覆整个行业的技术方案,然后问他——你能不能把它做出来。
没有问成本
本章未完,请点击下一页继续阅读!