10年了，这是中国科技圈最卷的一周！实时焦点

您的位置：首页 >财经 > 滚动 >

10年了，这是中国科技圈最卷的一周！实时焦点

来源：华尔街见闻 2023-04-16 12:52:30

几年之后再回首，人们可能会意识到，这个平平无奇的四月第三周，可能是中国 AI 史上的一个重要节点。

因为在这周，阿里、腾讯、字节、商汤、360 等互联网大厂，纷纷「祭出」自己的 AI 大语言模型及产品——「整个晋西北都乱成一锅粥了」。

自从几年前的「买菜大战」之后，中国互联网行业第一次这么热闹。

(资料图)

大概每一次历史潮流的开场，总是这么熙熙攘攘，令人猝不及防。

王小川开搞大模型，杠上老冤家

周一，王小川宣布创建百川智能，启动资金 500 万美元，正式投入到了中国大模型建设的大军中，不少成员是在搜狗时的老伙伴。

他在媒体交流会中透露，公司已经开始训练 500 亿参数的大模型，年底前预计发布对标 GPT-3.5 的大模型。

「大家好像忘了，搜索也是一个人工智能的产品。」从搜狗一路走过来，王小川成为了国内大模型创业圈里炙手可热的人物。

要说他现在最着急什么，留在他公开信后的一长串招聘邮箱也许能说明问题，那就是人才！人才！

当然，这周最热闹的吃瓜现场，还要属王小川和百度互怼。

百度李彦宏：文心一言确实不如现在最好的 ChatGPT 版本，但差距也不是很大，可能就是一两个月的差别。
王小川：李彦宏生活在平行宇宙，文心一格与 ChatGPT 的差距绝对不是一两个月，而是三年。
百度副总肖阳：王小川脱离一线太久，和百度不在一个宇宙，对国内人工智能技术的发展缺乏了解。当年搜狗也立志取代百度搜索，结果也是显而易见的。
王小川：什么样的平行宇宙里，才能做到让一个脱离一线 15 年的人，去怼一个脱离一线 1.5 年的人。

现在王小重新创业，跟百度大厂的身份不一样了。

李彦宏说，大厂开始聚焦后，创业公司的机会便很少了，建议创业公司不要重复制造轮子。王小川则认为创业公司不会受固有业务限制，会比大公司跑得快。

看 NBA 的同学都知道，开场前双方队员来点「垃圾话」是惯例动作，没有才会令人奇怪。

真身离开一线多久不重要，重要的是，心要永远在前线上。

「通义千问」，全面改造阿里，钉钉打头阵

同一天，阿里正式推出大模型产品「通义千问」。这是阿里云大模型系列中的最新成员，既可以做多轮对话，也能做文生图等跨文字、图像等方面的应用，并能够和外部 API 进行互联。

这也是张勇在兼任阿里云智能集团 CEO 后，第一次在阿里云峰会带队露面，足见此次活动的意义。

张勇说，「面向 AI 时代，所有产品都值得用大模型重新升级。」首先接受改造的，是阿里自己的产品。

阿里宣布未来会将所有的业务都接入「通义千问」。首先接入「通义千问」的业务，是协同办公钉钉，以及智能音箱天猫精灵。

钉钉接入通义千问后，已经可以自动生成工作方案，也可以在会议纪要后自动生成总结和待办事项。还有一些低代码方面的尝试，比如用户拍一张功能草图，能自动生成一个小程序。

不久前，阿里宣布将集团分拆成六大集团，所有业务接入，可见阿里决心之大。

阿里云未来还将推出「企业专属大模型」、「行业专属大模型」产品，在正式发布前，已经定向邀约企业客户开始内测，首批企业客户包括 OPPO、吉利汽车等。

「通义千问是既定路线中的一个节点，不是起点，也不是终点。」阿里云 CTO 周靖人如此定性通义千问。

当国内云计算市场开始增速放缓时，AI 大语言模型之战，重新「激活」了阿里云。

腾讯，要来「硬」的

本周五，腾讯云发布新一代 HCC（High-Performance Computing Cluster）高性能大模型计算集群，采用腾讯云星星海自研服务器，搭载英伟达最新代次 H800 GPU，服务器之间采用业界最高的 3.2T 超高互联带宽，号称是国内性能最强。

人工智能大模型训练，离不开高性能的算力集群。此前腾讯万亿参数的混元 NLP 大模型已经完成训练，基于上一代高性能算力集群，腾讯将自己大模型的训练时间，从 50 天缩短到 11 天。实测显示，新一代集群的算力性能较前代提升高达 3 倍。这也意味着如果基于此次发布的新一代集群，训练时间将进一步缩短至 4 天。

随着国内外厂商加速布局千亿级参数量的大模型，训练需求和推理需求也进一步增长。

模型再厉害，还是需要算力作为基础能力，相比于前几家，腾讯云走的低调，但有着深圳人「一心搞钱」的务实。