每经编辑 张锦河
开栏语:《AIGC行业周报》梳理AIGC行业一周内发生的行业重要动态,产品发布和业内大咖的周报最新观点。
图片来源:每经制图
(一)AI独角兽集体求卖身,周报大模型领域新一轮洗牌期到来
近期,行业多家AI领域的周报汽车之家明星初创公司如Adept、Humane AI、行业Reka AI和Stability AI等纷纷寻求收购或合并,周报显示出AI大模型行业正在进入一个新的行业洗牌期。这些公司面临成本压力、周报商业模式不明确和市场竞争等问题,行业部分公司因产品市场反响不佳、周报资金短缺或对未来商业模式的行业不确定性而急于寻找买家。同时,周报科技巨头也在积极收购AI技术、行业人才和资源,以加强自身在AI领域的竞争力。这一现象反映出AI行业正在经历从快速增长到整合资源、聚焦商业模式的转变,同时也暗示了AI初创企业在实现商业成功方面需要探索更多可能性。
(二)普华永道与OpenAI合作,为其10万员工部署ChatGPT企业版
5月30日,全球四大会计事务所之一的普华永道(PwC)在官网宣布,与OpenAI达成技术、天眼查市场双向合作,成为其最大客户和首家产品经销商。根据合作协议,普华永道将为美国75,000名员工和英国26,000名员工提供ChatGPT Enterprise服务。此举标志着生成式AI在普华永道的实际业务用例中从试验阶段转向具体场景落地,普华永道已确定3,000多个业务用例,旨在通过AI技术提高效率和降低成本。此外,普华永道还将利用OpenAI最新发布的多模态模型GPT-4o,并结合自身内部数据对GPT系列模型进行微调,创建定制化的AI助手,以支持员工在财务审计、税务审查、代码开发和报告生成等方面的工作。普华永道的全球业务网络也使其成为OpenAI产品的重要销售渠道,目前已与美国950家企业客户就加速部署生成式AI展开沟通。此合作同时也兑现了普华永道在生成式AI领域投资10亿美元的承诺,并预期将提升公司在行业中的竞争力和业务执行效率。
(三)英伟达进军云服务市场,DGX Cloud成战略重点
上周,英伟达(Nvidia)宣布了未来几年内向云计算领域投入近90亿美元的计划,这一数字较1月份的承诺增长了近两倍。英伟达的虎扑DGX Cloud服务旨在为用户提供易于访问的高性能计算资源,特别是为深度学习和AI应用设计。这项服务基于Nvidia的DGX系列超级计算机,用户可以在云端租用这些资源而无需自行购买和维护昂贵的硬件。DGX Cloud还使Nvidia能够租用亚马逊、微软、谷歌和甲骨文等云提供商的GPU服务器,再转租给客户,这可能改变Nvidia与其最大客户间的关系。英伟达此举意在减少客户对AWS、Google Cloud或Microsoft Azure等云服务提供商的依赖,同时也为其自身在云服务市场中建立起直接的竞争地位。
(一)百度推动智能体普及,开拓AI应用新场景
5月30日,百度在移动生态万象大会上展示了其在大模型竞赛中的新动向,重点发布和升级了包括百度搜索、文心一言App、百度文库、文心智能体平台等产品。百度致力于降低大模型使用门槛,推动智能体技术的普及,使其成为提高生产力的工具。百度智能体平台支持简易开发,提供流量优势,并已经吸引了众多开发者和企业入驻,覆盖了广泛的应用场景。百度的策略不仅着眼于打造自己的AI应用生态,同时也为行业提供基础设施和标准化路径,旨在通过AI技术解决用户的实际需求,并创造AI时代的超级应用,推动公司核心搜索业务和云服务的发展。
(二)速度秒杀GPT-4o!Mistral AI开源首个22B代码模型破记录
近日,欧洲的Mistral公司推出了名为Codestral的开源编程大模型,它以22B参数量在性能上超越了70B参数的Code Llama。Codestral支持80多种编程语言,并实现了32k的上下文窗口长度,大幅提高了处理能力。它在多项编程语言测试中取得了优异成绩,特别是在Python代码生成和SQL的Spider测试中表现突出。此外,Codestral还支持代码填充补全功能,并已集成到多个大模型框架和开发者平台中。尽管模型性能卓越,但Mistral发布的Codestral仅可用于非商业用途,遵循严格的“非生产”许可协议(MNPL),这一限制引发了一些开源社区成员的不满。
(三)腾讯元宝AI助手上线,开启公众号内容新生态
5月30日,备受期待的腾讯元宝于正式上线,并以其出色的AI搜索功能受到关注。该产品能够访问高质量的微信公众号内容作为信息源,显著提升了AI搜索的回答质量。作者通过亲身体验发现,腾讯元宝在处理最新问题时,能够综合多个来源,尤其是公众号文章,给出全面且高质量的回答。此外,元宝还具备文档总结、翻译、图片识别等多种功能,并支持多文档和链接阅读,显示出腾讯在AI领域的野心和实力。作者对元宝的未来及其对公众号生态的潜在正面影响抱有极大期待。
(四)SEAL大模型排行榜发布,Claude 3 Opus数学领域夺冠
5月30日,由27岁华裔创始人Alexandr Wang领导的Scale AI推出了全新的大型语言模型(LLM)排行榜——SEAL。这个排行榜以其私有数据、专家评估和持续更新的特点迅速获得AI界的认可。SEAL排行榜强调公正性、高质量和可信度,定期引入新的数据集和模型以保持动态竞争环境。在最新发布的排行榜中,Claude 3 Opus在数学分类榜中超越了GPT-4 Turbo Preview,夺得第一名,显示了其在数学和推理领域的卓越能力。此外,Scale AI还设计了新的数学和推理数据集GSM1k,旨在全面评估模型的各方面能力,避免过拟合问题。业界专家如Jim Fan和Andrej Karpathy对SEAL排行榜的发布表示肯定,认为它是对现有评估体系的重要补充。
(五)浪潮信息发布源2.0-M32大模型,性能对标Llama 3,算力消耗大幅降低
5月28日,浪潮信息最近发布了一款全新的基于MoE(Mixture of Experts)的源2.0-M32开源大模型,该模型不仅全面开源且支持免费商用,而且在模型性能上能够与700亿参数规模的Llama 3相媲美。源2.0-M32拥有400亿参数量和37亿激活参数,其在训练、微调和推理过程中的算力开销显著低于Llama3-70B,具体来说,源2.0-M32单Token下训练和推理所需的算力资源仅为Llama3-70B的1/19。这一技术进步得益于浪潮信息在算法结构、数据获取和算力方面的创新,包括引入基于注意力机制的门控网络技术和局部注意力过滤增强机制(LFA),以及在数据层面的训练Token数量的显著提升和流水并行的方法。浪潮信息的这一创新为企业提供了一个更为经济、高效的大模型落地方案,进一步推动了大模型在各行各业的应用普及。
(一)OpenAI研究员解析语言模型评估的重要性与挑战
近日,OpenAI研究员Jason Wei在其最新博客文章中强调了语言模型(LLM)评估的重要性,并探讨了成功评估应具备的因素。他指出评估基准是研究社区的直接激励,与模型性能的重大突破密切相关。文章总结了评估在NLP社区获得关注所面临的“七宗罪”,并讨论了如何创建和推广有效的评估测试。Wei还分享了他对评估基准的个人见解,包括成功评估的特质、推广新评估的策略,以及评估基准在LLM领域中如何流行起来的原因。
(二)中国AI创业者对行业前景的看法:差距、挑战与新机遇
在第四届BEYOND国际科技创新博览会的“AI Panel”圆桌对话中,澳门科技总会会长贺建东、商汤科技联合创始人徐冰、科大讯飞董事长刘庆峰和壁仞科技创始人张文就中美AI领域的优势、AI发展的合理边界及创业机遇进行了深入讨论。徐冰认为中美之间在算力上存在约10倍的差距,但这一差距可通过资金投入弥补。张文则表示,未来创业可能不再选择AI领域,而是转向餐饮业,以避免潜在的美国制裁。刘庆峰指出,中国的大公司在市场中的主导地位对中小企业创新不利,呼吁建立更良性的生态。三位企业家还就AI发展阶段、未来影响以及创业时机等问题分享了各自的看法,普遍认为AI发展是一个长期过程,需要法律、伦理和人文的协同推动,并强调了跨学科结合AI的创新潜力。
(三)国内大模型价格战:创新与市场竞争的较量
近期,国内大模型领域爆发价格战,以字节跳动、阿里云、百度、腾讯云和科大讯飞为代表的科技巨头纷纷大幅降低大模型服务价格,甚至推出免费版本,以吸引开发者和市场关注。这场价格战背后,实际上是中美科技企业在AI大模型竞赛中选择了不同的发展路径:美国企业更注重技术创新,而中国企业则更倾向于通过价格竞争来快速占领市场。尽管降价策略短期内对开发者有利,但业内人士提醒,开发者在选择大模型时应关注模型能力与应用场景的匹配,避免因贪图便宜而增加创业成本。同时,降价更多被视为一种营销手段,旨在吸引开发者加入,为大模型生态注入数据和用云量,推动整个AI应用生态的繁荣。
(四)孙茂松教授展望大模型技术未来:竞争、创新与挑战
近期,在北大光华和度小满联合推出的大模型公开课上,清华大学人工智能研究院常务副院长孙茂松教授发表了题为“生成式人工智能及大模型对科技、文化和教育的影响”的演讲。孙教授认为,AI将推动技术创新的变革,但信任风险和安全管理也将成为重要议题。他预测,到2026年,超过80%的企业将使用生成式AI,而目前这一比例不足5%。孙教授强调,大模型技术将深刻影响教育模式,但也可能带来“幻觉现象”,需要认真对待和防范。他还提到,尽管中国在大模型的数量上位列第二,与美国相比仍有较大差距,中国需提升大模型的能力,并在未来三年内在垂直领域开发出有影响力的技术和产品。最后,孙教授鼓励企业和研究者探索大模型在垂直领域的应用,形成独特竞争优势,并提醒终身学习的重要性,以应对AI带来的挑战。
来源:每经科技提供