文章介绍
激烈竞争的大模型领域惹争议。
5 月 16 日上午,有消息称,华为昇腾在近期一场发布会上展示大模型文生图能力时,演示过程中出现 Time.sleep(6) 代码。业内人士认为,这一代码意味着“人为控制从输入到输出,过程需要 6 秒钟”,有人怀疑其图文结果并非大模型生成,而是人为操控,认为该发布会演示“翻车”了。
面对争议,昇腾社区回应称,5 月 10 日,我们在鲲鹏昇腾开发者大会的技术讨论会上演示了 mxRAG SDK 功能。本次演示面向开发者,展示如何通过十几行代码即可完成 RAG 应用开发。现场图片为实时生成,调用的是开源大模型。代码中的 Time.sleep(6) 等表述是命令等待读取外部开源大模型实时生成的图片,并非调用预置图片。
昇腾回应大模型演示“翻车”
5 月 16 日,针对网传发布会演示造假一事,昇腾社区正式回应。昇腾表示,5 月 10 日,我们在鲲鹏昇腾开发者大会的技术讨论会上,演示了 mxRAG SDK 功能。本次演示面向开发者,展示如何通过十几行代码即可完成 RAG 应用开发。现场图片为实时生成,调用的是开源大模型。代码中的 Time.sleep(6) 等表述,是命令等待读取外部开源大模型实时生成的图片,并非调用预置图片。“本次展示的均为真实代码,也将在昇腾社区上开放,欢迎开发者使用并提出宝贵建议。”
昇腾社区官网信息显示:5 月 10 日,以“一起昇腾,逐梦未来”为主题的昇腾 AI 开发者峰会在北京举行。会上,华为昇腾计算业务总裁张迪煊发表《一起昇腾,逐梦未来》主题演讲。
昇腾是华为旗下的人工智能计算芯片。
据昇腾社区官方介绍,昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI 计算基础设施、行业应用及服务,包括昇腾系列处理器、系列硬件、CANN(Compute Architecture for Neural Networks,异构计算架构)、AI 计算框架、应用使能、开发工具链、管理运维工具,行业应用及服务等全产业链。
大模型百花齐放
在激烈行业竞争之下,国内外厂商不断推出新的大模型以及对原有大模型进行迭代。例如,5 月 15 日,字节跳动正式发布“豆包大模型”,这也是国内又一家互联网巨头发布的自研大语言模型。性能方面,据字节跳动有关负责人介绍,豆包大模型目前日均处理 1200 亿 Tokens(表示和传递信息的标识符)文本,生成 3000 万张图片。5 月 9 日,阿里云正式发布通义千问 2.5。相比上一版本,2.5 版模型的理解能力、逻辑推理、指令遵循、代码能力分别提升 9%、16%、19%、10%。据介绍,在中文语境下,通义千问 2.5 在文本理解、文本生成、知识问答、生活建议、闲聊、对话、安全风险等多项能力赶超 GPT-4。
国外厂商:
5月15日凌晨,谷歌在2024年I/O开发者大会上发布多项产品更新,包括Gemini 1.5 Flash轻量化模型、Project Astra通用智能体、强大的AI搜索功能、视频生成模型Veo以及第六代TPU Trillium。值得注意的是,Gemini 1.5 Pro的上下文窗口已从100万token升级至200万token。
5月14日,美国OpenAI公司发布了其最新多模态大模型GPT-4o,与GPT-4 Trubo相比,其速度更快,价格更低。其显著特点在于与人交互更加自然。
据OpenAI表示,GPT-4o能够检测人类情绪, 并按照人类或机器人的语调与用户交流。它能够在最快232毫秒内响应音频输入,平均响应时间为320毫秒,接近人类对话中的响应时间。
国内外市场分析:
根据华泰证券的研究报告,AI大模型的商业模式和竞争格局可能形成赢者通吃或国内外寡头竞争的局面。行业大模型有望百花齐放。目前,“基础大模型”到“行业大模型”再到“终端应用”的大模型路线十分清晰。由于训练基础大模型的高昂成本和高技术壁垒,科技巨头将成为主要的参与者。

