上海积极布局人工智能“三要素”,推动大模型成果赋能各行各业
0次浏览 发布时间:2025-05-01 06:31:00


人工智能发展由算力、算法和数据三要素驱动,如果把人工智能比作火箭,那么算力就是引擎,算法是导航系统,数据则是燃料。近年来,上海在这三要素领域积极探索,取得了一系列进展和成果,并通过研究制定《关于人工智能“模塑申城”的实施方案》等政策,持续推进“人工智能+”,让大模型等研发成果应用于越来越多的行业。
在科学研究领域,“人工智能+”也具有重要价值。2023年1月,《自然》杂志刊登了一篇封面论文,对过去70年间多个学科的论文平均影响力做了系统性分析。研究显示,尽管全球科研论文的发表数量和专利数量持续增长,其实际影响力却在快速下降。上海人工智能实验室主任、首席科学家周伯文分析说,这并不意味着科学家的能力和素质不如前辈,而是因为各个学科大厦经过100多年的修建,越来越完善。人工智能近年来的技术突破,给科学革命带来了利器。
为AI提供国产算力和数据
无问芯穹是在“模速空间”向习近平总书记作重点汇报的一家企业,创始团队由清华大学电子工程系推动成立,成员来自清华大学、上海交通大学、中国科学院等单位。与人们印象中的人工智能企业不同,无问芯穹的研发和业务聚焦算力。“我们公司以‘释放无穹算力,让AGI(通用人工智能)触手可及’为使命,致力于通过不断的技术创新实现普惠AI,让算力成本实现万倍下降,如同水电煤那样为千行百业注入新质生产力。”无问芯穹首席执行官夏立雪说。
近年来,人工智能算力市场上,英伟达芯片的市占率居高不下。虽然在许多应用场景里,国产芯片也能完成任务,但囿于国际主流芯片的基础软件生态壁垒,通常难以被优先使用。此外,国产算力间生态互不相通,异构芯片间难协同提供算力,并存在算力资源持有方分散化、地域分布不均衡等问题。
针对这些问题,无问芯穹在市、区政府支持下构建了一朵“异构云”,在行业内首次实现多种大模型算法在多种异构芯片上的高效协同部署和运行,降低了业内对单一国际芯片品牌的依赖;首创跨机房训练技术,提升零散算力资源可用性,实现了高价值数据资源本地处理;打通异属算力资源高效调度,解决了算力需求动态预测与调度问题,助力算力资源与下游产业协同发展。
无问芯穹突破性地实现6种不同品牌芯片间的交叉混合训练,用华为昇腾、天数智芯、沐曦、摩尔线程等4种国产芯片分别与英伟达、超威半导体芯片进行联合训练,算力利用率最高可达97.6%,能支持700亿参数规模的大模型训练。

入驻“模速空间”的无问芯穹公司
在数据这一人工智能驱动要素上,政府作为体现得也很明显。去年3月,全国首家人工智能语料公司库帕思在上海成立。这个大模型语料“超级工厂”承接语料标注加工的“累活”和“精细活”,旨在让大模型公司省心。
去年7月,库帕思携手大模型语料生态伙伴,发布了一批大模型语料成果,包括语料运营平台1.0、首批十大高质量语料产品等。这家企业还携手咪咕视频、宝信软件、复旦大学智能医学研究院等单位发布了十大语料数据产品,加速医疗健康、城市交通、消费零售、金融等重点行业的大模型产业发展。
多项大模型成果今年发布
在算力和数据的支撑下,上海企业已开发出多款具有国际影响力的大模型产品。
商汤今年4月发布的“日日新V6”大模型体系,在长思维链、推理、数理、全局记忆方面拥有显著优势,多模态推理能力处于国内领先水平,数据分析能力领先GPT-4o。它可以提供超过200B的高质量多模态长思维链数据,并凭借全局记忆,率先在国内突破了长视频理解技术,可支持10分钟的视频理解和深度推理。

商汤发布“日日新V6”大模型体系。
也是今年4月,稀宇极智迎来“高光时刻”:国家超算互联网平台宣布上线这家企业开发的MiniMax国产大模型,基础语言大模型MiniMax-Text-01和视觉多模态大模型 MiniMax-VL-01已入驻超算互联网AI开源社区。此外,超算互联网ChatBot对话服务已同步接入,可以让用户体验智能、自然的人机对话。
MiniMax覆盖文本、语音、图像和视频领域,凭借自主研发的模型架构在长文本处理、多模态融合等方面性能优越。今年初发布并开源的新一代系列模型MiniMax-01首次将线性注意力机制扩展到商用模型级别,综合能力跻身全球第一梯队。特别是在“上下文长度”这个指标上,它达到了国内外一些顶尖模型的20—32倍水平,推理时的上下文窗口能达到400万token(词元)。
上海人工智能实验室今年也发布了多项大模型成果。1月,实验室完成“书生”大模型的重要版本升级,“书生·浦语”3.0(InternLM3)通过精炼数据框架,大幅提升了数据效率,并实现思维密度的跃升。它还首次在通用模型中实现常规对话与深度思考能力融合,可应对更多的真实使用场景。仅使用4T训练数据的InternLM3-8B-Instruct,其综合性能超过其他同量级开源模型,节约训练成本75%以上。
4月,上海人工智能实验室升级并开源了通用多模态大模型“书生·万象”3.0(InternVL3)。通过创新的多模态预训练和后训练方法,其多模态基础能力全面提升,在专家级基准测试、多模态性能全面测试中,10亿—780亿参数的全量级版本在同类开源模型中,各项性能均位列第一,并大幅提升了图形用户界面(GUI)智能体、建筑场景图纸理解、空间感知推理和通识学科推理等方面的能力。
“人工智能+”为科研赋能
高质量的基座大模型,为上海推进“人工智能+”奠定了坚实基础。在“人工智能+科学”这一新兴领域,发展AI for Science(科学智能)已成为科学界共识。这一共识体现在美国顶尖人工智能研究机构的行动上,如OpenAI宣布与美国多个国家级实验室合作,运用人工智能助力重大科研突破;Anthropic、xAI、思维机器等多家企业也把“理解宇宙、帮助科学、更好地思考”设为远期目标。
如何发展中国的AI for Science?上海人工智能实验室提出,要走“通专融合”道路。周伯文解释:“优秀的科学家往往兼具广博的通识能力和精深的专业知识,这种‘通专融合’能力是他们的核心特质,与人工智能的发展趋势不谋而合。”目前,业界已开始认识到大模型发展路径的局限性,通过在预训练后增加“后训练”,增强模型的推理深度,但其专业度仍然有限。要真正通过“通专融合”路径来解决科学问题,还有很多工作有待完成。
今年,上海人工智能实验室启动了“AI4S攀登者行动计划”,旨在打造科学工作者和AI工作者双向奔赴、协同攻关的新模式。这项计划的重点攻关方向包括:聚焦重大科学问题的创新突破;沉淀共性关键技术问题,如提升AI for Science的系统性能力;打造产业标杆,将AI for Science的价值体现在新材料、新工艺等实际应用上,产生经济和社会效益。
在组织模式上,“AI4S攀登者行动计划”有不少创新点:一是目标导向,聚焦重大科学问题组织攻关;二是创新协同,要求AI和科学研究人员组成“初创”团队;三是开放自由,不为课题设置既定流程,鼓励科研人员自由探索。
计划发布后一个月内,上海人工智能实验室就收到了来自全球500多家科研机构的申请。经过专家评审,20个项目脱颖而出。下一步,实验室将投入优势资源,推动入围项目进入研究阶段。目前,第二批项目申请已启动,这项计划将以滚动支持机制,接受更多科研团队报名。

晶泰科技研发的智能自主实验平台在“模速空间”展示。孟雨涵摄
作为向总书记作重点汇报的一家企业,晶泰科技在“人工智能+医药”领域,开发了一系列高精度人工智能算法,提高了药物研发成功率。
在小分子晶型结构预测方面,这家企业研发的算法模型预测准确率达100%,并在物质结构预测技术上保持全球领先。在近期由剑桥晶体数据中心举办的全球知名物质结构预测大赛中,晶泰科技从28支参赛队伍中脱颖而出,摘得桂冠。在生物大分子领域,公司开发的AI大分子药物发现平台已在蛋白质结构预测、抗体发现、蛋白质设计等领域取得行业领先成果。公司提供的“人工智能+医药”技术方案已广泛服务国内外药企、知名高校和科研机构,包括16家全球排名前20的跨国药企。
未来,在“不断增强科技创新策源功能和高端产业引领功能”这一要求的指引下,“人工智能+”等创新产品、创新场景和创新应用将跑出加速度,助力上海建成具有全球影响力的科技创新高地。
原标题:《上海积极布局人工智能“三要素”,推动大模型成果赋能各行各业》
栏目主编:黄海华 题图来源:孟雨涵摄
来源:作者:解放日报 俞陶然