转载自:文汇报
阶跃星辰公司内景
在全球人工智能(ai)产业加速迭代的进程中,大模型领域的“上海力量”正引发广泛关注。明天,以“模塑全球无限可能”为主题的2025全球开发者先锋大会(gdc2025)就将在上海拉开帷幕。这场顶级开发者盛会的背后,一场关于大模型产业生态的“上海攻略”已悄然成型。
在gdc开幕前夕,文汇报记者连续走访多家本市ai头部企业和平台,它们分别在大模型行业多个关键枢纽环节扮演着关键角色。透过它们可以看到,从算力基建、语料治理到算法开源、产业协同,上海正以全链条的生态思维,为大模型赋能实体经济、激活创新创业创造最佳生态。
算力基建,注入充沛动能
算力堪称ai创新和应用的引擎。在上海仪电集团建设推动下,上海已拥有若干“万卡”规模的智算集群并投入使用,无论是规模还是等级都达到国内领先水平,并成为“模塑申城”行动的重要公共服务平台之一。
事实上,阶跃星辰step、书生·浦语、商汤日日新、minimax……这些原生于上海的知名ai模型,上海仪电都通过旗下“仪电智算云”平台完成了部署与优化。不仅如此,该平台还为国内外其他优秀模型提供服务,包括阿里巴巴旗下的通义千问,以及爆火的deepseek。可以说,高效能、低成本的算力供给,为大模型在上海起飞注入充沛动能。
上海仪电相关负责人告诉记者,为进一步降低ai中小企业创新创业的门槛,他们不仅在硬件层面搭平台、供算力,更在软件和技术层面积极开拓创新。比如,通过推出容器化调度、自动续训等技术,其智算中心的模型有效训练时长占比已超过99%;同时,他们正在联手相关企业,共建上海市“智能算力资源统筹调度服务平台”,将把更多算力资源纳入ai生态,通过统筹调度,与ai开发者、创业者、应用者精准匹配。值得一提的是,借助仪电智算平台,目前有超过10款国产芯片进行了适配验证,有力支撑了自主创新生态。
语料供给,打破数据瓶颈
如果将ai比喻成火箭,那数据就是它的燃料。随着大模型成为当前ai发展的焦点,语料数据更是直接决定了模型性能。高质量的语料可以减少ai在推理中出错的概率,提高其“脑力”。为了打破此前语料供给侧普遍存在的瓶颈问题,包括方法论不明确、高质量数据稀缺、过度依赖人力等,上海在去年联合国资和民企,率先组建高质量ai语料数据平台运营企业库帕思科技有限公司。
据库帕思总经理黄海清介绍,从去年9月搭好团队启动运营至今,不到半年时间里,他们已取得积极进展,尤其是“1125”的语料创新框架已形成。所谓“1125”,是指1个语料基座、1个语料运营平台、2个战略基础体系、5项可持续发展能力构成。 其中,在语料基座方面,通过自建和链接外部资源,库帕思已布局1个综合语料库和若干行业语料库,未来既可以高效服务基础大模型,更能为垂类模型的行业深度应用降低成本。同时,为提高语料加工的自动化水平,他们打造从采集、清洗、标注到测试、应用“五位一体”智能化工具包,由此,原始数据化为高质量语料的过程,在未来有望全面交给ai完成。
黄海清透露,今年库帕思“语料工厂”的工作重心,是依照“模塑申城”行动方案中所划定的“5+6”方向加强布局,包括智能终端、科学智能、在线新经济、自动驾驶、具身智能等关键领域,以及金融、制造、教育、医疗、文旅、城市治理等重点行业。目前,该公司的ai机器人正以每天最高1000gb的速度进行语料加工。预计到年底,其语料库的总容量有望达到2pb(1pb约等于100万gb),不仅有文本,更包括语音、视频乃至具身智能数据的融合协同。
算法开源,为全球贡献智慧
算力、语料的充分供给,归根到底是为在算法层面做出了不起的创新,从而衍生出更加有用、有趣、安全可控的大模型,以赋能新质生产力的发展。就在gdc开幕进入倒计时之际,大模型代表企业阶跃星辰正式开源了两款多模态大模型,叠加今年1月沪上另一大模型头部公司minimax首次开源的新一代大模型minimax-01,可以说,本市ai行业正积极拥抱开放创新生态,为全球开源社区贡献“上海智慧”。
在国内大模型创业企业中,阶跃星辰是一个很有影响力的名字。不仅因为几位创始人此前在业内声望显赫,同时,在创新方面,他们也拿出了不俗成绩。就在几天前,美国知名科技媒体《麻省理工科技评论》刊文指出,除deepseek之外,中国还有4家同样具备不俗竞争力的ai初创企业,其中就包括阶跃星辰。
此次他们开源的两款都是多模态大模型。其中,step-video-t2v是当前全球参数量最大、性能最好的开源视频生成大模型,可以根据文本直接生成10秒时长、细节丰富、接近电影级的视频,在表现复杂运动、美感人物、镜头语言等方面能力突出。step-audio则是业内首个开源的产品级语音交互模型,可通过情绪丰富、情商练达的嗓音陪使用者聊天,甚至最快能在10秒内就克隆一个人的声线。
事实上,阶跃星辰和minimax开源的模型,都在多模态领域(视频、语音生成)展现出过人能力,这与deepseek强于文本推理的r1模型形成错落和互补,进一步丰富了中国ai创新的维度。正如阶跃星辰副总裁李璟所言,开源不仅是创新能力的体现,更可加速ai从研发到落地的进程。他表示:“上海拥有国内最好的模型创新生态,相信依托整个创新生态的协同以及政策支持,今年上海的大模型应用有望出现爆发之势。”
欢迎转发,但请注明出处“上海经信委”
觉得不错请点赞!
上观号作者:上海经信委