上海人工智能企业在大规模模型研究、开发和应用领域取得了哪些新进展?
1月11日下午,澎湃新闻(www.thepaper.cn)记者跟随上海市经济和信息化委员会组织的“追随总书记脚步创新企业”媒体采访团来到上海。漕河泾某公司。唐科技(“商汤科技”)人工智能体验中心获得了许多新技能和新应用。
绘制大型模型:输入关键字,5秒内生成图像
在AI体验中心,您可以体验商汤推出的大规模语言模型和大规模Vincent图模型“SenseMirage”,体验生成式AI给人们生活带来的变化。
“弥花SenseMirage”是一款AI绘画平台,拥有商汤科技自研的大规模绘画模型和便捷的LoRA训练能力,并提供第三方社区的开源模型加速推理,为创作者提供更多便利。完成内容创作和制作。工具。顾名思义,“妙画”可以在几秒内快速生成画作。
输入描述性文字后生成的一系列图像。图片提供:本报记者于凯
“赛博朋克女孩,半边脸是机器,展现未来机械科技,冰冷的眼神,脸上闪烁着霓虹灯,脸部特写……”参与者在现场输入上述描述,并选择输出。确定分辨率和制作数量后,只用了5到7秒的时间,就在屏幕上生成了一系列符合上述特征的人物图像。
最近,王家卫导演的电视剧《繁花》热播,看过的人都迫不及待地在键盘上输入《王家卫的东京夜花》,点击“立即生成”。我点击了。几张照片出现在众人面前,——灯光昏暗的东京街道映入眼帘,盛开的樱花树在王家卫的镜头下展现出独特的色调和光晕。不过,从“命题画”的角度来看,它与电视剧《繁花》中的东京夜晚餐厅有所不同。
如果你输入“鲜花、王家卫、东京夜晚”之类的文字,就会生成几张照片。图片提供:本报记者于凯
商汤官方表示,对于Vincentian 的大模特来说,《繁花》、《夜东京》、《王家卫》仍然是有特定含义的新词,但有了SenseMirage 这不是问题,你可以简单地上传几张照片或者直接上传几张照片。代表这些词的标志。米花的大模型可以通过LoRA训练进行自主学习,学习这些单词的含义,然后接受这些指令,快速制作出你想要的“真实”照片和创作。
输入“水彩画、湖边露营、家庭、温暖”等词语,大型模型“SenseMirage”就会在几秒内创作出一幅作品。图片提供:本报记者于凯
自动驾驶大模型:推出多项功能,形成驾驶员健康档案
在营地探访中,澎湃新闻记者了解到,在智能汽车领域,商汤绝影智能座舱、智能驾驶、车路协同等行业应用也不断取得突破,支持更大车型。
例如,爵影智能座舱系统目前提供了驾驶员感应、乘员感应、手势感应、健康助手、美颜相机、空气喷漆等多种功能选项,并且在等待红灯时,系统数值可以自动测量。心率、血氧饱和度、呼吸频率等数据长期形成驾驶员的健康档案,在测量到异常数据后可以及时预警。
“绝影”智能座舱系统目前提供了多种功能选择。图片提供:本报记者于凯
“绝影”智能座舱系统可以自动测量驾驶员心率、血氧饱和度、呼吸频率等数值。图片提供:本报记者于凯
此外,商汤科技近期还发布了大规模自动驾驶模型DriveMLM。用户只需输入图像、激光雷达信息、交通规则甚至乘客需求即可提供驾驶计划。
AI体验中心还展示了亚洲最大的人工智能计算中心(商汤临港AIDC)的模型。该项目位于上海临港新区,一期投资56亿元,主要建设园区智能计算大楼和科研管理大楼,建设AI智能硬件计算中心平台。将被使用。平台软件、平台管理系统、大型模型应用的研发。据介绍,该项目占地87亩,规划总建筑面积13万平方米,目前一期已竣工7万平方米。
AI体验中心展示了亚洲最大的人工智能计算中心(商汤临港AIDC)模型。图片提供:本报记者于凯
“目前,商汤科技的人工智能计算中心拥有6800 petaflops的算力,超过3万块GPU,远远超出了该项目规划的总算力3740P。” 体验中心在支持商汤科技自身时,工作人员告诉记者:计算中心支持大规模模型开发以及外部客户大规模模型的训练和应用部署。计算中心凭借强大的计算能力,支持20多个千亿规模的超大型模型。可以支持同时训练。