“没有大数据,数字经济就是‘无米之炊’;没有智能算法,数字经济就无法‘创造价值’。”
在近日举行的2023世界人工智能大会(以下简称WAIC)“大模型量产与产业实施合作论坛”上,国务院参事、中科院虚拟经济与数据科学研究中心主任、中国科学院大数据挖掘与知识管理重点实验室主任石勇表示。
过去的一年,随着通用人工智能(AGI)和生成人工智能(AIGC)的兴起,人工智能行业开启了新的篇章——AI对一些行业的颠覆开始加速,我们正在迎来一个时代AI新时代。
纵观计算机科学发展史,进入AI时代后,我国AI产业与国际先进水平的差距不断缩小。 不过,业界也清醒地意识到,中国AI产业的基础设施还有很大的提升空间。
正如施勇所说,在AGI时代,数据、算力、算法、算法开发平台都是中国人工智能产业发展壮大不可或缺的基础设施。
在今年的WAIC大会上,越来越多的AI、芯片等领域的专家、学者和从业者开始关注这一问题,并希望从底层做起,夯实中国AI产业的“基础”。
01.AI产业需要什么样的基础设施?
随着AI技术进入大模型时代,AI行业对数据和算力的需求迅速扩大。
以 ChatGPT 为例。 据媒体报道和投资咨询机构分析,GPT-3期间ChatGPT的数据量达到45TB。 对于纯文本数据来说,这个数字是惊人的。
同时,ChatGPT 消耗大量的计算能力。 训练涉及的算力为1万颗NVIDIA A100水平,单次训练成本高达140万美元。 另外,ChatGPT运行过程中,每一次用户交互都会产生一定的算力成本。
除了数据和算力之外,AI从业者尤其是核心算法工程师还需要大量的开发工具。
“算法工程师往往并没有真正研究算法,而是把时间浪费在环境搭建上。” 在WAIC大会上,山马智能创始人、董事长兼CEO彭耀表示:“我们希望人能够变得更加聪明,好好利用工具,而不是被工具利用。”
一些AI从业者调侃AI训练是“炼金术”。 一个可靠的算法训练平台可以有效减少算法工程师的准备时间。 在此背景下,越来越多的AI企业开始关注AI开发平台,山马智能就是其中之一。 在WAIC上,杉马智能发布了新一代ATOM人工智能生产力平台,希望通过更友好的开发平台帮助算法工程师提高效率。
据悉,山马智能ATOM AI生产力平台构建了从标注、训练、测试到实施的全链路自动化生产体系,可实现模型快速生产、迭代、验证的一站式管理,保证技术积累。成就和数据资产。 沉淀。
具体来说,ATOM AI平台支持跨云、跨集群的灵活调度。 基于DataExpress数据多级缓存和数据管道,可支持千卡级大模型训练和模型微调在各种场景下的稳定运行。
ATOM人工智能生产力平台的前身是山马智能团队推出的ATOM深度学习平台。 官方信息显示unity人工智能游戏开发,经过多年迭代,该平台已成为数十所高校千余名算法科学家和师生使用的AI模型开发工具。
02 视频模特方兴未艾
与目前AI行业流行的ChatGPT和Midjourney不同,ATOM AI平台专注于另一个赛道。 前两者通过大型模型实现文本和图片的AIGC,而后者则专注于视频领域,希望创建更多视频专用的AI模型。
在AI视觉领域,业界现有的模型大多基于静态图像。 目前,人脸、车牌、敏感内容审核等AI模型已经高度成熟。 然而,在视频领域,尤其是较长视频中的对象跟踪和行为检测,现有AI模型的性能仍然不理想。
其背后的原因是,大多数视觉模型对于静态图像表现良好,但对于动态视频,模型需要基于时间模型对单帧静态图像进行时空建模,然后提取视觉特征。 这个过程效率极低,并且需要大量的计算能力。
此外,与图像数据相比,视频数据更稀缺、规模更大、标注难度更大。 因此,在整个AI行业中,大视频模型仍处于方兴未艾的阶段,具有巨大的增长潜力。
针对视频模型开发的特殊需求,杉马智能ATOM AI生产力平台提供集数据管理、标注、训练、优化、推理功能于一体的一体化服务,通过统一计算能力和数据资源,帮助算法工程师专注于此。 模型训练本身。
事实上,山马智能本身也在持续投入模型研发。 目前,山马智能解决方案已在智慧交通管理、智慧高速公路、智慧轨道交通、智慧施工、智慧电站、扬尘治理等业务场景落地。
“大模型存在的意义一定是要应用于实际场景,为人们解决问题,为社会发展赋能。” 彭耀表示,“我们对于大模型本身是有理智的——我们不会盲目投入极大参数的LLM(大语言模型),而是结合自身优势构建基于视觉扩展的大感知模型。”
例如,杉马智能最近发布的SupreMeta感知模型融合了视觉、激光、雷达等多模态模式,对目标和场景具有更强的泛化能力。 它可以适应同一物体的不同视角、光照和遮挡。 可以实现准确识别。
03 结合算力与算法氛围,打造AI生产生态
作为一家人工智能公司,杉马智能专注于智能交通解决方案。 对于ATOM AI开发平台,杉马智能希望利用它打造AI生态系统。
在WAIC大会上,山马智能宣布将与北京国科智能计算技术有限公司、北京国科未来科技有限公司共同成立“中科山马”,旨在用更多资源共同推动ATOM新一代异构人工智能智能计算平台和DataOcean新一代存储系统打造主控、软硬件一体化的人工智能计算和存储设备,为大模型训练和实战提供可靠的计算平台。
中科山马智能有限公司揭牌仪式
中国科学院虚拟经济与数据科学研究中心特聘研究员张英飞表示:“中科山马智能有限公司具有三大优势:一是强强联合,资源整合;二是技术整合并拓展应用;三是聚合,我们将努力突破困难,期待与山马智能共同推动国内自主可控技术的发展和创新。
毫无疑问,在大模型时代,计算能力的意义变得极其重要。 在近日举行的WAIC大会上,山马智能邀请国内GPU及方案厂商沐希加入ATOM产业生态。
沐希科技创始人陈伟良表示,以GPU为代表的芯片产业已经成为AI产业发展的瓶颈。 AI行业的强劲需求催生了GPU的广阔市场,GPU未来的发展架构也将根据AI行业的需求来定义。
山马智能的生态系统也在努力让更多的合作伙伴加入到其生态系统中。 例如,在世界人工智能大会上,山马智能宣布将与3D互动内容创作运营平台Unity China合作,打造基于3D孪生技术和“AI”的实时全息智能交通系统和灵活渲染云平台。 +交通”的算法能力。 。
山马智能x统一中国工业元界战略合作签约仪式
过去Unity多用于游戏开发,其客户主要是游戏厂商。 然而近年来,随着科技行业对3D引擎的需求不断增长,越来越多的开发者开始使用Unity进行非游戏领域的开发,例如汽车智能座舱、数字孪生、元宇宙等。汽车领域,包括山马智能在内的很多厂商都在使用Unity作为3D渲染工具。
Unity也在积极拥抱AIGC。 近日,Unity中国宣布了在AIGC相关领域的计划——打造U3D Copilot——开发者只需使用自然语言发出需求,AI就可以通过大语言模型串起3D AIGC,为用户提供更自然的交互界面。 模型以及引擎内提供的工具,包括资产库和程序生成。
U3D Copilot 面向游戏和非游戏行业的开发人员。 在2023世界人工智能大会上,Unity中国CEO张俊波接受36氪采访时表示,以U3D Copilot为代表的3D渲染AIGC工具对于非游戏行业意义更大。 与游戏开发者相比,这些开发者在3D渲染方面的经验有限,而AI可以为他们提供更多帮助。
不难看出,从上游算力、数据资源到下游行业应用,山马智能结合自身业务构建了完整的大模型开发生态系统。 某种程度上,杉马智能本身已经成为AI大模型产业基础设施的一部分。
如今,中国的大型人工智能模型正在蓬勃发展。 据科技部新一代人工智能发展研究中心发布的《中国人工智能大模型图谱研究报告》显示游戏评测,据不完全统计,已发布国产参数超过10亿的大模型79个全国。
对于大模型的未来前景,彭耀的回答是,今天这个赛道的从业者很多,但并不拥挤unity人工智能游戏开发,因为大模型赛道极其广阔:“今天,很多领域仍然存在大模型,甚至还有大模型。”没有完成的定义。”
“所以,我们要有自己的GPU、自己的算力,要有更多做模型、做算法、做平台的公司,只有这样,中国的大模型产业才能发展起来。” 他进一步解释道。