人工智能白皮书：炒作结束，应用才真正起飞！（附股）

2023-10-11

今天，如果你挑出任何一个人，他们都会说几句关于人工智能的话。我们关心它的功能，关心它的观看乐趣，我们担心它的改进。没有人会拒绝突然的流行。早期投资者已经闻风而动，二级市场也不愿错过这个上涨机会。无论估值还是市值，都体现了我们对科技的乐观预期。

在人工智能的世界里，人类曾多次乐观过。

2016年，AlphaGo击败李世石，AI概念开始流行； 2018年，波士顿动力公司展示了跑酷王阿特拉斯2的演示视频，虽然与AI无关，但再次引发相关概念股的持续走势。每当AI取得最新进展，随之而来的就是大量的概念炒作，但AI行业不仅门槛很高，天花板也很高。

近段时间，ChatGPT概念股再次再现上述情况，部分公司有意炒作。 2023年2月1日至4月7日，相关概念累计上涨62.38%，此后ChatGPT概念股跌幅最大。 [1]

我们经常用Gartner曲线来描述一项技术的成熟度，但需要注意的是，Gartner曲线最初被称为“炒作周期”——它是伴随技术发展而出现的炒作周期。

这是一个简单的事实：当炒作结束时，应用程序才能真正起飞。

画饼容易，做事难

事实上，OpenAI的成功并不是因为追随概念热点。其核心领导团队是一群有使命感的技术偏执狂，坚定拥抱通用人工智能（AGI），持续推进大模型相关技术。 [2]

很多人都没有想到大型模型能够取得这样的成绩。国内企业也纷纷赶工，但制作大型模型并不容易。

中国信息通信研究院《人工智能白皮书(2022)》指出，人工智能正朝着更大规模、更多模式的方向发展[3]。未来的大型模型不仅需要惊人的计算能力，而且还能够理解文本、图像或视频。

首先，高质量的语料库正在逐渐枯竭，需要直观地获取更多的信息，这就是多模态的发展。人类一生大约可以听到 10 亿个单词，GPT-3 已经学习了大约 5000 亿个语言数据。已知最大的语言模型数据消耗超过 2 万亿个 Token（指文本中的最小单位），而人类文明的出现总共约有 9 万亿个优质语料，出现这种情况将是时间问题语料库已用完。事实上ai游戏引擎程序设计 pdf，人类是视觉动物3D道具，80%的信息是通过眼睛获得的，处理视觉和语言连接的神经元比例为10:1。因此，如果AI也能学会读图，它就能更快地理解世界。

其次，在大模型时代，单纯使用参数量的标定方法已经过时。现在要综合考虑算法、数据、算力三个要素。过去10年，最好的AI算法的算力需求增长了超过100万倍，每两年增长一个数量级。随着多模态的引入，数据量将继续呈指数级增长。当计算量有限时，需要将更多的计算资源分配给数据，而不是完全分配给参数。公式中为“大模型参数量×处理的数据量=计算量。计算量越大，通用能力越强。

引擎开发游戏_引擎设计图_ai游戏引擎程序设计 pdf

神经网络参数计算能力需求增长超过100万倍

国内外形成的类ChatGPT产品本质上都源于早期的大规模模型，产品本身的能力主要依赖于早期大规模模型的发展[4]。自2017年大型AI模型提出以来，国外已开始进行相关超大规模训练，并将于2021年正式进入军备竞赛阶段。 [5]

国内早期具备大模型能力的公司屈指可数。而且国内大型模型还缺乏数据量，无法实现高层架构[6]。更困难的是，大型模型是依赖高端GPU芯片的计算能力庞然大物。一个大型模型需要数万块GPU，这至少需要数十亿元的投资。 [7]

虽然困难重重，但满足制作大型模型所有条件的公司还是有的。这样的公司既需要算法，也需要计算能力。

让大模型变得有用

从“细化大模型”到“细化大模型”，AI行业因前期投入大、后期应用难度大而被业界诟病。如今，融合语言、视觉等信息和能力的大型多模态模型正在悄然引发AI设计范式的转变，从专用人工智能向通用人工智能（AGI）转变。

目前，普通用户和行业也在追求多模态AI工具的联合应用。一个模型用于指导另一组模型并用于生成提示。应用层面的创新层出不穷，这是新一代大模型+场景的结合。

然而，“AI+场景”的成本确实很高，而且开发周期极其漫长。每个场景都有自己的专属模型。如果遇到新的任务，就必须重新设计AI系统、收集样本、重新训练模型。 AGI就像一把万能钥匙，可以适应各个行业。当大型模型厂商将推理能力部署到各个行业时，更多的应用可以享受到AI带来的好处。 [8]

3月中旬以来，大机型混战打响，百度、阿里巴巴、华为、360等企业纷纷展示自己在大机型领域的进展。国内也一致提出了一个新概念——模型即服务（MaaS），描绘了新的商业前景。

为了扩大市场应用，大型机型应瞄准ToB业务。我们也看到，国产大型车型正在逐渐撬动更多B端的应用。

作为一家从2018年开始研发大模型的AI公司，商汤科技近期展示了其全新的SenseNova大模型系统，该系统为业界提供了自动化数据标注、定制大模型训练、模型增量训练、模型各种大模型即服务推理部署、开发效率提升等MaaS服务。

3月份以来，越来越多的人机对话应用浮出水面，各家公司对此都有自己的想法。日日信大模型体系下的千亿级参数语言模型“SenseChat”作为聊天助手，可以解决复杂问题、提供定制化建议、辅助创意成本。还可以提供指导、健康咨询、辅助决策等对话能力，在编程中提供代码补全、注释代码生成、测试代码生成、代码翻译、代码修改、代码重构、复杂度分析等功能场地。

基于日日新SenseNova大模型系统，商汤科技自主研发了SenseAvatar、琼宇SenseSpace、SenseThings、文生图大模型弥花SenseMirage等一系列生成式AI（同时支持大量第三方丰富开源的导入）楷模）。模型和应用程序可以生成高清图片和视频，以及各种3D内容。

经过多年的发展，自动驾驶已经很难跨越到更高的水平，也很难像人类一样能够灵活应对各种路况。多模态大模型也许能够解决这个困境。利用大模型生成大量困难样本，然后以环绕感知数据和多模态数据作为输入，实现感知与决策的融合。通过环境解码器重构3D场景实现路径规划，并用自然语言解释自动驾驶的动机。使自动驾驶系统更安全、更可靠、更可解释。商汤科技研发了自动驾驶BEV（鸟瞰）感知算法并实现量产。今年将开发UniAD，可以实现端到端自动驾驶，比SOTA更准确、误差更低。

引擎开发游戏_ai游戏引擎程序设计 pdf_引擎设计图

商汤科技大型自动驾驶模型概览

传统人工智能技术下，人工标注耗时长、成本高、需要大量资源投入。使用大模型可以实现自动标注，大大降低成本。商汤科技自动化数据标注平台提供自动化数据标注服务。拥有12个行业级大模型，覆盖1000多个目标类别，可进行2D、3D标注。当用户上传图像数据时，可以检测目标并识别属性，并自动显示注释。

引擎设计图_ai游戏引擎程序设计 pdf_引擎开发游戏

SenseAnnotation 概述

在生物医学领域，人类基因组携带超过20,000种蛋白质的指令。然而，人体内20种不同的氨基酸排列组合，然后螺旋折叠，形成不同的复杂结构。仅分析了约 1/3 的蛋白质三维结构 [9]。因此，分析蛋白质结构是一项非常重要的基础工作。

蛋白质的功能通常由其结构决定。要预测其结构，计算资源是基础。 DeepMind的Alpha Fold之所以在人工智能和科研界闻名，是因为它学习了X射线晶体学和冷冻电镜的实验数据，赋予了其超强的预测蛋白质结构的能力3D角色，大大提高了科研效率。商汤科技大型AI设备为大型蛋白质结构模型提供AI推理算力，为蛋白质相互作用模型提供研发平台和训练算力。与百赢科技合作，大型蛋白质结构预测模型的推理时间可以从数小时缩短至数小时。几分钟内，蛋白质结构预测性能达到工业应用标准，抗体筛选效率提升60%。

与其他厂商的大模型技术路径不同，商汤科技是以视觉大模型为核心技术突破点而衍生出来的多模态大模型发展路径：2019年商汤开发出10亿参数视觉大模型，到2022年320亿参数的大型视觉模型已经上线。同时，商汤科技还提前部署了自研的NLP模型和多模态模型，并将于2021年应用在商汤数字人等产品中。今年3月，商汤科技还开源了多模态模型拥有 30 亿个参数。国家大模范学者2.5。

基于在AI领域的长期应用，商汤科技积累了大量人类反馈的视觉信息，形成了高质量的多模态语料库，也解决了制约大模型发展的数据问题。

此外，商汤科技的大型AI器件SenseCore也为商汤科技的发展奠定了基础。目前算力规模包括27000块GPU，可输出5000PetaFlop算力，支持20个千亿参数超大型模型同时训练，支持最多4000张卡并行单任务训练，续航时间可达7年以上连续几天不间断的稳定训练。

对于正在探索多模态大模型的企业来说，如何让大模型变得更有价值？商汤科技对于能力建设的思考或许有一定的参考意义：一是优化模型本身ai游戏引擎程序设计 pdf，提升多模态数据处理能力，让文字、图片、视频无缝衔接；二是提供更多优质数据，给予模型更多“好口粮”；三是与生态伙伴一起探索商业应用，让大模型释放更多生产力，例如智能助理、自动驾驶、医疗诊断等；四是让大模型时刻安全可靠。

写在最后

美国斯坦福大学以人为中心的人工智能研究所（HAI）发布的《2023年AI指数报告》显示，美国在大型语言模型论文发表数量上远远超过其他国家。 [10]

引擎设计图_引擎开发游戏_ai游戏引擎程序设计 pdf