谷歌自研SoC芯片成功流片:得AI芯片者得天下

谷歌自研SoC芯片成功流片:得AI芯片者得天下

5kbps-unity加速器_unity游戏专用加速器_unity越狱加速器插件

谁获得了芯片,谁就赢得了世界。 我们可以进一步延伸这句话,说谁得到了AI芯片,谁就赢得了未来。

对于智能终端厂商来说,能够开发自己的SoC芯片似乎是顶级实力的象征。 众所周知,占据全球智能手机前三名的三星、华为、苹果无一例外都拥有自研SoC芯片。

unity游戏专用加速器_unity越狱加速器插件_5kbps-unity加速器

(2020年智能手机芯片基准数据Top 10)

如今,谷歌在辅助AI芯片积累了多年经验后,终于进军智能终端的核心硬件——SoC处理器芯片。

据外媒Axois报道,谷歌在自研处理器方面取得了重大进展。 近日,其自主研发的SoC芯片已成功流片。

据悉,该芯片由谷歌和三星联合开发,采用5nm工艺制造,采用“2+2+4”三架构设计的8核CPU集群,GPU搭载全新ARM公版建筑学。 它还集成了ISP和NPU。 谷歌 Visual Core AI 视觉处理器。 这使得谷歌的终端芯片能够更好地支持AI技术,比如大幅提升Google Assistant的交互体验。

上市计划方面,谷歌的SoC处理器芯片预计将首先部署在下一代Pixel手机和谷歌笔记本电脑Chromebook中。

谷歌此举被视为向苹果自研处理器模式靠拢,从“原生系统+最主流旗舰芯片”转向“原生系统+自研芯片”。 谷歌的意图肯定不仅仅是摆脱高通芯片的钳制,更重要的是想通过自研芯片实现软硬件更好的结合,让Android系统能够在自家硬件上发挥出更大的性能优势。

我们其实知道,自研芯片在硬件利润方面并不能为谷歌带来更多价值。 最有价值的是,通过软件和硬件的结合,谷歌AI的优势可以更好地应用在智能终端上。

我们都知道谷歌是最早进入AI芯片市场的,而且实力非常强大。 然而,AI芯片的技术有多强大呢? AI技术与芯片研发之间有何相辅相成的关系? 相信很多人还是不明白,这也是我们接下来要深入探讨的内容。

从云端到终端,

谷歌AI芯片的进阶之路

在谷歌的TPU(张量处理单元)处理器推出之前,大多数机器学习和图像处理算法一直运行在GPU和FPGA这两种通用芯片上。 提出深度学习开源框架TensorFlow的Google,专门做了这样一款专为TensorFlow算法设计的专用芯片。

TPU就这样诞生了,但让TPU名声大噪的却是AlphaGo与李世石的人机围棋比赛。 据说,谷歌当时其实为TPU又玩了一盘大棋。 因为在挑战李世石之前,AlphaGo 是在 1202 个 CPU 和 176 个 GPU 上运行来与国际象棋选手樊麾竞争。 这让看过比赛过程的李世石信心十足。 不过,在比赛前几个月,AlphaGo的硬件平台更换为TPU,这让AlphaGo的实力迅速增长。 随后的战局让李世石吃尽了苦头。

5kbps-unity加速器_unity游戏专用加速器_unity越狱加速器插件

(谷歌TPU芯片)

TPU 是一种专用集成电路 (ASIC)。 作为专门用于谷歌云的AI芯片,其使命是加速谷歌人工智能的落地。 在谷歌2017年宣布的第二代TPU上,其浮点运算能力高达每秒180万亿次运算,既可用于推理,又可用于训练。 至于2018年的TPU3.0版本,其计算性能比TPU 2.0提高了8倍,达到每秒1000万亿次浮点计算。

此后游戏开发素材,谷歌的AI布局逐渐走向边缘。 在2017年谷歌云服务年会上,正式发布了其边缘技术,并推出了Google Edge TPU。

Edge TPU 是 Google 的 ASIC 芯片,专为在边缘运行 TensorFlow Lite ML 模型而设计。 Edge TPU 可用于越来越多的工业使用场景,如预测性维护、异常检测、机器视觉、机器人、语音识别,也可应用于本地部署、医疗保健、零售、智能等各个领域。空间、交通等。

Edge TPU体积小,能耗低。 因此,它只负责AI加速判断和加速计算。 它只起到加速器和辅助处理器的作用。 它可以在边缘部署高精度人工智能。 它非常适合在边缘运行的 CPU、GPU、FPGA 和其他 AI。 ASIC 解决方案的补充。

谷歌去年还推出了一系列基于Edge TPU芯片的开发硬件,以及本地化的AI平台Coral,为边缘侧提供高质量、易于部署的AI解决方案。

虽然TPU和Edge TPU主要是加速深度学习计算推理的辅助服务器,但我们仍然可以看到谷歌在AI芯片上的布局野心。 从云端到边缘和移动智能终端,正是要了解谷歌AI芯片的内在逻辑。

unity越狱加速器插件_unity游戏专用加速器_5kbps-unity加速器

(像素视觉核心)

自2017年以来,谷歌陆续推出了智能手机上的定制相机芯片“Pixel Visual Core”和“Pixel Neuro Core”,并应用于Pixel 2、Pixel 3和Pixel 4中。

Pixel Visual Core 是一个图像处理单元(IPU),也是谷歌开发的第一款移动芯片。 专门用于加速相机的HDR+计算。 它使用机器学习和计算摄影来智能修复不完美的照片。 部分还使图像处理更流畅、更快。 这也是很多人说谷歌手机上的照片不是拍出来的,而是计算出来的原因。

去年unity游戏专用加速器,谷歌在 Pixel 4 上使用 Pixel Neural Core 专用处理器来取代 Pixel VIsual Core。 神经网络算法可以让谷歌手机的摄像头识别被拍摄的物体,然后可以将数据交给图像处理算法进行优化,也可以将数据输出到Google Assistant进行识别。 同时,Pixel Neural Core 还可以让 Google Assistant 进行更复杂的人机对话,以及离线语音到文本的翻译。

如果谷歌没有TensorFlow、Halide、编译器等AI算法和开发软件,谷歌AI芯片的很多设计显然无法发挥大作用。 软件与硬件的结合unity游戏专用加速器,让谷歌的芯片设计更加彻底和强硬。

软硬结合,

谷歌AI芯片快速迭代的硬背景

在互联网公司的造芯赛道上,谷歌无疑走在了前列。

据报道,早在2006年,谷歌就考虑在其数据中心部署GPU或FPGA,或者说专用集成电路。 而且由于当时需要在专用硬件上运行的应用程序并不多,因此可以利用谷歌大型数据中心的闲置计算能力来满足计算能力需求。

直到2013年,谷歌已经开始推出基于DNN语音识别的语音搜索技术。 用户需求使谷歌数据中心的计算要求成倍增加,这使得基于CPU的计算特别昂贵。 因此,谷歌计划使用现成的GPU进行模型训练,并快速开发用于推理的专用集成电路芯片。

5kbps-unity加速器_unity游戏专用加速器_unity越狱加速器插件

后来我们了解到,这款特殊定制的芯片就是TPU,快速开发周期只有15个月。 谷歌并不是唯一一家基于软件核心制造的公司,但相比亚马逊和Facebook,谷歌一直在不断推出芯片产品。 谷歌能够如此快速、高频率地进行“硬件”输出,自然是有原因的。

首先,必须是战略重视。 谷歌首席执行官皮查伊此前曾强调,谷歌从来不是为了硬件而硬件。 其背后的逻辑必然是AI、软件和硬件的融合。 问题的真正解决取决于这三位一体。

二是重视人才。 以目前谷歌的消费端SoC芯片为例。 这个项目早已是对外公开的“秘密”。 自2017年底以来,谷歌开始高薪从苹果、高通、英伟达等公司挖角,其中就包括苹果A系列处理器著名研发工程师约翰·布鲁诺(John Bruno)。 但直到去年2月,谷歌才正式宣布在印度班加罗尔组建“gChips”芯片设计团队,专门负责谷歌的智能手机和数据中心芯片业务。 未来还将在那里开设一家新的半导体工厂。 消费级芯片似乎指日可待。

当然,最重要的因素还是谷歌在AI芯片方面的创新优势。 我们知道,AI芯片的研发本身就是一个长期且耗资巨大的工程。 从芯片设计到成品的周期可能跟不上AI算法的发展。 如何在AI芯片的硬件设计、算法和软件之间实现平衡,成为谷歌芯片设计的关键优势。

谷歌提出的解决方案更值得称道,那就是利用AI算法来设计AI芯片。

具体来说,AI芯片设计存在以下难点。 第一个是 3D 芯片的放置,它在有限的区域内跨层配置数百到数千个组件。 工程师需要手动设计配置并通过自动化软件进行仿真和性能验证,这往往需要花费大量时间。 其次,芯片的设计架构跟不上机器学习算法或神经网络架构的发展速度,导致这些算法架构在现有的AI加速器上性能不佳。 此外,虽然芯片布局规划的设计进程正在加速,但在芯片功耗、计算性能和面积等多个目标优化的能力上仍存在局限性。

为了应对这些挑战,谷歌高级研究科学家 Mirhoseini 和团队研究员 Anna Goldie 提出了一种神经网络,将芯片布局建模转化为强化学习问题。

与典型的深度学习不同,强化学习系统不使用大量标记数据进行训练。 相反,神经网络通过实践来学习,成功时根据有效信号调整网络中的参数。 在这种情况下,有效信号成为降低功率、提高性能和减小面积组合的替代指标。 因此,系统执行的设计越多3D场景,它就会变得越好。

经过足够长的时间研究芯片设计后,它可以在不到 24 小时的时间内完成谷歌 Tensor 处理单元的设计,其功耗、性能和面积都超过了人类专家几周的设计结果。 研究人员表示,该系统还向人类同行传授了新技巧。

最终,谷歌团队希望这样的AI系统能够实现“在相同的时间内设计出更多的芯片,以及运行速度更快、功耗更低、制造成本更低、尺寸更小的芯片”的目标。 。

着眼未来,谷歌AI野心SoC芯片集成

此次谷歌自研的终端处理器SoC芯片本质上是谷歌AI芯片的延伸。

细心的人应该发现了,这次的SoC芯片并不完全来自谷歌研发团队,而是选择与三星合作。 从媒体曝光的情况来看,谷歌手机主控此次将采用5nm工艺、Cortex-A78大核心,以及多达20核的全新GPU,而这也恰好是三星Exynos 1000的特点。因此,最重要的“这款三星堆叠芯片的“谷歌元素”,就是谷歌自家设计的AI芯片在ISP和NPU上的应用。

unity越狱加速器插件_unity游戏专用加速器_5kbps-unity加速器

(谷歌Pixel5谍照)

这一选择自然有谷歌的充分考虑和一些明显的优势,但也有一些不利的影响。

最直观的好处就是加快了谷歌移动SoC芯片的开发速度,减少了对高通处理器的依赖,可以快速应用到下一代谷歌Pixel手机上。

另一个好处是,谷歌主导的芯片设计将让谷歌能够像苹果一样构建自己的封闭系统。 谷歌最核心的就是拥有海量的数据和AI算法。 随着应用层面的数据体验和AI体验的不断丰富,比如飞行模式下的实时语音转录功能,手机的硬件性能和系统的兼容性支持可能会成为智能手机的性能天花板。 也许没有人比 Google 更了解如何最大限度地提高 Android 中的处理器性能。

毕竟之前的Google Pixel手机的市场表现一直不温不火。 虽然它们在拍摄算法、AI助手等应用方面具有很大优势,但终端的外观设计、屏幕、摄像头、电池等硬件配置一直存在问题。 “缺点”,难以与全球几大主流终端厂商的旗舰机型抗衡。 想必,采用最新一代SoC芯片的Pixel新机型的定价也将非常“高端”,但硬件上的“偏向”或许仍会影响其整体市场表现。

此外,由于这是一款全新的“非主流”芯片,因此它将不再是游戏和软件开发商“软件开发原型机”的首选测试机型。

无论如何,这款集成深度学习性能的SoC芯片将为谷歌争夺未来AI市场做好准备,帮助谷歌最大限度地发挥移动终端语音识别、图像处理等AI应用的性能,领先一步。 占据真正智能终端的领导地位。

unity游戏专用加速器_5kbps-unity加速器_unity越狱加速器插件

不管如何,谷歌的“芯”之举必将对上游芯片厂商和智能终端厂商产生积极影响。 如果说《Whitechapel》证明了谷歌“造芯”战略的成功,那么谷歌与苹果的差距还有多远?

自主研发的芯片和Android系统与最新的AI计算能力相结合。 如果硬件配置的短板得到补充,那么谷歌极有可能打造出Android生态系统软硬件完美适配的闭环系统。

最后,我们发现了一个更令人费解的细节。 这款芯片的代号为“Whitechapel”,命名为“Whitechapel”。 熟悉英美剧的读者可能看过一部叫做《白教堂谋杀案》的英剧。 如果不必过度解读,我们可以理解为某重要开发商喜欢这部惊悚悬疑剧,所以以此命名。 如果非要“过度”解读的话,谷歌或许想用一个百年未解的“谜团”来预示AI在智能终端应用之争的开始。

当然,这个答案可能要等到谷歌新款 Pixel 手机推出后才能得到答案。

unity越狱加速器插件_unity游戏专用加速器_5kbps-unity加速器

unity游戏专用加速器_5kbps-unity加速器_unity越狱加速器插件

unity游戏专用加速器_unity越狱加速器插件_5kbps-unity加速器

文章来源:http://mp.weixin.qq.com/s?src=11×tamp=1695773532&ver=4799&signature=8D*GbJVYPfxgCu9ksNMpZz12HmUDWYzv4wOmpwjuSS*4TRTQ3FwdEo1vI5PXZpcf69F4oHmgZ*Q27STaO3EDPxEv1C0K4PV-pqRHSu-otyszvS86f5bqwACegH3xrJ9N&new=1