登录注册   忘记密码

魏少军:人工智能对半导体行业的重大意义

人工智能近年来发展火热,2016年世界范围内人工智能初创企业数量大,融资额高。企业并购案,股权融资数量都在上升,可以预想该些数值在2017年都持续有所增加。其中人工智能在中国的人气更为高涨。某些独角兽芯片企业融资额达百亿元以上。

1. 人工智能崛起三个基本要素

人工智能起源于年的达特茅斯会议,经过年的发展,年研究者在人工智能方面再次提出了深度学习的概念。而人工智能真正引起人们巨大反响是在年战胜顶尖棋手李在石,柯洁之时。战胜柯洁的原因是战胜李在石后半年,经过自身演练几百万场后才与柯洁对弈,柯洁的对手已不再是半年前的了,这种现象就是机器学习。其实早在机器人参加《危险边缘》节目,就在两场打平的基础上战胜参赛人员获得了胜利。

这些都说明人工只能的发展早已超出我们的想象。究其原因,主要是由于:


1.算法的提升。

从最开始只提出了人工智能的概念,到年代全连接的神经网络,都是基于算法的提升。


2.大量的数据。

工智能都是伴随着大数据共生。


3.算力的提升。

三个基本要素促进了人工智能崛起。

人工智能发展绕不开芯片


2.1智能化是人工智能重要的核心驱动力

国际上人工智能技术,主要指的是其智慧和能力。如果把感知、传输、处理、决策、执行看做一个链条,可以看到其中存储,处理,决策这些存在计算,分析,判断的部分就是智慧的核心,而其前后两端就是能力。现在讲的人工智能都是指的就是智慧能力。

可以看到,与人拥有的次方神经元的大脑相比,人工逻辑,通过设计,如天河二号,芯片采用了电传,每秒钟达万公里,工作频率为。由于把大量的放在一起,可以获得比人脑强很多倍的计算能力。但其耗电量巨大,需要占地面积平方米的小型电站。


2.2训练推理与模拟人脑训练

人工智能发展的一大难题就是怎么样才能让机器掌握人类常识,这是让机器和人类自然互动的关键。目前为了实现这一点,主要有两个分支方法,一是通过机器不断地内在训练,进行提升。另一种是通过包括模拟、数字或模数混合和软件系统实现神经网络模型来模拟人脑计算。


2.3机器学习芯片

目前机器学习是两者中的主流方法。来看机器学习芯片,可以看到相比于芯片在计算能力上高出5倍,存储带宽上高出4倍在性能上更为占优。在GPU整体市场中,Intel占有绝对的份额,但在分立式GPU市场中,NVIDIA优势更大,市场份额达71%

除了GPUCPU,市场中还有FPGATPUNAIMP芯片的出现。与CPU/SW相比FPGA性能提升5-10倍,功耗为GPU20%,能满足对更高性能、低延迟的需求。GoogleTPU则是在较低精度上比GPU更有优势。

其中NA有多核处理器,主要应用于基于刺激的学习机制,而IMP则更多地应用于生物信息学。

2.4 类脑芯片

在类脑芯片中,主要有IBM的百万神经元类脑芯片TrueNorth, 它重量只有几克,却集成了54亿个硅晶体管,拥有100万个“神经元”,相当于一台超级计算机,但功耗却只有65毫瓦。IBM的最终目标是希望建立一台包含100亿个神经元和100万亿个突触的类脑计算机。这样的计算机要比人类大脑的功能强大10倍,功耗约1000瓦。体积与人类大脑的大小相当。

3.人工智能芯片的若干关要素

工智能芯片主要面临两个现实问题:一是算法仍在不断演进,新算法层出不穷;二是一种算法对应一种应用,没有统一的算法。

在这种情况下,高能效通用深度学习引擎是人工智能芯片的必备特性。因为:

1.AI需要通用神经网络计算

长远来说发展通用神经网络计算是必然的。我们需要做的是否通过学习引擎的标准化来实现通用神经网络。

2.计算量,参数量的激增。

可以看到随着时间发展,到2014年我们已经需要处理约200亿次计算量,同时处理1.4亿参数量,计算要求急升。

3.从“云端”向“终端”的迁移,亟需高能效计算,能量效率~TOPS/W。

目前大家希望人工智能能从云端向终端发展,因为终端市场巨大,且需求变化快,但这自然也需要更高效的运算能力。

此时人工智能芯片应具备的要素包括:

1. 可编程性:适应算法的演进和应用的多样性;

2. 架构的动态可变性:适应不同的算法,实现高效计算;

3. 高效的架构变换能力:<10 Clock cycle,低开销、低延迟;

4. 高计算效率:避免使用指令这类低效率的架构;

5. 高能量效率:~10 TOPS/W

6. 低成本:能够进入家电和消费类电子;

7. 体积小:能够装载在移动设备上;

8. 应用开发简便:不需要芯片设计方面的知识;

应用创新带动AI芯片发展

人工智能的突破点除了技术,还有应用创新。应用创新是带动AI芯片发展的关键力量。其中像人脸识别,语音识别,机器翻译,智能驾驶等等都是发展的重点内容。对应用应该考虑的是这些问题:哪些应用需要AI?我们希望AI帮助解决什么问题?什么AI是每天需要的?等等。

AI芯片提供商的定位

AI全产业链中,可以看到存在Google,百度,阿里巴巴等大互联网公司保持着对AI全产业链的控制。他们一般都有能力进入芯片领域。另外软件,硬件提供公司有NVIDIA等,终端企业提供商主要有三星苹果小米等,另外ARM等公司只专注芯片生产。

架构创新是AI芯片发展的基础,可以看到目前AI芯片架构复杂,拥有高度复杂,灵活的互联结构,一般为多输入/多输出系统。

软件定义芯片(SdC

首先我们知道技术的完成需要计算,计算无处不在,是最重要的基础。而这就需要依靠软件,硬件来实现。其中对软件的要求是能自主学习,形成知识经验,并能保持改进优化。

在这样的条件下,来看芯片,自然需要拥有高性能计算能力,多线路并行计算能力,实时动态功能变化能力等,这就是软件定义芯片需要满足的特性。

有人认为FPGA就是SdC,但是我们要看到FPGA存在着细粒度,配置信息量,配置时间长,静态编程,逻辑不可复用,面积效率低,能量效率低等等问题,FPGA还有很长的路要走。

理想软件硬件架构

理想软件硬件架构是软件硬件能够一一对应。但也因为软件可以无穷大,硬件不可以,因此需要通过硬件架构不断变化来实现,即芯片的架构和功能随软件的需求而改变。这才是真正意义上的软件定义芯片。

可以看到这种可重构计算模式,和经典计算模式是两种不同的思路:可重构计算模式是一种函数化的硬件架构具有柔性,存在计算结构适应应用等特点,而经典计算架构则是一种刚性架构,应用适应计算结构。

这种新的架构模式应用在人工智能芯片中,可以通过人工智能应用的识别,来定义深度学习的神经网络。如思考者(Thinker)就是可重构神经网络计算架构在AI芯片的一种应用。它在任何一个运算单位中,都支持不同的神经网络的运算,不同的神经网路都可编程可变换。另外还能在一个平面上把多个神经网络不同部分映射到多个平面上使得其性能进一步优化。

Thinker系列主要有三个产品:Thinker one,人脸识别准确率高于人类识别的Thinker two,应用于语音识别的Thinker S

目前在关于可重构计算和Thinker系列的学术成果很丰硕,论文发表近200篇,相关专利50多项。

5.总结

总的来说,AI芯片是当前科技、产业和社会关注的热点,也是AI技术发展过程中不可逾越的关键阶段。不管有什么好的AI算法,要想最终得到应用,就必然要通过芯片来实现。

由于还不存在适应所有应用的通用算法,确定应用领域就成为发展AI芯片的重要前提。遗憾的是,AI杀手级应用目前尚未出现,已经存在的一些应用对于老百姓的日常生活来说也还不是刚需。因此,AI芯片的外部发展环境还有待优化。

另外,架构创新是AI芯片面临的一个不可回避的课题。其中一个重要问题是:是否会出现像通用CPU那样独立存在的通用AI处理器?如果存在的话,它的架构是怎样的?如果不存在,那么目前以满足特定应用为主要目标的AI芯片就一定只能以IP核的方式存在,最终被各种各样的SoC所集成。如果真是这样,那么今天从事AI芯片研发的设计公司将何去何从?

此外,可重构计算芯片技术允许硬件架构和功能随软件变化而变化,实现软件定义芯片,在实现AI功能时具有独到的优势,具备广阔的前景。

您的评论:

0

用户评价

  • 暂无评论