体系结构(如RSIC 精简指令集计算机)与组织方式(如指令级并行)一起促进了计算机性能的高速发展。
为了替代以性能为目的的C语言和C++语言,首先出现了java,C#等托管编程语言,之后出现了python,ruby等脚本语言。为了保持生产效率并缩小性能差距,采用即时编译器(just-in-time)和跟踪编译器(trace-based compiling)的解释器正在慢慢取代过去传统的编译器和链接器。
芯片最大功耗和无法有效开发更多指令级并行的瓶颈导致单处理器的性能提高受限,转而提高一个芯片上集成的核心数目,而不是加快单核处理器的速度。
这是一个历史转折的里程碑,处理器性能的提高从指令集并行(ILP)转向数据集并行(DLP)和线程级并行(TLP)。ILP是编译器和硬件隐式开发的,不会影响到程序员,而DLP和TLP则是显示开发的,需要调整程序的结构才能开发显示并行。当时在大多数情况下,它会成为程序员的主要新增负担。
个人设备存储器在系统成本中占有很大的比例,因此存储器优化就非常重要。由于应用程序决定了数据规模,所以重视存储器用量其实就是重视代码规模。
性价比。性能主要指计算机性能和图形性能。
集群集群是指一组桌面计算机或服务器通过局域网连接在一起,运转方式类似一个更大型的计算机。每个节点都运行自己的操作系统,节点之间使用网络协议进行通信。
WSC && 服务器仓库级计算机(WSC)即最大规模的集群,它们的设计方式使数万个服务器像一个服务器一样运行。
WSC与服务器的区别在于,WSC以很多廉价组件为构建模块,依靠软件层来捕获和隔离在这一级别计算时发生的故障。WSC的可扩展性由连接计算机的局域网实现,而不是像服务器那样通过集成计算机硬件实现。
超级计算机的不同之处在于强调浮点性能,运行大型的、通信密集的批程序,这些程序往往依次运行几个星期,这种紧耦合性决定了超级计算级要使用非常快速的内部网络。而WSC则重视互动应用程序、大规模存储、可靠性和很高的因特网带宽。
并行体系结构数据级并行(DLP)可以同时处理许多数据项
人物级并行(TLP)创建一些能够单独处理但大量采样并行方式执行的工作任务。
计算机硬件以4种主要方式来开放应用并行指令级并行:在编译器帮助下,利用流水线思想适度开发数据集并行,利用推理执行类思想以中等水平开发数据集并行
向量体系结构和图形化处理器:将单条指令并行应用于数据集,以开发数据级并行。
线程级并行:在一种紧耦合硬件模拟中开发数据级并行或任务级并行,并允许在并行线程之间进行交互。
请求级并行:在程序员或操作系统指定的大量去耦合任务之间并行。
依据指令流和数据流对计算机分类单指令流单数据流(SISD)标准顺序计算机,但可以利用指令级并行(如超标量和推理执行)。
单指令流多数据流(SIMD)同一指令由多个使用不同数据流的处理器执行,对多个数据项并行执行相同操作。每个处理器都有自己的数据存储器,但只有一个指令存储器和控制处理器,用来提取和分派指令。
多指令流单数据流(MISD)
多指令流多数据流(MIMD)每个处理器都提取自己的指令,对自己的数据进行操作(可以不同),针对的是任务级并行。