新書推薦:
《
不被定义的年龄:积极年龄观让我们更快乐、健康、长寿
》
售價:HK$
77.3
《
南方谈话:邓小平在1992
》
售價:HK$
80.6
《
纷纭万端 : 近代中国的思想与社会
》
售價:HK$
109.8
《
中国古代文体形态研究(第四版)(中华当代学术著作辑要)
》
售價:HK$
168.0
《
朋党之争与北宋政治·大学问
》
售價:HK$
99.7
《
甲骨文丛书·波斯的中古时代(1040-1797年)
》
售價:HK$
88.5
《
以爱为名的支配
》
售價:HK$
62.7
《
台风天(大吴作品,每一种生活都有被看见的意义)
》
售價:HK$
53.8
|
內容簡介: |
半导体工业的不断发展,促进了多核技术普遍应用,尤其是以Cell处理器为代表的异构多核,在专用计算方面表现出明显的优势。同时,随着实际应用的日益复杂,不确定边界的循环(如while循环)、递归调用(如斐波那契)等非规则、非结构化问题在分子动力学、油藏数值模拟、图形图像处理等应用中普遍存在。为了有效地提高这类应用的并行效率,2008
年5月发布的OpenMP3.O新规范引入了task编译指导语句,即任务模型,该任务模型使得上述非规则、非结构化应用的并行成为可能。如何利用现有的编程模型和编译优化技术降低异构多核处理器的编程难度,提高非规则、非结构化并行应用的执行效率,充分利用异构多核处理器的并行能力成为软件行业面晦的一个重要问题。《异构多核任务模型优化技术》结合
Cell异构多核架构的特点及OpenMt任务模型的规范,研究了Cell异构多核处理器下OpenMP3.0任务模型的实现及优化技术。
《异构多核任务模型优化技术》组织结构如下:第一篇为基础知识篇,着重介绍了多核处理器及其分类;第二篇重点介绍了
OpenMP、MPI、CUDA、OpenCL等并行编程模型,同时对并行构件技术特别是CCA并行构件编程环境作了详细阐述;第三篇在分析了Cell异构多核处理器上支持任务模型的关键技术及国内外研究现状之后,分别阐述了Cell异构多核上OpenMP3.0的混合任务调度策略、Cell异构多核上优化非规则访存的软件
Cache模型以及Cell异构多核上优化任务粒度的自适应任务生成控制策略。同时,为了提高并行程序的复用性,提出了基于CCA的构件程序设计方案。
|
目錄:
|
第一篇 多核处理器
第1章 多核处理器概述
1.1 多核处理器的概念
1.2 多核处理器的关键技术
1.2.1 核心结构的选择
1.2.2 片上通信技术
1.2.3 多核与I/0结构
1.2.4 存储结构设计
1.2.5 程序执行模型
1.2.6 功率和热管理
1.2.7 操作系统设计
1.3 多核处理器的发展趋势
第2章 多核处理器的分类
2.1 同构多核处理器与编译技术
2.1.1 同构多核处理器的概念
2.1.2 GPU同构多核处理器
2.2 异构多核处理器与编译技术
2.2.1 异构多核处理器的概念
2.2.2 Cell异构多核处理器
2.3 本章小结
第二篇 并行编程模型及并行构件
第3章 openMP并行编程模型
3.1 OpenMP的基本概念
3.1.1 执行模式
3.1.2 0penMP编程要素
3.2 0penMP编程
3.2.1 并行区域管理
3.2.2 任务分配
3.2.3 同步
3.2.4 数据环境控制
3.3 本章小结
第4章 MPI并行编程模型
4.1 MPI函数
4.2 MPI消息
4.3 MPI通信
4.4 本章小结
第5章 CUDA并行编程模型
5.1 CUDA简介
5.2 CUDA架构
5.3 CUDAC语言
5.4 CUDA编程模式
5.5 CUDA存储器组织
5.6 CUDA执行模式
5.7 本章小结
第6章 OpenCL编程模型
6.1 OpenCL简介
6.2 OpenCL架构
6.2.1 OpenCL平台模型
6.2.2 OpenCL内存模型
6.2.3 OpenCL执行模型
6.2.4 OpenCL程序模型
6.3 本章小结
第7章 并行构件
7.1 构件技术
7.1.1 构件定义
7.1.2 国内外并行构件技术的相关研究
7.2 CCA简介
7.2.1 CCA概述
7.2.2 CCA的内容
7.2.3 CCA的特点
7.2.4 CCA的构件框架
7.2.5 CCA框架组建程序的过程
7.3 CCA并行构件编程环境
7.3.1 Bocca简介
7.3.2 Babel简介
7.3.3 Ccaffeine简介
7.3.4 SIDL简介
7.3.5 CCA并行构件程序设计过程
第三篇 异构多核处理器上支持任务并行模型
第8章 Ceu异构多核上任务模型的关键技术
8.1 OpenMP任务模型出现的必然
8.2 Cell异构多核上任务模型的关键技术
8.3 主要工作
第9章 国内外研究现状
9.1 OpenMP任务并行模型
9.1.1 任务结构
9.1.2 任务描述
9.1.3 任务调度
9.2 任务的调度策略
9.2.1 Intel的TBB
9.2.2 Cilk架构
9.2.3 IBM的XLC编译器
9.2.4 OpenUH编译器
9.2.5 GCC编译器
9.2.6 Nanos运行时库
9.3 非规则内存访问优化技术
9.3.1 非规则应用的研究现状
9.3.2 Cell处理器上软件cache的研究现状
9.4 任务生成控制策略
9.4.1 编译器控制的任务粒度策略
9.4.2 定值的任务剪枝策略
9.4.3 自适应任务粒度控制策略
第10章 CeU异构多核上OpenMP3.0的混合任务调度策略
10.1 问题描述及常见调度策略的比较
10.1.1 问题描述
10.1.2 常见任务调度策略的比较
10.2 混合调度策略的设计
10.2.1 任务结构
10.2.2 任务队列结构
10.2.3 主要接口设计
10.3 混合调度策略的执行过程
10.3.1 任务生成
10.3.2 任务窃取
10.3.3
任务同步
10.3.4 任务完成
10.4 本章小结
第11章 Cell架构上优化非规则访存的自适应软件cache模型
11.1 问题描述及分析
11.2 自适应软件cache行算法
11.2.1 自适应软件cache行算法及描述
11.2.2 算法图示
11.2.3 直接缓冲
11.3 混合行大小的cache结构设计
11.4 混合行大小cache的操作模型
11.4.1 混合行大小cache的主要接口设计
11.4.2 混合行大小cache的具体操作模型
11.5 本章小结
第12章 Cell架构上优化任务粒度的自适应任务生成控制策略
12.1 问题描述及分析
12.2 自适应任务生成控制策略的设计
12.2.1 任务结构
12.2.2 任务队列结构
12.3 自适应任务生成控制策略的执行过程
12.3.1 任务生成
12.3.2 任务窃取
12.3.3 任务同步
12.3.4 任务完成
12.4 自适应任务生成控制策略的整体架构
12.5 自适应任务生成控制策略的实例
12.6 本章小结
第13章 基于CCA的构件程序设计
13.1 SIDL文件的生成
13.2 服务端构件的实现
13.3 客户端构件的实现
13.4 扩展支持OpenMP并行编程模型
13.5 本章小结
参考文献
|
|