能。
为了提高预测的准确性,IP 预取器利用指令指针(指令序列中的计算机地址寄存器)给每个载入记录加上标签。通过给每个载入添加指令指针,IP 预取器建立了载入历史记录。根据该历史记录,IP 预取器进行下个载入的地址预测。然后,IP 预取器根据预测地址生成预取请求并将所产生的数据传送至 1 级数据高速缓存。
尽管预取可提高内存使用效率和性能,但也可能产生资源过载等不利影响。每个处理内核包含两个针对 1 级数据高速缓存的 IP 预取器。当将 IP 预取器添加至已有的传统预取器时,英特尔双核处理器就一共拥有了 8 个预取器,这便可能浪费运行程序时必要的载入操作所需的宝贵带宽。英特尔® 酷睿™ 微架构 IP 预取器采取了数项措施以减轻这些不良影响。
借助基于英特尔® 酷睿™ 微架构的处理器,预取流量控制和分配参数可根据平台进行调整。个人电脑可根据芯片组内存、前端总线速度、二级高速缓存大小等设置预取灵敏度。此外,由于服务器产品运行的应用同客户机完全不同,其预取器采用服务器指标调整。
英特尔® 酷睿™ 微架构利用具有多个水印装置的预取监视器来检测流量过载。若超过固定阈值,预取器将被延缓或中止,从而从根本上减少了预取过程中可能发生的冲突。由此实现了有效平衡,在灵活响应程序要求的同时利用未使用的带宽降低内存延迟。
|
| Single Entry |
单一条目 |
| Last Address |
最新地址 |
| Last Stride |
最新跨距 |
| SM |
SM |
| Last Prefetch |
最新预取 |
Load Buffer |
载入缓冲区 |
IP |
IP |
Prefetch History Table 256 Entries
|
预取历史列表256 个条目 |
L1 Data Cashe Unit
32 KB |
1 级数据高速缓存单元
32 KB |
Address |
地址 |
Prefetch Generator |
预取生成器 |
FIFO |
FIFO |
IP Prefetcher Request |
IP 预取器请求 |
DCU Streamer Request |
DCU 流处理器请求 |
to/from
L2 Cache |
至/自
2 级高速缓存 |
Everything happens during load’s execution. |
所有操作都在载入执行期间进行。 |
|
图3:英特尔® 酷睿™ 微架构指令指针预取器系统高级框图
|

总结
英特尔® 智能内存访问技术在英特尔® 酷睿™ 微架构中扮演着重要角色,有效提升了该微架构的性能和性能功耗比。借助内存消歧和高级 IP 预取器,英特尔® 酷睿™ 微架构实现了系统内存资源的智能化高效利用。
英特尔® 智能内存访问技术连同英特尔® 酷睿™ 微架构的其它四大技术(英特尔® 宽位动态执行、英特尔® 高级数字媒体增强、英特尔® 高级智能高速缓存及英特尔® 智能功效管理)共同打造高性能、低功耗的计算机设计,减少服务器数据中心的面积,降低功耗,减轻散热负担,并实现了整个客户机和服务器平台的响应速度提升,以及效率和能效改进。
了解更多信息
如欲查看白皮书、演示等资料,了解更多信息,请访问下列英特尔网站:
英特尔® 酷睿™ 微架构
英特尔® 至强™ 51xx 指标评测详细信息
英特尔多核
能效表现
作者简介
 |
Jack Doweck
英特尔公司移动事业部首席工程师
|
Jack Doweck 是英特尔移动事业部首席工程师,也是全新英特尔® 酷睿™ 微架构的首席设计师。英特尔® 酷睿™ 微架构是英特尔® 至强® 5000 系列处理器与英特尔® 酷睿™2 双核处理器的基石。在英特尔® 酷睿™ 微架构的定义阶段,Doweck 定义了内存集群微架构并参与定义乱序执行微架构。Doweck 在处理器微架构领域拥有八项专利,另有六项正在申请中。他曾三度获得英特尔成就奖。Doweck 于 1989 年加盟英特尔以色列设计中心。他拥有电气工程学学士学位和以色列海法市 Technion 理工学院的计算机工程学硕士学位。 |
| |
1 性能基于 SPECint*_rate_base2000 评测结果。实际性能可能有所差异。功耗降低基于散热设计功耗(TDP)。请参阅 www.intel.com/performmance,了解所有与性能相关的要求与声明。

|