スーパースカラ・プロセッサの高速化

パイプライン・ステージ統合

パス情報を用いた分岐フィルタ機構

PHT (Pattern History Table) における破壊的競合を抑制する方法にフィルタ機構がある．フィルタ機構では，強偏向の分岐命令は PHT を使用しないようにすることで，PHT の予測ミス率を低下させる．一方，パス情報が予測の手がかりになることが最近になって分かってきた．そこで我々は，フィルタ機構においてパス情報を利用する手法を提案した．強偏向のパスは PHT を使用しないようにすることで，予測ミス率の低下を狙う．本手法を Global Perceptron Predictor に適用した場合，平均 0.18% ミス率が低下した．特に，go においては 0.8% のミス率低下が見られた．また，本手法を Path Based Predictor, Piecewise Linear Predictor, Path Trace Predictor に適用した場合でも，go において 0.6～0.8% のミス率低下が見られた．

クリティカリティ予測のためのスラック予測

我々は，命令のスラック (slack)に基づくクリティカリティ予測を提案している．ある命令の実行を s サイクル遅らせてもプログラムの実行時間が増大しないとき，s の最大値をその命令のスラックという．したがって，いわゆるクリティカルな命令のスラックは0サイクルである．スラックは原則的には，データの定義時刻とそのデータの使用時刻の差で求められ，前回の実行時のスラックを予測表に登録しておくことによって，それを今回の予測値とすることができる．

クラスタ型スーパースカラ・プロセッサ向け命令ステアリング

スラック予測をクラスタ型スーパースカラ・プロセッサの命令ステアリングに応用する方法を提案した．各命令の実行後に得られるスラックの値によって，その命令が次回実行時に使用するクラスタを決定する．シミュレーションによる評価の結果，発行幅が4 のプロセッサを2つのクラスタに分割した場合，クラスタ化されていないプロセッサに比べ約10% 程度IPCが低下することが分かった．

スラックの伝播

前述したスラックの計算方法ではスラックの値を正確に求めることはできない．そこで我々は，使用側の命令の予測スラックを定義側の命令に伝播させることで予測の精度を上げることを試みた．このスラックの予測結果を，省電力アーキテクチャ向け命令スケジューリングに応用することで評価を行った．整数演算器で実行される命令のうちスラックの予測値が1以上である命令のみを低速／低消費電力の演算器で実行することにより，プロセッサの性能を大きく低下させることなく演算器の省電力化を図った．評価の結果，伝播を行わなかった場合に比べ，約3%のIPC低下で約10%多くの命令を遅い演算器で実行できた．

年月