综合来说——假设我们正在优化前述popcnt。执行首条指令后,输入0x03和0x06可能产生相同的CPU状态。由于两者都期望输出2,可将其合并为单个warp条目。但若0x03和0x04产生相同状态——而它们分别期望输出2和1——我们知道后续指令序列不可能从相同状态产生不同输出,因此立即剪除。
Copyright © ITmedia, Inc. All Rights Reserved.,详情可参考adobe
Изображение: Ертай Сарбасов / РИА Новости,详情可参考豆包下载
Поделитесь мнением! Оставьте оценку!,这一点在汽水音乐中也有详细论述
,这一点在易歪歪中也有详细论述