芭樂永生

2009年1月10日 星期六

ZLIB::inflate

把原本 inffas32.asm 不必要的 code 刪除,
並且把主要的 loop entry 作 alignment 16 動作,
效能變成如下:
zlib:3AE1AFF,5830144
zliX:500B347,5830144,0
asm :4207B7E,5830144,0
C  :60E05C8,5830144,0

之後發現到 SSSE3 的 pshufb 用處,
這指令真的比原本的那些 pshufw, pshufd 好用太多了,
用法整個不一樣.
所以效能增進到:
zlib:3A8F054,5830144
zliX:4FFC213,5830144,0
asm :4208A0D,5830144,0
C  :60C5176,5830144,0

標籤:

0 Comments:

張貼留言

<< Home