Shur Gray> "Помнится, во времена 8086, я обнаружил, что NOP выполняется дольше чем xchg ax,ax. " Shur >"...при том, что athlon выполняет...
S_T_A_S_ 1. В реальной задаче надо вычислять: y+=z; z+=d; где d - число большое - 500-1000 бит. т.е d в непосредственный операнд не целиком...
S_T_A_S_ > "Я до сих пор не вижу постановку задачи, что оптимизировать-то? ... Как я понял, оптимизировать можно совершенно не те сложения,...
leo Пару слов про вставку нопов. Помнится, во времена 8086, я обнаружил, что NOP выполняется дольше чем xchg ax,ax. И для выравнивания нопы...
Давным-давно, в те времена, когда компьютеры были большие, а память маленькой, когда гибкий диск был действительно гибким, а словосочетание...
Получился, однако, у меня зело быстрый вариант на ММХ: pxor mm0,mm0 lea...
bogrus "... то почему бы не развернуть цикл ..." "Цикл закончить к примеру ret-ом , а управление передавать на зависящее от длины...
Исключительно для очистки совести (и стараясь не слишком задумываться) я написал вариант MMX решения. mm0 используется для храненея CF. Это...
S_T_A_S_ Вы все правильно говорите, но я ведь упрощал задачу, написав d=1, дабы не забивать головушки коллегам продробностями. Давайте все же...
semen "Хе - это могло испортить все тесты - вдруг какой-то вариант был случайно алигненым а другой нет? Правда на П4 это влияет тока на 1й...
The Swin >"Давайте поточнее определимся с задачей, тогда можно будет делать корректные сравнения..." Прелесть задачи в том, что формат чисел...
leo > „на P4 1.8GHz получилось, что из приведенных методов исходный add2 самый быстрый, метод TheSwin на 27% хуже“ Странно, а у меня метод...
TheSvin, очень изящное решение, сэр. Быстрее на 10-15%. RobinFood, leo, S_T_A_S_ то что lods/stos вариант работает медленнее - проявление...
Arvensis, числа хранятся двойными словами, но можно формат хранения и поменять, если это позволит складывать быстрее. Как предлагаешь? Может add...
Складываем два длинных-предлинных числа X и Y (Y<X). Вычисляем X=X+Y. Основной цикл сложения выглядит так: cikl: mov eax,[esi] lea...
Имена участников (разделяйте запятой).