leo Спасибо за пояснения. Да, MEM-планировщик - о нем я читал, но налагаемые ним ограничения на выполняемый код как-то выпали из головы :(...
Собственно, аттач - глючит форум, аттач не цепляется. Сейчас выложу на рапиду, а здесь дам линк....
Изображение действительно 720*288, обрабатывается блоками по 720*8*2, т.к. каждый байт исходного изображения преобразуется к знаковому слову. В...
Ну я рассчитывал на полную входную пропускную способность по шине памяти. Иными словами, 720 * 288 = 207360 - размер одного фрейма, тогда 3200 /...
Пусть имеется восьмибитное изображение шириной 720 точек и высотой 8. Таким образом общий размер блока составляет 5760 байт, что меньше размера L1...
Для таких случаев и придумали ключевое слово volatile. Сейчас точно уже не вспомню порядок слов в объявлении, но должно быть нечто из разряда:...
Угу, он меня в основном ;) По поводу "лишних" тактов - тоже почти разобрался. Оказывается пустой call с немедленным return, обрамленный rdtsc...
Вообще говоря, int 16h не вызывается из обработчика int 9h. Обработчик int 9h просто складывает скан-коды клавиш в фифо-буффер, а int 16h их...
Пусть есть массив из 64 12-разрядных знаковых чисел. Весь массив необходимо разделить на некоторые фиксированные значения. Делитель первого...
Цикл, который я пытался анализировать был все же посложнее ;) Теперь с твоим объяснением все стало на свои места. Я думал, что мопы раздваиваются...
leo Есть еще такой вопрос. Пусть мы имеем последовательность команд следующего вида: paddw mm0,dc_corr paddw mm1,dc_corr paddw mm2,dc_corr paddw...
Естественно, входные данные являются случайными - просто бинарный поток на сжатие. В текущей реализации счетчики являются двордами, однако переход...
Собственно $subj ;) В самом простом случае это может быть сделано следующим образом: mov esi,[ebx]Context.SrcBufferRdPtr mov...
Есть еще одна идиотская странность - операции с intermediate constant всегда получаются медленнее, нежели та же операция но с регистровым...
В моем случае ворды знаковые, в интервале [-2047..2047], потому пришлось наложить маску 0x7FFFFFFF сразу после sub eax,1. Со времени опубликования...
leo Сегодня таки прикрутил код с зигзагообразным обходом матрицы. Результаты несколько удручающие :( x86 Family 15 Model 4 Stepping 3 - 2 такта...
Прежде всего, огромное спасибо за информацию. D1, D2 и D3 - я считал, что после стадии Dispatch мопы попадают непосредственно в очередь запуска...
leo посмотри пожалуйста zip-файл - там Excel таблица с моей первой попыткой научного планирования потока инструкций для P4. Код, который там...
Ustus А какое принципиальное значение имеет скорость обучения процессора шаблону переходов? Главное знать принцип построения шаблона переходов,...
leo К сожалению во время копирования нажал не ту кнопку и часть поста №23 удалилась. Фактически необходимо знать индекс последней ненулевой...
Имена участников (разделяйте запятой).