Поиск максимума и минимума

Yashin_Sergey · 15 июн 2007

UbIvItS сказал(а):

Когда сделал первый цикл. Смотришь что у тебя с левого конца, если элемент равен минимуму/максимуму, то тогда пересчитывать массив. Если не равен, то просто сравниваешь минимуму/максимуму со следующий элемент за элементом с правого конца диапазона. Это и будет новыйе минимуму/максимуму для следующей точки.Ускорение будет, так как циклов будет гораздо меньше 200 тыс. Дальше все зависит от данных. Идею можно развить дальше.
Нажмите, чтобы раскрыть...

этот способ вообще непонятен: если блоки по 10000 элементов друг с другом несвязаны, то говорить о нахождении лучшего алгоса, чем простой перебор (имею ввиду неотсортированный массив) нельзя.
Yashin_Sergey
ты сравнивал результаты старого и нового метода??? - конечный результат сошелся??
Нажмите, чтобы раскрыть...

старый способ длится ~10585ms.
новый способ длится ~83ms.

Yashin_Sergey · 15 июн 2007

maxdiver сказал(а):

Yashin_Sergey
Но разве тогда на элементарном тесте 1,2,3,... не будет тормозить? По-моему будут те же несколько секунд.
Нажмите, чтобы раскрыть...

я не совсем понял вопроса, но время обсчета по сравнению со "старым" способом приведено выше.

asmfan · 15 июн 2007

pmax*, pmin* для байтов и вордов.
maxp*, minp* для флотов и даблов.

maxdiver · 15 июн 2007

Yashin_Sergey

Но разве тогда на элементарном тесте 1,2,3,... не будет тормозить? По-моему будут те же несколько секунд.
Нажмите, чтобы раскрыть...

я не совсем понял вопроса, но время обсчета по сравнению со "старым" способом приведено выше.
Нажмите, чтобы раскрыть...

Ну вот массив: 1,2,3,...
Ну просчитал он первые 10000 чисел, получил min=1. Передвинулся вправо на 1 - получили, что "потерянный" элемент = min, значит, нужно пересчитать всё заново - 10000 сравнений. И т.д. на каждом шаге, т.е. получилось не лучше обычного перебора.
Или я не так понял алгоритм?

UbIvItS · 16 июн 2007

maxdiver
я вот о том же: мы имеем дело с неотсортированым массивом, у коего сегменты по 10000 эл. друг с другом не связаны - ускорение выглядит подозрительно: скорей всего алгос выдаёт неверный результ.

leo · 16 июн 2007

maxdiver

Ну вот массив: 1,2,3,...
Нажмите, чтобы раскрыть...

UbIvItS

я вот о том же: мы имеем дело с неотсортированым массивом, у коего сегменты по 10000 эл. друг с другом не связаны
Нажмите, чтобы раскрыть...

Значит не о том, же а о противоположном Это нормальный статистический алгоритм, который дает заметный выигрыш на случайном наборе чисел, но с определенной вероятностью может нарваться на неудачную последовательность, но в любом случае окажется не хуже тупого перебора. А с точки зрения статистики чем больше диапазон разбороса случайных чисел и больше длина анализируемого отрезка тем больше выигрыш. Поэтому ускорение в сотню с чем-то раз при длине в 10 тыс. для более или менее случайных данных не выглядит чересчур подозрительным. Ну а для монотонного или периодического изменения ес-но никакого выигрыша не будет

maxdiver · 16 июн 2007

leo
Да, я понимаю, что на среднестатистических данных этот алгоритм будет хорош. Но вот в вырожденном случае - он будет очень сильно тормозить (правда, я не знаю, насколько приемлемо такое торможение - может, в данном конкретном случае и 10 секунд на одном тесте - нормально). Тем более что этот тест совсем нетрудно сделать - тривиальная арифметическая прогрессия, да и вообще любые почти отсортированные данные.

Так вот, как насчёт дерева (тем более, что в C++ это уже готовый map)?

S_Alex · 16 июн 2007

? Что значит - соседних?
10 000 в какую сторону от текущего?
Ели первый текущий то следующие 9 999 соседи?
Ну а если последний то предидущие 9 999 соседи?
Или брать половину до и половину после текущего элемента?

UbIvItS · 16 июн 2007

leo
не совсем я понимаю о какой статистике речь тут можно вести: мы не узнаем статистику сегмента - пока не переберём его элементы - все???...?????

asmfan · 16 июн 2007

Если уж речь зашла о статистике, то первоначальная задача должна ставиться "найти... с вероятностью...". Иначе на случайном наборе только перебор.

maxdiver · 17 июн 2007

asmfan
Не, ну перебор за O(n*m) не обязателен. Я говорю, можно деревом - за O(n*ln(m)).
Просто ещё не факт, что последнее окажется быстрее первого
Вот мне и интересно - будет ли дерево с O(ln(m)) быстрее перебора с O(m)?

asmfan · 17 июн 2007

Дерево - это просто способ хранения, который зачастую подразумевает упорядочение элементов для дальнейшего использования. А если эти данные никому дальше не нужны? А нужны только максимум и минимум.
Короче, дерево строить ещё надо, точнее растить.

leo · 17 июн 2007

maxdiver

Но вот в вырожденном случае - он будет очень сильно тормозить
Нажмите, чтобы раскрыть...

Ну и пусть тормозит Если по условию задачи такой случай невозможен или маловероятен, то и париться с ним незачем Мы же не знаем, что из себя представляет этот массив и автор на эту тему молчит, но судя по выигрышу в скорости это достаточно (квази)случайный набор чисел

UbIvItS

не совсем я понимаю о какой статистике речь тут можно вести: мы не узнаем статистику сегмента - пока не переберём его элементы - все???...?????
Нажмите, чтобы раскрыть...

Знать статистику сегмента в смысле вероятностных характеристик нужно только в статистически оптимальных алгосах, а в субоптимальных и эвристических бывает достаточно лишь некоторых предположений о случайном или квазислучайном характере процесса

asmfan

Если уж речь зашла о статистике, то первоначальная задача должна ставиться "найти... с вероятностью...".
Нажмите, чтобы раскрыть...

Сама задача ставится детерминированно, но время ее решения может зависеть от статистики распределения чисел в массиве. Классический пример - алгоритмы быстрого поиска строк а-ля Бойер-Мур, котрые при неудачных сочетаниях окончания искомой строки и статистики распределения символов в тексте могут работать заметно хуже. Например, если потребовать, чтобы искомая строка заканчивалась на несколько пробелов, то на файлах типа m32lib\windows.inc с огромным числом серий пробелов, результаты некоторых алгоритмов получаются заметно хуже, чем для других "благоприятных" сочетаний (см.цифры)

UbIvItS · 17 июн 2007

leo
не знаю - изложенный метод не тянет на статистический: для вероятностных оценок нужно делать случайную выборку: либо сегментов (с их полной обработкой), либо в каждом сегменте элементов (20% эл. к примеру). Но как я понял, речь изначально шла о детерменированном алгосе.

pas · 17 июн 2007

Yashin_Sergey
Можно хранить вместе со значением элемента хранить заранее вычесленные для него мин и макс.
Хотя это приведет к увеличению объема.

leo · 18 июн 2007

UbIvItS

изложенный метод не тянет на статистический
Нажмите, чтобы раскрыть...

Да что ты уперся в "заумные" статистические методы
Пример: выборочное среднее - статистическое понятие ? Да. А алгоритм расчета - детерминированный ? Для стационарного процесса с неизменным средним - да. Т.е. для получения оценки среднего значения никакого распределения вероятностей процесса знать не нужно, достаточно знать что он стационарный. А вот если не стационарный и среднее значение изменяется во времени, тогда приходится использовать скользящее среднее в окне и нужно из каких-то соображений задавать размер окна усреднения.
ВОЗМОЖНО, в рассматриваемой задаче аналогичная ситуация, только вместо среднего значения нужно определять размах значений (Min,Max) на интервалах корреляции 10тыс. отсчетов и смотреть как эта величина изменяется во времени. И при чем тут вероятностные характеристики сегментов - не понятно

UbIvItS · 18 июн 2007

leo

А вот если не стационарный и среднее значение изменяется во времени, тогда приходится использовать скользящее среднее в окне и нужно из каких-то соображений задавать размер окна усреднения.
Нажмите, чтобы раскрыть...

вот и вопрос как это узнать не перебрав элементы??..?? впрочем, мне не ответели: сошлись ли результаты второго и первого метода.

Yashin_Sergey · 18 июн 2007

UbIvItS сказал(а):

Когда сделал первый цикл. Смотришь что у тебя с левого конца, если элемент равен минимуму/максимуму, то тогда пересчитывать массив. Если не равен, то просто сравниваешь минимуму/максимуму со следующий элемент за элементом с правого конца диапазона. Это и будет новыйе минимуму/максимуму для следующей точки.Ускорение будет, так как циклов будет гораздо меньше 200 тыс. Дальше все зависит от данных. Идею можно развить дальше.
Нажмите, чтобы раскрыть...

этот способ вообще непонятен: если блоки по 10000 элементов друг с другом несвязаны, то говорить о нахождении лучшего алгоса, чем простой перебор (имею ввиду неотсортированный массив) нельзя.
Yashin_Sergey
ты сравнивал результаты старого и нового метода??? - конечный результат сошелся??
Нажмите, чтобы раскрыть...

Сошлелся естественно.

Yashin_Sergey · 18 июн 2007

maxdiver сказал(а):

Yashin_Sergey

Но разве тогда на элементарном тесте 1,2,3,... не будет тормозить? По-моему будут те же несколько секунд.
Нажмите, чтобы раскрыть...

я не совсем понял вопроса, но время обсчета по сравнению со "старым" способом приведено выше.
Нажмите, чтобы раскрыть...

Ну вот массив: 1,2,3,...
Ну просчитал он первые 10000 чисел, получил min=1. Передвинулся вправо на 1 - получили, что "потерянный" элемент = min, значит, нужно пересчитать всё заново - 10000 сравнений. И т.д. на каждом шаге, т.е. получилось не лучше обычного перебора.
Или я не так понял алгоритм?
Нажмите, чтобы раскрыть...

Всё так, этим самым переборов получается меньше т.к. мин. или макс. не обязательно будут располагаться в конце окна.

Yashin_Sergey · 18 июн 2007

UbIvItS сказал(а):

maxdiver
я вот о том же: мы имеем дело с неотсортированым массивом, у коего сегменты по 10000 эл. друг с другом не связаны - ускорение выглядит подозрительно: скорей всего алгос выдаёт неверный результ.
Нажмите, чтобы раскрыть...

Если внимательно почитать суть алгоритма то ничего сверхественного в данной оптимизации нет,
она основанная на том, что бы исключить перебор на каждом элементе.

Войти или зарегистрироваться

Поиск максимума и минимума

Yashin_Sergey Сергей

Yashin_Sergey Сергей

asmfan New Member

maxdiver Max

UbIvItS Well-Known Member

leo Active Member

maxdiver Max

S_Alex Alex

UbIvItS Well-Known Member

asmfan New Member

maxdiver Max

asmfan New Member

leo Active Member

UbIvItS Well-Known Member

pas New Member

leo Active Member

UbIvItS Well-Known Member

Yashin_Sergey Сергей

Yashin_Sergey Сергей

Yashin_Sergey Сергей

Войти или зарегистрироваться

Поиск максимума и минимума

Yashin_Sergey Сергей

Yashin_Sergey Сергей

asmfan New Member

maxdiver Max

UbIvItS Well-Known Member

leo Active Member

maxdiver Max

S_Alex Alex

UbIvItS Well-Known Member

asmfan New Member

maxdiver Max

asmfan New Member

leo Active Member

UbIvItS Well-Known Member

pas New Member

leo Active Member

UbIvItS Well-Known Member

Yashin_Sergey Сергей

Yashin_Sergey Сергей

Yashin_Sergey Сергей

Быстрый поиск