Статистика для гидрологических расчетов

Logon

Умнофорум, прошу совета в статистической практической работенке, моих знаний недостаточно
есть бассейн большой реки, на этом бассейне размещены пункты наблюдений, энное количество, периоды наблюдений различны - от 108 до 35 лет.
Ряды данных с этих пунктов статистически обрабатываются, они однородные, нужно это все для гидрологических расчетов.
Грубо говоря, 108-летний ряд дает такую картинку:

Исходники этой картинки - два столбца цифр, один - год, второй - значение
с помощью этого ряда определяются значения требуемой обеспеченности, все это используется в работе, тут вопросов нет.
Вопрос возникает вот какой - есть ли какой-нибудь математический/статистический метод, позволяющий оценить не само значение, а год, в который оно было?
Хочется попробовать выделить группы лет, в которых значения были максимальными (менее 10% повышенного (10-25% среднего (25-75 ну и пониженного (более 75).
Вручную это делать очень муторно, хочется посмотреть что-то более продвинутое

Jeton89

Сами исходники-то с годами есть?

Logon

есть конечно.

Jeton89

Я может быть чего-то недопонял, но в чем тогда проблема?
Пишется простая програмка, которая для данного года расчитывает требуюмую величину и сравнивает с заданным порогом.

Logon

но в чем тогда проблема?
Пишется простая програмка
вот в этом и проблемка
Сейчас моих воспоминаний по програмированию хватит максимум на то, чтобы нарисовать окружность или запустить датчик случайных чисел.
У меня есть подозрения, что задача вполне каким-нибудь уже имеющимся пакетом-прогой решается, вот хотел узнать, есть что-то подобное

Jeton89

Ну кидай сюда файлы и формулу расчета. Делов на 5 минут. Думаю кто-нибудь напишет. Ну или я как-нибудь вечерком.
Чего на выходе-то надо? Список годов, где значение превышает порог?

Logon

гммм, а что это будет стоить? и точно нет уже готовых пакетов?

Jeton89

Да ничего не будет стоить, кидай данные. Доброфорум же.
Я надеюсь, правда, что все правильно понял и нужно из одной таблички данных выбрать данные удовлетворяющие критерию больше\меньше и записать во второй файл.

griz_a

Если просто нужно разбить данные на группы данного размера по большинству, то это легко даже в Экселе делается. К каждому данному приписывается ранг, потом с помощью "если" приписывается в следующую колонку номер группы в зависимости от ранга.

Logon

Так, а тогда попробую усложнить задачу, хотелось бы узнать о возможностях ее выполнения:
есть такая процедура, как "восстановления ряда".
То есть, если есть ряд 108-летний (с 1904 по 2012) и есть ряд 35 летний (с 1977 по 2012 то по определенным формулам, этот 35 летний ряд "восстанавливают" до длины в 108.
Насколько возможно сделать восстановление не по значениям, а по годам?
То есть, если видно (по ряду 108 летнему что 2012 год дает значение 1%, то в ряду 35-летнем значению 2012 года присваивается 1% обеспеченность, весь период оценивается таким образом, и недостающий для восстановления цифры получаются от годов?

Jeton89

Похоже на обычную экстраполяцию. Думаю тоже не особо сложно.

kshangin

Возможно, нагляднее будет просто условное форматирование - цвет ячейки в зависимости от значения.

seregaohota

да кидай исходники, я тебе сделаю
хочешь в Ёкселе, хочешь отдельной программкой на языке программирования по твоему выбору
загрузи файл на форум ну или в привате смотри

Logon

Статистики, а еще вопрос:
есть даты наступления ледового явления, в диапазоне с апреля по июнь, как грамотно обработать эти данные? Стоит задача получить обеспеченность "дат наступления" - просто положить даты на кривую не получается, вот думаю попробовать обозначить дату через "номер дня в году", но тут сомнения берут, что брать за ноль - новый год или же какую-то другую дату, связанную с этим событием?
Или же есть более грамотная метода вероятностного расчета дат?

sanychtks

если первая дата a
последняя дата b
можно преобразовать даты по простой формуле типа (x-a)/(b-a)
и смотреть на [0,1] например

Logon

хммм...
еще раз - у меня есть период наблюдения, 80 лет, 80 дат.
самая ранняя дата - 1 мая, самая поздняя - 15 июня.
Х в твоей формуле - это что?

kshangin

X - текущая (каждая из 80 по очереди)

Logon

понял, туплю.
ни разу не сталивался с подобной формулой

kshangin

Это нормировка на размах данных. Мне больше нравится нормировка на дисперсию и вычитание среднего (автошкалирование с центровкой) - стандартная нормировка в многомерном анализе, но я не очень понимаю, что дальше с твоими данными происходит, может, на размах будет даже лучше.
Оставить комментарий
Имя или ник:
Комментарий: