Цель
работы:
·
Освоить
приемы и средства обработки данных;
·
Научиться
пользоваться и применять различные статистические функции при анализе данных и
получения графиков;
·
Знать
основные численные методы, используемые в MathCad для проведения статистического анализа.
Задания:
1.
По
заданным в виде векторов, или электронных таблиц испытательным данным и используя встроенные функции выполнить
одномерную сплайн-интерполяцию и аппроксимацию;
2.
С
помощью статистических функций рассчитать среднее значение элементов вектора,
дисперсию для элементов вектора, среднеквадратическую погрешность (квадратный
корень из дисперсии), стандартное отклонение элементов вектора, вектор частот
попадания данных в заданные интервалы;
3.
Выполнить
линейную регрессию для совокупности данных с использованием ряда функций;
4.
Выполнить
линейную регрессию общего вида для совокупности данных с использованием ряда
функций;
5.
Выполнить
нелинейную регрессию общего вида с использованием ряда функций;
6.
Выполнить
экспоненциальную и синусоидальную регрессию для совокупности данных с
использованием ряда функций;
7.
Используя
статистические функции MathCad,
осуществить сглаживание данных;
8.
Выполнить
предсказание (экстраполяцию) по некоторой совокупности данных.
Выполнение
одного варианта задания
1. Линейная интерполяция. Функция linterp(vx,vy,x).
vx, vy - векторы данных, причём данные должны быть упорядочены по возрастанию.
x - аргумент,
для которого возвращается значение y.
Кубическая
сплайн-интерполяция позволяет провести через набор точек гладкую кривую так,
чтобы в этих точках были непрерывны первая и вторая производные. Интерполяция
осуществляется двумя функциями. Вначале вычисляется вектор вторых производных в
рассматриваемых точках vs:=cspline(vx,vy), затем вычисляется значение функции в точке x interp(vs,vx,vy,x).
Попробуем
интерполировать рассмотренный набор точек с использованием трёх различных
вариантов кубической интерполяции.
2. В MathCAD
2001 имеется ряд встроенных функций для расчетов числовыхстатистических
характеристик рядов случайных данных.
- mean(x) - выборочное среднее значение;
- median (х") - выборочная медиана (median) - значение аргумента, которое делит гистограмму
плотности вероятностей на две равные части;
- var(x) - выборочная дисперсия (variance);
- stdev(x) - среднеквадратичное
(или "стандартное") отклонение (standard
deviation);
- max(x), min(x) -
максимальное и минимальное значения выборки;
- mode(x) - наиболее часто встречающееся значение
выборки;
- Var (x), stdev(x) -
выборочная дисперсия и среднеквадратичное отклонение в другой нормировке;
3. В отличие от
интерполяции, регрессия не требует, чтобы кривая непременно проходила через все
точки. Напротив, задача ставится так: построить кривую, наиболее близко, в
смысле минимального среднеквадратичного отклонения, описывающую данный набор
точек.
Для точек данных, из предыдущего занятия, необходимо построить
прямую y=kx+b, сумма квадратов отклонений всех точек
от которой будет минимальной.
Параметры этой
прямой возвращают две встроенные функции Mathcad:
k=slope(vx,vy) - угловой коэффициент,
b=intercept(vx,vy) -
свободный член.
4. Для
построения полинома n-го порядка, описывающего данный
набор точек, используется функция интерполяции interp(vs,vx,vy,x), где vs - вектор вторых
производных вычисляется при помощи функций regress(vx,vy,n) или loess(vx,vy,span). Отличие последних функций заключается в том,
что первая из них строит полином n-го порядка, а
вторая, строит несколько таких полиномов, их количество определяется величиной
последнего параметра span.
5.,6. Описать
зависимость в виде линейной комбинации произвольных функций, например, в виде
комбинации синусов и косинусов, как в разложении Фурье, или какого-то другого
набора функций.
7. Сглаживание
предполагает использование набора значений y и возвращение нового набора y,
который является более гладким, чем исходный набор. Имеется набор из 3-х
функций, реализующих различный алгоритм
сглаживания:
medsmooth(vy,n) - метод скользящей медианы,
ksmooth(vx,vy,b) - метод Гаусса,
supsmooth(vx,vy) - метод наименьших квадратов.
Все эти функции
возвращают новый набор значений функции. n - ширина окна сглаживания, b -
параметр сглаживания (должен быть больше интервала между точками).
8. В Mathcad есть функция predict(v,m,n), которая позволяет сделать предсказание поведения
функции вне интервала её задания. Эта функция использует линейный алгоритм
предсказания. Здесь v - вектор данных, m
- количество последовательных точек исходного вектора используемых для предсказания
(все точки заданны с равным шагом), n - количество предсказываемых точек.
Контрольные вопросы:
1.
Какие
функции MathCad способны осуществить
сплайн-интерполяцию, аппроксимацию и чем они отличаются?
2.
С
помощью каких статистических функций можно рассчитать
в MathCad статистические
показатели?
3.
Чем
отличается линейная регрессия от линейной регрессии общего вида?
4.
Какие параметры и какого типа входят в
функцию для проведения нелинейной регрессии общего вида?
5.
Какие
функции способны осуществить сглаживание данных?
6.
Что
из себя представляет и какими функциями осуществляется
предсказание?