Как построить график и определить формулу по имеющимся точкам (автоматически). И немного про регрессионный анализ

Как построить график и определить формулу по имеющимся точкам (автоматически). И немного про регрессионный анализ Математика, Школа, График, Математический анализ, Образование, Длиннопост

Если хотите сразу быстро, прокрутите до части II.


Существуют разные математические операции.

► 1. Известны два слагаемых — нам требуется операция сложения.

Пример:
2+3 = a
a = 5

► 2. Известно одно слагаемое и результат — нам требуется операция вычитания.

Пример:
1+a = 2
a = 2-1
a = 1

► 3. Известны два множителя — нам требуется операция умножения.

Пример:
3*4 = a
a = 12

► 4. Известен один множитель и результат — нам требуется операция деления.

Пример:
2*a = 6
a = 6/2
a = 3

► 5. Известно число и степень, в которую оно возводится, — нам требуется операция возведения в степень.

Пример:
5^2 = a
a = 25

► 6. Известна степень, в которую возводится число, и результат — нам требуется операция извлечения корня (или возведение в дробную степень).

Пример:
a^3 = 27
a = ∛27 = 27^(1/3) = 3

► 7. Известно число и результат, который получается при возведении числа в некоторую степень, — нам требуется логарифм.

Пример:
4^a = 64
a = log_4(64)
a = 3

(если кто не знал, как связана возведение в степень, извлечение корня и нахождение логарифма)

Как построить график и определить формулу по имеющимся точкам (автоматически). И немного про регрессионный анализ Математика, Школа, График, Математический анализ, Образование, Длиннопост

► 8. Известна формула графика и значение аргумента. Если мы хотим узнать значения функции — нам требуется подставить значение в формулу.

Пример:
y = 2 * x + 4,
где x = 3, тогда
y = 2 * 3 + 4
y = 10

► 9. Известна формула графика и значение функции. Если мы хотим узнать значение аргумента — нам требуется подставить значения в формулу.

Пример:
y = 3 * x^2 + 2,
где y = 29, тогда
29 = 3 * x^2 + 2
27 = 3 * x^2
x^2 = 9
x = √9
x = 3
Как построить график и определить формулу по имеющимся точкам (автоматически). И немного про регрессионный анализ Математика, Школа, График, Математический анализ, Образование, Длиннопост

► 10. Известны два или несколько значений аргумента и принимаемых при этом значений функции. Хотим узнать формулу графика. Для этого нам требуется регрессионный анализ.

Так что то, что делалось в школе было своеобразной подготовкой, пусть и на более простых линейных уравнениях.



Впрочем, вот готовый инструмент.

Вставляйте в качестве X и Y показатели, и будет рассчитываться коэффициенты для графика.

=====

► https://www.desmos.com/calculator/rscgfhrhe3 ◄

=====

Как построить график и определить формулу по имеющимся точкам (автоматически). И немного про регрессионный анализ Математика, Школа, График, Математический анализ, Образование, Длиннопост

Если вы ещё не знакомы с Desmos, то это очень удобный сервис по построению графиков, решению задач и прочему.

Помимо построений по заданным точкам и формулам, если графиков несколько, то можно их нарисовать несколько, а потом определить их точки пересечения.

Есть и возможность "зарисовывать" области, что помогает при интегралах, там же можно добавлять граничные условия, многое другое.

Подробнее можно почитать и посмотреть тут (пройтись по всем интерактивным примерам):

https://learn.desmos.com/

ТЕОРИЯ РЕГРЕССИОННОГО АНАЛИЗА


А). В общем случае график функции выглядит так. Линейная зависимость.

y = k * x + b
где k — часто угол наклона,
b — часто величина подъёма.
В обычном случае подставляются значения первой и второй точки, решается система уравнений. Но можно использовать инструмент выше.


Б). Ещё в более общем виде график может выглядеть так. Нелинейная (часто квадратичная) зависимость.

y = k * x^n + b
где n — позволяет описать степенную функцию (аналог параболы при положительных значениях выше 1, гипербола при отрицательных). Часто n=2.

В). Иногда может быть логарифмическая зависимость:

y = k * ln(x) + b

В реальной жизни часто имеются "точки" (показатели X, Y) и бывает нужно найти хотя бы приблизительную "формулу графика", некоторые тенденции — такие данные суть статистики.

А статистика применяется в различных сферах знаний — медицина, социальные науки, финансы, эконометрика и др.


Например, ориентировочно знаем, на сколько увеличивается выпуск продукции при росте капиталовложений (X1, Y1; X2, Y2; X3, Y3). Вероятно, будет некоторая логарифмическая зависимость, получилась бы какая-то формула. А была бы формула, могло бы быть интересно, сколько будет Y4 при заданном X4.


Или, например, имеются показатели ВВП на душу населения (с поправкой на инфляцию) за 10 лет. И показатели продаж, ну, допустим, импортных автомобилей. Будет, скорее всего, некоторая линейная зависимость. И если точный график мог бы не так помочь, то как минимум приблизительно можно было судить о некоторой взаимозависимости факторов (или, так называемой, "корреляции"), которая может быть как положительной (растёт X, растёт Y), так и отрицательной (растёт X, падает Y). Аналитиками также мог бы добавиться дополнительный показатель, так называемый коэффициент "автокорреляции" (поправка на время), поскольку в этом примере идёт некоторый анализ "временных рядов".


А то, насколько приблизительно "правильной" получится модель, мог бы сказать, так называемый, показатель R^2, его ещё называют "коэффициентом детерминации". Который характеризует "плотность выборки" (чем ближе к 1, тем точнее), или точность между имеющимися точками и проходящим через них графиком.

Например,
y = k * x + b
x = [1, 2, 3]
y = [1, 3, 5]
даст
R^2 = 1
k = 2
b = -1

Потому что это та самая формула.


А предположи мы, что формула

y = k * x^2 + b,
тогда
R^2 = 0,9796
и менее красивые коэффициенты k и b.

Что очень близко, согласитесь, положительная часть графика параболы ведь почти проходит через нужные точки, поэтому он и не равен 1 (иногда в реальных задачах по анализу тенденций показатель R^2 до 0,9 — считается вполне терпимым, хотя лучше 0,99+).

Как построить график и определить формулу по имеющимся точкам (автоматически). И немного про регрессионный анализ Математика, Школа, График, Математический анализ, Образование, Длиннопост

Пример:

https://www.desmos.com/calculator/okysxt3tam

В заключение.

Сначала идёт "сложение", потом "умножение", затем базирующееся на этом "возведение в степень". Увеличивается уровень абстракции, пусть и можно было бы обойтись одним сложением и вычитанием (например, как при японском способе умножения требуются только эти две простые операции).


Так что изучение базы в целом полезно, а также важен подход к обучению. Тогда можно во многом разобраться, в том числе и с регрессией и всяким таким.


Надеюсь, было немного интересно.

Два графика с Desmos. Остальное собственное — CC0.

Лига образования

4.5K поста21.9K подписчиков

Добавить пост

Правила сообщества

Публиковать могут пользователи с любым рейтингом. Однако мы хотим, чтобы соблюдались следующие условия:


ДЛЯ АВТОРОВ:


Приветствуются:

-уважение к читателю и открытость

-желание учиться

Не рекомендуются:

-публикация недостоверной информации


ДЛЯ ЧИТАТЕЛЕЙ:


Приветствуются:

-конструктивные дискуссии на тему постов

Не рекомендуются:

-личные оскорбления и провокации

-неподкрепленные фактами утверждения


В этом сообществе мы все союзники - мы все хотим учиться! :)

Вы смотрите срез комментариев. Показать все
Автор поста оценил этот комментарий

Очень похоже на интерполяцию, это оно?

раскрыть ветку (1)
Автор поста оценил этот комментарий

Спасибо за вопрос! Да, Вы отчасти правы, хотя не на 100%.

I. Есть несколько терминов.
1. Интерполяция. Это когда у нас есть значения (которые, разумеется, также можно оформить в график) и мы хотим найти ПРОМЕЖУТОЧНОЕ значение между ними.
2. Экстраполяция. Это когда у нас есть значения и мы хотим найти СЛЕДУЮЩИЕ за ними значения. В этом контексте, контексте "прогнозирования" это похоже на Регрессионный анализ.

3. Регрессионный анализ. Это когда у нас есть значения и мы хотим определить приблизительную формулу, которая охарактеризует эти точки как систему (с помощью формулы, конечно, можно и определить примерные ПРОМЕЖУТОЧНЫЕ значения, как в интерполяции, и СЛЕДУЮЩИЕ (или предыдущие) значения, как в экстраполяции.
Это прикладной смысл.

Справочно:
Есть ещё Аппроксимация. Это самый широкий термин, включает всё, что описывается выше, но и другое (например, полиномиальные уравнения n-степени и разное всякое). Упрощённо означает функциональный анализ, хотя не только.



II. Математический смысл
И регрессионный анализ, и (интерполяция | экстраполяция) позволяют предсказать возможные значения. Отсюда резонный вопрос.
А ПРЕДСКАЗАНИЕ (реальные цифры-то) регрессионный анализ даст такие же, как (интерполяция | экстраполяция).
► Ответ: нет, разные.
► Упрощённый ответ: разные, потому что формулы одного и другого разные.
► Усложнённый ответ: как за интерполяцией и экстраполяцией, так и за регрессионным анализом не стоит какой-то магии, существует описываемый процесс подсчётов и всё такое. В частности, регрессионный анализ использует "метод наименьших квадратов", МНК, или OLS. Интер-/экстраполяция, если в широком смысле, имеет другую формулу подсчёта.

Есть утверждения, что в целом регрессионный анализ даст более "правильный" ответ.
Вот тут можете посмотреть формулы того и другого и обсуждение:

https://stats.stackexchange.com/a/208657

https://stats.stackexchange.com/questions/87305/difference-b...

https://stats.stackexchange.com/questions/103209/time-series...
https://en.wikipedia.org/wiki/Approximation_theory

И, если кому понадобится, ещё более углублённый анализ сравнения регрессии с экстра-интерполяцией, как стартовую точку:
https://web.archive.org/web/20160327072532/www.phil.vt.edu/dmayo/personal_website/SPanos 2010.pdf

В целом тема интересная.
Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку