Как построить график и определить формулу по имеющимся точкам (автоматически). И немного про регрессионный анализ

Как построить график и определить формулу по имеющимся точкам (автоматически). И немного про регрессионный анализ Математика, Школа, График, Математический анализ, Образование, Длиннопост

Если хотите сразу быстро, прокрутите до части II.


Существуют разные математические операции.

► 1. Известны два слагаемых — нам требуется операция сложения.

Пример:
2+3 = a
a = 5

► 2. Известно одно слагаемое и результат — нам требуется операция вычитания.

Пример:
1+a = 2
a = 2-1
a = 1

► 3. Известны два множителя — нам требуется операция умножения.

Пример:
3*4 = a
a = 12

► 4. Известен один множитель и результат — нам требуется операция деления.

Пример:
2*a = 6
a = 6/2
a = 3

► 5. Известно число и степень, в которую оно возводится, — нам требуется операция возведения в степень.

Пример:
5^2 = a
a = 25

► 6. Известна степень, в которую возводится число, и результат — нам требуется операция извлечения корня (или возведение в дробную степень).

Пример:
a^3 = 27
a = ∛27 = 27^(1/3) = 3

► 7. Известно число и результат, который получается при возведении числа в некоторую степень, — нам требуется логарифм.

Пример:
4^a = 64
a = log_4(64)
a = 3

(если кто не знал, как связана возведение в степень, извлечение корня и нахождение логарифма)

Как построить график и определить формулу по имеющимся точкам (автоматически). И немного про регрессионный анализ Математика, Школа, График, Математический анализ, Образование, Длиннопост

► 8. Известна формула графика и значение аргумента. Если мы хотим узнать значения функции — нам требуется подставить значение в формулу.

Пример:
y = 2 * x + 4,
где x = 3, тогда
y = 2 * 3 + 4
y = 10

► 9. Известна формула графика и значение функции. Если мы хотим узнать значение аргумента — нам требуется подставить значения в формулу.

Пример:
y = 3 * x^2 + 2,
где y = 29, тогда
29 = 3 * x^2 + 2
27 = 3 * x^2
x^2 = 9
x = √9
x = 3
Как построить график и определить формулу по имеющимся точкам (автоматически). И немного про регрессионный анализ Математика, Школа, График, Математический анализ, Образование, Длиннопост

► 10. Известны два или несколько значений аргумента и принимаемых при этом значений функции. Хотим узнать формулу графика. Для этого нам требуется регрессионный анализ.

Так что то, что делалось в школе было своеобразной подготовкой, пусть и на более простых линейных уравнениях.



Впрочем, вот готовый инструмент.

Вставляйте в качестве X и Y показатели, и будет рассчитываться коэффициенты для графика.

=====

► https://www.desmos.com/calculator/rscgfhrhe3 ◄

=====

Как построить график и определить формулу по имеющимся точкам (автоматически). И немного про регрессионный анализ Математика, Школа, График, Математический анализ, Образование, Длиннопост

Если вы ещё не знакомы с Desmos, то это очень удобный сервис по построению графиков, решению задач и прочему.

Помимо построений по заданным точкам и формулам, если графиков несколько, то можно их нарисовать несколько, а потом определить их точки пересечения.

Есть и возможность "зарисовывать" области, что помогает при интегралах, там же можно добавлять граничные условия, многое другое.

Подробнее можно почитать и посмотреть тут (пройтись по всем интерактивным примерам):

https://learn.desmos.com/

ТЕОРИЯ РЕГРЕССИОННОГО АНАЛИЗА


А). В общем случае график функции выглядит так. Линейная зависимость.

y = k * x + b
где k — часто угол наклона,
b — часто величина подъёма.
В обычном случае подставляются значения первой и второй точки, решается система уравнений. Но можно использовать инструмент выше.


Б). Ещё в более общем виде график может выглядеть так. Нелинейная (часто квадратичная) зависимость.

y = k * x^n + b
где n — позволяет описать степенную функцию (аналог параболы при положительных значениях выше 1, гипербола при отрицательных). Часто n=2.

В). Иногда может быть логарифмическая зависимость:

y = k * ln(x) + b

В реальной жизни часто имеются "точки" (показатели X, Y) и бывает нужно найти хотя бы приблизительную "формулу графика", некоторые тенденции — такие данные суть статистики.

А статистика применяется в различных сферах знаний — медицина, социальные науки, финансы, эконометрика и др.


Например, ориентировочно знаем, на сколько увеличивается выпуск продукции при росте капиталовложений (X1, Y1; X2, Y2; X3, Y3). Вероятно, будет некоторая логарифмическая зависимость, получилась бы какая-то формула. А была бы формула, могло бы быть интересно, сколько будет Y4 при заданном X4.


Или, например, имеются показатели ВВП на душу населения (с поправкой на инфляцию) за 10 лет. И показатели продаж, ну, допустим, импортных автомобилей. Будет, скорее всего, некоторая линейная зависимость. И если точный график мог бы не так помочь, то как минимум приблизительно можно было судить о некоторой взаимозависимости факторов (или, так называемой, "корреляции"), которая может быть как положительной (растёт X, растёт Y), так и отрицательной (растёт X, падает Y). Аналитиками также мог бы добавиться дополнительный показатель, так называемый коэффициент "автокорреляции" (поправка на время), поскольку в этом примере идёт некоторый анализ "временных рядов".


А то, насколько приблизительно "правильной" получится модель, мог бы сказать, так называемый, показатель R^2, его ещё называют "коэффициентом детерминации". Который характеризует "плотность выборки" (чем ближе к 1, тем точнее), или точность между имеющимися точками и проходящим через них графиком.

Например,
y = k * x + b
x = [1, 2, 3]
y = [1, 3, 5]
даст
R^2 = 1
k = 2
b = -1

Потому что это та самая формула.


А предположи мы, что формула

y = k * x^2 + b,
тогда
R^2 = 0,9796
и менее красивые коэффициенты k и b.

Что очень близко, согласитесь, положительная часть графика параболы ведь почти проходит через нужные точки, поэтому он и не равен 1 (иногда в реальных задачах по анализу тенденций показатель R^2 до 0,9 — считается вполне терпимым, хотя лучше 0,99+).

Как построить график и определить формулу по имеющимся точкам (автоматически). И немного про регрессионный анализ Математика, Школа, График, Математический анализ, Образование, Длиннопост

Пример:

https://www.desmos.com/calculator/okysxt3tam

В заключение.

Сначала идёт "сложение", потом "умножение", затем базирующееся на этом "возведение в степень". Увеличивается уровень абстракции, пусть и можно было бы обойтись одним сложением и вычитанием (например, как при японском способе умножения требуются только эти две простые операции).


Так что изучение базы в целом полезно, а также важен подход к обучению. Тогда можно во многом разобраться, в том числе и с регрессией и всяким таким.


Надеюсь, было немного интересно.

Два графика с Desmos. Остальное собственное — CC0.

Лига образования

4.5K постов21.8K подписчиков

Добавить пост

Правила сообщества

Публиковать могут пользователи с любым рейтингом. Однако мы хотим, чтобы соблюдались следующие условия:


ДЛЯ АВТОРОВ:


Приветствуются:

-уважение к читателю и открытость

-желание учиться

Не рекомендуются:

-публикация недостоверной информации


ДЛЯ ЧИТАТЕЛЕЙ:


Приветствуются:

-конструктивные дискуссии на тему постов

Не рекомендуются:

-личные оскорбления и провокации

-неподкрепленные фактами утверждения


В этом сообществе мы все союзники - мы все хотим учиться! :)

Автор поста оценил этот комментарий

Очень похоже на интерполяцию, это оно?

раскрыть ветку (1)
Автор поста оценил этот комментарий

Спасибо за вопрос! Да, Вы отчасти правы, хотя не на 100%.

I. Есть несколько терминов.
1. Интерполяция. Это когда у нас есть значения (которые, разумеется, также можно оформить в график) и мы хотим найти ПРОМЕЖУТОЧНОЕ значение между ними.
2. Экстраполяция. Это когда у нас есть значения и мы хотим найти СЛЕДУЮЩИЕ за ними значения. В этом контексте, контексте "прогнозирования" это похоже на Регрессионный анализ.

3. Регрессионный анализ. Это когда у нас есть значения и мы хотим определить приблизительную формулу, которая охарактеризует эти точки как систему (с помощью формулы, конечно, можно и определить примерные ПРОМЕЖУТОЧНЫЕ значения, как в интерполяции, и СЛЕДУЮЩИЕ (или предыдущие) значения, как в экстраполяции.
Это прикладной смысл.

Справочно:
Есть ещё Аппроксимация. Это самый широкий термин, включает всё, что описывается выше, но и другое (например, полиномиальные уравнения n-степени и разное всякое). Упрощённо означает функциональный анализ, хотя не только.



II. Математический смысл
И регрессионный анализ, и (интерполяция | экстраполяция) позволяют предсказать возможные значения. Отсюда резонный вопрос.
А ПРЕДСКАЗАНИЕ (реальные цифры-то) регрессионный анализ даст такие же, как (интерполяция | экстраполяция).
► Ответ: нет, разные.
► Упрощённый ответ: разные, потому что формулы одного и другого разные.
► Усложнённый ответ: как за интерполяцией и экстраполяцией, так и за регрессионным анализом не стоит какой-то магии, существует описываемый процесс подсчётов и всё такое. В частности, регрессионный анализ использует "метод наименьших квадратов", МНК, или OLS. Интер-/экстраполяция, если в широком смысле, имеет другую формулу подсчёта.

Есть утверждения, что в целом регрессионный анализ даст более "правильный" ответ.
Вот тут можете посмотреть формулы того и другого и обсуждение:

https://stats.stackexchange.com/a/208657

https://stats.stackexchange.com/questions/87305/difference-b...

https://stats.stackexchange.com/questions/103209/time-series...
https://en.wikipedia.org/wiki/Approximation_theory

И, если кому понадобится, ещё более углублённый анализ сравнения регрессии с экстра-интерполяцией, как стартовую точку:
https://web.archive.org/web/20160327072532/www.phil.vt.edu/dmayo/personal_website/SPanos 2010.pdf

В целом тема интересная.
Автор поста оценил этот комментарий

Ну, если что, пару моментов по регрессиям.

1. Программы, где можно проводить такой анализ:
- statistica (считается стандартом, но платное ПО)
- excel или calc от libreoffice (свободный аналог excel)
- desmos (примеры выше).

2. Про то, как же определяются коэффициенты k и b автоматически: можно взглянуть, например, тут, для этого есть формула:
#comment_67157857
Там же, кстати, есть и синтетический пример + его решение (как и положено, определяется наиболее подходящая формула и строится график на основе имеющихся данных). Разумеется, раз формула расчёта коэффициентов одна, то и неважно, в какой программе считать, результат должен оказываться одинаковым (как это видно из примера, три разных ПО).