Основная теорема путевого анализа. Основная теорема анализа Основная теорема анализа

Первым этапом путевого анализа является идентификация уравнений системы.

В современной эконометрической литературе идентификация понимается как структурная спецификация модели, призванная не только определить значения параметров, но и выделить одну-единственную итоговую структурную модель анализируемых данных.

Проблема идентифицируемости в системе структурных уравнений связана с наличием достаточного числа ограничений, накладываемых на него моделью. Применительно к p-анализу - это проблема соответствия между количеством возможных соотношений между r ij и p ij и числом p ij .

Иначе говоря, проблема идентифицируемости структурных параметров -- это проблема достаточности эмпирических данных для оценки всех коэффициентов модели. Необходимым условием идентифицируемости уравнения является отсутствие среди линейных комбинаций оставшихся уравнений, таких, которые удовлетворяли бы всем ограничениям модели, накладываемым на исследуемое уравнение.

Это эквивалентно так называемому условию порядка: для того чтобы уравнение в системе из т линейных структурных уравнений было идентифицируемо, необходимо, чтобы в нем отсутствовало по меньшей мере т -- 1 переменных из т + к переменных, встречающихся в модели. Обозначим через т число эндогенных переменных в модели, к -- число предопределенных переменных, h -- число эндогенных переменных в рассматриваемом уравнении, g -- число предопределенных переменных в рассматриваемом уравнении. Тогда условие порядка может быть записано в форме т+к -- h -- g > m -- 1 или к -- g > h -- 1.

Структурное уравнение называется идентифицируемым, если оно удовлетворяет условию порядка; в случае точного равенства уравнение называется точно идентифицируемым, при строгом неравенстве -- сверхидентифицируемым.

Следующим этапом является оценивание структурных параметров. Для структурных моделей, построенных на основе p-коэффициентов, оценка p ij производится не методом наименьших квадратов, а с помощью такого приема. Запишем уравнение (3) следующим образом: или иначе (9)

Используем коэффициенты корреляции между зависимой переменной и каждой из объясняющих переменных: (10)

где n- число наблюдений.

Подставляя в (10) вместо x i правую часть выражения (10), получим: (11)

В этом преобразовании учтено, что корреляция u i , с х j по определению равна нулю. Если учесть, что r ij =1, то соотношение (11), называемое основной теоремой путевого анализа, можно записать так: (12)

Здесь j указывает на объясняющую переменную, связь которой с объясняемой переменной i раскрывается в структурной модели, к пробегает по подмножеству всех переменных, непосредственно влияющих на i-ю переменную (на графе эти вершины связаны с вершиной i дугами). Соотношение (12) справедливо для любой рекурсивной системы.

Путевой анализ позволяет произвести декомпозицию корреляции r ij . Введем понятия «полная (совокупная) связь», «совокупное влияние», «прямое влияние», «косвенное влияние». Если коэффициент корреляции нулевого порядка r ij рассматривать как измеритель полной связи двух переменных, то мерой совокупного влияния j-й переменной на i-ю переменную (q ij) будет являться ее часть, не зависящая ни от общих для них переменных -- причин, ни от корреляции между общими для j-й и i-й переменных причинами (компоненты ложной корреляции), ни от наличия не анализируемой в модели априорной корреляции предопределенных переменных -- входов.

Таким образом, мы можем разложить полную связь двух переменных на четыре составляющие с учетом постулируемой в модели асимметрии воздействия: на совокупное влияние (причинное влияние) j-й переменной на i-ю, на две компоненты, измеряющие эффект ложной корреляции, и на компоненту, еще не имеющую общепринятого названия. В свою очередь, совокупное влияние может быть разложено на две составляющие с учетом того, каким образом оно осуществляется -- непосредственно или через другие переменные.

Прямое влияние одной переменной на другую измеряется коэффициентом p ij ; в этом случае в цепи между объясняющей и объясняемой переменными нет промежуточных звеньев. Косвенное влияние -- это влияние тех составляющих совокупного влияния одной переменной на другую, которое образуется при учете эффекта передачи воздействия через посредство переменных, специфицированных в модели как промежуточные звенья в причинной цепи, связывающей изучаемые переменные. Поскольку строение совокупного влияния всецело зависит от постулируемой причинной структуры отношений между переменными, то и все введенные выше понятия имеют смысл только лишь по отношению к причинной модели с заданным графом связей.

Понятие об интегрировании, и в некоторой мере о дифференцировании, было хорошо развито раньше работ Ньютона и Лейбница. Но было совершенно необходимо сделать одно очень простое открытие, для того чтобы дать толчок к огромной эволюции вновь созданного математического анализа. Два как будто бы взаимно не соприкасающихся предельных процесса, употребляемые ©дин для дифференцирования, другой для интегрирования функций, оказались тесно связанными между собой. В самом деле, они являются взаимно обратными операциями, подобно таким операциям, как сложение и вычитание, умножение и деление. Дифференциальное и интегральное исчисления представляют собой нечто единое.

Великое достижение Ньютона и Лейбница заключается в том, что они впервые ясно осознали и использовали эту основную теорему анализа. Без сомнения, их открытие лежало на прямом пути естественного научного развития, и нисколько не удивительно, что различные лица пришли независимо и почти одновременно к ясному пониманию указанного выше обстоятельства.

Для того чтобы точно сформулировать основную теорему, рассмотрим интеграл от функции y = f (х) в пределах от постоянного числа а до числа х, которое будем считать переменным. Чтобы не смешивать верхнего предела интегрирования х с переменной, фигурирующей под знаком интеграла, запишем интеграл в следующем виде (см. стр. 435):

демонстрируя таким образом наше намерение изучать интеграл как функцию F (х) своего верхнего предела (рис. 274). Эта функция F (х) есть площадь под кривой y = f (u) от точки u = а до точки u = х . Иногда интеграл F (х) с переменным верхним пределом называют "неопределенным интегралом".

Основная теорема анализа читается следующим образом: Производная неопределенного интеграла (1) по его верхнему пределу х равна значению функции f (u) в точке u = х:

F" (х) = f (x).

Другими словами, процесс интегрирования, ведущий от функции f(x) к функции F (x), "уничтожается" обратным ему процессом дифференцирования, применяемым к функции F (х).

На интуитивной основе доказательство этого предложения не представляет труда. Оно базируется на интерпретации интеграла F (х) как площади, и было бы затемнено, если бы мы попытались представлять функцию F (х) в виде графика и истолковывать производную F" (х) как соответствующий наклон. Оставляя в стороне установленную ранее геометрическую интерпретацию производной, мы сохраним геометрическое толкование интеграла F (х) как площади, а дифференцировать функцию F (х) станем аналитическим методом. Разность

F (х 1) - F (х)

есть просто площадь под кривой y = f (u) между пределами u = х 1 и u = х (рис. 275), и нетрудно понять что числовое значение этой площади заключено между числами (х 1 - х)m и (x 1 - х) М:

(x 1 - x)m≤F (х 1) - F (х) ≤(х 1 - х) М,

где М и m являются соответственно наибольшим и наименьшим значениями функции f (u) в промежутке от u = х до u = x 1 . Действительно, эти произведения дают площади двух прямоугольников, из которых один содержит рассматриваемую криволинейную область, а другой содержится в ней.

Отсюда следует:


Предположим, что функция f (u) непрерывна, так что при стремлении x 1 к х обе величины М и m стремятся к значению функции f (u) в точке u = х, т. е. к значению f (х). В таком случае можно считать доказанным, что

Интуитивный смысл этого результата заключается в том, что при возрастании скорость изменения площади под кривой y = f (х) равна высоте кривой в точке х.

В некоторых руководствах содержание этой основной теоремы затемняется неудачно выбранной терминологией. Именно, многие авторы сначала вводят понятие производной, а затем определяют "неопределенный интеграл" просто как результат операции, обратной по отношению к дифференцированию: они говорят, что функция G (х) есть неопределенный интеграл от функции f (х), если

G" (х) = f(x).

Таким образом, этот способ изложения непосредственно связывает дифференцирование со словом "интеграл". Только позднее вводится понятие "определенный интеграл", трактуемое как площадь или как предел последовательности сумм, причем недостаточно подчеркивается, что слово "интеграл" обозначает теперь нечто совершенно другое, чем прежде. И вот оказывается, что самое главное, что содержится в теории, приобретается лишь украдкой с черного хода, и учащийся встречается с серьезными затруднениями в своих усилиях понять существо дела. Мы предпочитаем функции G (х), для которых G" (х) = f (х) , называть не "неопределенными интегралами", а первообразными функциями от функции f (х). Тогда основная теорема может быть сформулирована следующим образом:

Функция F (х), являющаяся интегралом от функции f (x) при постоянном нижнем и переменном верхнем пределе х, есть одна из первообразных функций от функции f (x).

Мы говорим "одна из" первообразных функций по той причине, что если G (х) является первообразной функцией от f (х), то непосредственно ясно, что и любая функция вида Н (х) = G (х) + с (с - произвольная постоянная) есть также первообразная, так как Н" (х) = G" (х) . Обратное утверждение также справедливо. Две первообразные функции G (х) и Н (х) могут отличаться одна от другой не иначе, как постоянным слагаемым. Действительно, разность U (х) = G (х) - Н (х) имеет в качестве производной U" (х) = G" (х) - Н" (х) = f (х) - f (х) = 0 , т. е. эта разность постоянна, так как очевидно, что если график функции в каждой своей точке горизонтален, то сама функция, представляемая графиком, непременно должна, быть постоянной.

§ 5. Основная теорема анализа

1. Основная теорема. Понятие об интегрировании, и в некоторой мере о дифференцировании, было хорошо развито раньше работ Ньютона и Лейбница. Но было совершенно необходимо сделать одно очень простое открытие, для того чтобы дать толчок к огромной эволюции вновь созданного математического анализа. Два как будто бы взаимно не соприкасающихся предельных процесса, употребляемые один для дифференцирования, другой для интегрирования функций, оказались тесно связанными между собой. В самом деле, они являются взаимно

обратными операциями, по-

добно таким операциям, как

сложение и вычитание, умно-

жение и деление. Дифферен-

циальное и интегральное ис-

числения представляют собой

нечто единое.

Великое достижение Нью-

тона и Лейбница заключается

в том, что они впервые яс-

Рис. 274. Интеграл как функция верхнего

но осознали и использовали

эту основную теорему анали-

за. Без сомнения, их откры-

тие лежало на прямом пути естес твенного научного развития, и нисколько не удивительно, что различ ные лица пришли независимо и почти одновременно к ясному пониманию указанного выше обстоятельства.

Для того чтобы точно сформулировать основную теорему, рассмотрим интеграл от функции y = f(x) в пределах от постоянного числа a до числа x, которое будем считать переменным. Чтобы не смешивать верхнего предела интегрирования x с переменной, фигурирующей под знаком интеграла, запишем интеграл в следующем виде (см. стр. 428 ):

F (x) = Z

демонстрируя таким образом наше намерение изучать интеграл как функцию F (x) своего верхнего предела (рис. 274). Эта функция F (x) есть площадь под кривой y = f(u) от точки u = a до точки u = x. Иногда интеграл F (x) с переменным верхним пределом называют «неопределенным интегралом».

Основная теорема анализа читается следующим образом:

Производная неопределенного интеграла (1 ) по его верхнему пределу x равна значению функции f(u) в точке u = x:

F 0 (x) = f(x).

ОСНОВНАЯ ТЕОРЕМА АНАЛИЗА

Другими словами, процесс интегрирования, ведущий от функции f(x) к функции F (x), «уничтожается» обратным ему процессом дифференцирования, применяемым к функции F (x).

На интуитивной основе доказательство этого предложения не представляет труда. Оно базируется на интерпретации интеграла F (x) как площади, и было бы затемнено, если бы мы попытались представлять функцию F (x) в виде графика и истолковывать производную F 0 (x) как соответствующий наклон. Оставляя в стороне установленную ранее геометрическую интерпретацию производной, мы сохраним геометрическое толкование интеграла F (x) как площади, а дифференцировать функцию F (x) станем аналитическим методом. Разность

F (x1 ) − F (x)

есть просто площадь под кривой y = f(u) между пределами u = x1 и u = x (рис. 275), и нетрудно понять, что числовое значение этой площади заключено между числами (x1 − x)m и (x1 − x)M:

(x1 − x)m 6 F (x1 ) − F (x) 6 (x1 − x)M,

где M и m являются, соответственно, наибольшим и наименьшим значениями функции f(u) в промежутке от u = x до u = x1 . Действительно, эти произведения дают площади двух прямоугольников, из которых один содержит рассматриваемую криволинейную область, а другой содержится в ней.

Рис. 275. К доказательству основной теоремы

Отсюда следует

m 6 F (x1 ) − F (x) 6 M. x1 − x

Предположим, что функция f(u) непрерывна, так что при стремлении x1 к x обе величины M и m стремятся к значению функции f(u) в точке u = x, т. е. к значению f(x). В таком случае можно считать

468 МАТЕМАТИЧЕСКИЙ АНАЛИЗ гл. VIII

доказанным, что

F 0 (x) = lim

F (x1 ) − F (x)

x1 →x

x1 − x

Интуитивный смысл этого результата заключается в том, что при возрастании скорость изменения площади под кривой y = f(x) равна высоте кривой в точке x.

В некоторых руководствах содержание этой основной теоремы затемняется вследствие неудачно выбранной терминологии. Именно, многие авторы сначала вводят понятие производной, а затем определяют «неопределенный интеграл» просто как результат операции, обратной по отношению к дифференцированию: они говорят, что функция G(x) есть неопределенный интеграл от функции f(x), если

G0 (x) = f(x).

Таким образом, этот способ изложения непосредственно связывает дифференцирование со словом «интеграл». Только позднее вводится понятие «определенный интеграл», трактуемое как площадь или как предел последовательности сумм, причем недостаточно подчеркивается, что слово «интеграл» обозначает теперь нечто совершенно другое, чем прежде. И вот оказывается, что самое главное, что содержится в теории, приобретается лишь украдкой - через заднюю дверь, и учащийся встречается с серьезными затруднениями в своих усилиях понять существо дела. Мы предпочитаем функции G(x), для которых G0 (x) = f(x), называть не «неопределенными интегралами», а первообразными функциями от функции f(x). Тогда основная теорема может быть сформулирована следующим образом:

Функция F (x), являющаяся интегралом от функции f(x) при постоянном нижнем и переменном верхнем пределе x, есть одна из первообразных функций от функции f(x).

Мы говорим «одна из» первообразных функций по той причине, что если G(x) является первообразной функцией от f(x), то непосредственно ясно, что и любая функция вида H(x) = G(x) + c (c - произвольная постоянная) есть также первообразная, так как H0 (x) = G0 (x). Обратное утверждение также справедливо. Две первообразные функции G(x)

и H(x) могут отличаться одна от другой не иначе, как постоянным слагаемым. Действительно, разность U(x) = G(x) − H(x) имеет в качестве производной U0 (x) = G0 (x) − H0 (x) = f(x) − f(x) = 0, т. е. эта разность постоянна, так как очевидно, что если график функции в каждой своей точке горизонтален, то сама функция, представляемая графиком, непременно должна быть постоянной.

Это ведет к очень важному правилу вычисления интеграла в пределах от a до b - в предположении, что нам известна какая-либо первообразная функция G(x) от функции f(x). Согласно нашей основной

ОСНОВНАЯ ТЕОРЕМА АНАЛИЗА

теореме, функция

есть также первообразная функция от функции f(x). Значит, F (x) =

G(x) + c, где c - постоянная. Значение этой постоянной определится,

если мы примем во внимание, что F (a) = f(u) du = 0. Отсюда следует:

0 = G(a) + c, так что c = −G(a). Тогда определенный интеграл в пределах от a до x тождественно удовлетворяет равенству

F (x) = f(u) du = G(x) − G(a);

замена x через b приводит к формуле

f(u) du = G(b) − G(a),

независимо от того, какая именно из первообразных функций была «пущена в ход». Другими словами: чтобы вычислить определенный ин-

теграл f(x) dx, достаточно найти такую функцию G(x), для кото-

рой G0 (x) = f(x), и затем составить разность G(b) − G(a).

2. Первые применения. Интегрирование функций xr , cos x, sin x. Функция arctg x. Здесь невозможно дать исчерпывающее представление о роли основной теоремы, и мы ограничимся тем, что приведем несколько выразительных примеров. В задачах, встречающихся в механике и физике или в самой математике, очень часто приходится подсчитывать числовое значение некоторого определенного интеграла. Прямая попытка найти интеграл как предел может быть непреодолимо трудной. С другой же стороны, как мы это видели в § 3, любое дифференцирование выполняется сравнительно легко, и без труда возможно накопить очень большое количество формул дифференцирования. Каждая такая формула G0 (x) = f(x), обратно, может быть рассматриваема как формула, определяющая первообразную функцию G(x) от функции f(x).

Формула (3 ) позволяет использовать известную первообразную функцию для вычисления интеграла от функции f(x) в некотором данном промежутке.

Если мы, например, хотим найти интегралы от степеней x2 , x3 , или в общем виде xn , то самое простое - это действовать, как указано в § 1. По формуле дифференцирования степени производная от xn равна nxn−1 ,

470 МАТЕМАТИЧЕСКИЙ АНАЛИЗ гл. VIII

так что производная от функции

G(x) = n x

1 (n 6= −1)

есть функция

G0 (x) = n n + + 1 1 xn = xn .

x n+1

В таком случае функция n + 1 является первообразной функцией

по отношению к функции f(x) = xn , а следовательно, мы немедленно получаем формулу

x n dx = G(b) − G(a) = b n+1 − a n+1 . n + 1

Это рассуждение несравненно проще громоздкой процедуры непосредственного вычисления интеграла как предела суммы.

Как более общий случай, мы нашли в § 3, что при любом рациональном s, как положительном, так и отрицательном, производная функции xs равна sxs−1 , а потому при s = r + 1 функция

x r+1

имеет производную f(x) = G0 (x) = xr (мы предполагаем, что r 6= −1,

x r+1

т. е. что s 6= 0). Итак, функция r + 1 есть первообразная функция, или

«неопределенный интеграл» от xr , и мы получаем (при положительных a и b и при r 6= −1) формулу

xr dx =

b r+1 − a r+1

В формуле (4 ) приходится предполагать, что стоящая под интегралом функция xr определена и непрерывна в промежутке интегрирования, так что нужно исключить точку x = 0, если r < 0. Вот потому мы и вынуждены допустить, что в этом случае a и b положительны.

Если положим G(x) = − cos x, то получим G0 (x) = sin x, и отсюда возникает соотношение

sin xdx = −(cos a − cos 0) = 1 − cos a.

Аналогично, если G(x) = sin x, то G0 (x) = cos x, и значит,

cos xdx = sin a − sin 0 = sin a.

§ 5 ОСНОВНАЯ ТЕОРЕМА АНАЛИЗА 471

Особенно интересный результат получается из формулы дифференцирования функции arctg x:

Раз функция arctg x есть первообразная по отношению к функции

1 + x2

то на основании формулы (3 ) можно написать

arctg b − arctg 0 = Z 0

1 + x2 dx.

Но arctg 0 = 0 (нулевому значению тангенса соответствует нулевое значение угла). Итак, мы имеем

arctg b = Z 0

1 + x2

В частности,

значению

тангенса,

1, соответствует

в 45◦ , что в радианной мере со-

ставляет p . Таким образом, мы

получаем

замечательную

1 + x2 dx.

показывает,

что площадь

графиком

1 + x 2 в пределах от x = 0 до x =

1 равна четверти площади еди-

276. Площадь под кри-

ничного круга.

в пределах

3. Формула

Лейбница

1 + x2

приводит

для p . Последний результат

из красивейших

математических формул, открытых в XVII в., - к знакоп еременному

ряду Лейбница, позволяющему вычислять p:

4 p = 1 1 − 3 1 + 5 1 − 7 1 + 9 1 − 11 1 + . . .

Символ + . . . следует понимать в том смысле, что последовательность конечных «частных сумм», получающихся, когда в правой части ра-

венств берется лишь n членов суммы, стремится к пределу p при

неограниченном возрастании n.

МАТЕМАТИЧЕСКИЙ АНАЛИЗ

Чтобы доказать эту замечательную формулу, нам достаточно вспомнить формулу суммы конечной геометрической прогрессии

1 − q n = 1 + q + q2 + . . . + qn−1 ,

где «остаточный член» Rn выражается формулой

Rn = (−1)n x 2n 2 .

Равенство (8 ) можно проинтегрировать в пределах от 0 до 1. Следуя правилу a) из § 3, мы должны взять в правой части сумму интегралов от отдельных слагаемых. На основании (4 ) мы знаем, что

xm dx =

b m+1

− am+1

частности, получим

xm dx =

откуда, в

1 + x2

1 − 3 +

А следовательно,

− 7

+ . . . + (−1)n−1

2n − 1 + T n ,

p · R 0

1 + x2

Tn = (

Согласно формуле (5 ), левая часть форму-

лы (9 ) равна

Разность между

и частной суммой

(−1)n−1

Sn = 1 −

− Sn = Tn . Остается доказать, что Tn стремится к нулю при

возрастании n. Мы имеем неравенство

x 2n 6 x2n .

1 + x2

Вспомнив формулу (13 ) § 1, устанавливающую неравенство

f(x) dx 6 g(x) dx при f(x) 6 g(x) и a < b,

Основная теорема анализа

Основная теорема анализа или формула Ньютона - Лейбница даёт соотношение между двумя операциями: взятием определенного интеграла и вычислением первообразной

Формулировка

Рассмотрим интеграл от функции y = f (x ) в пределах от постоянного числа a до числа x , которое будем считать переменным. Запишем интеграл в следующем виде:

Данный вид интеграла называется интегралом с переменным верхним пределом. Используя теорему о среднем в определённом интеграле , легко показать что данная функция непрерывная и дифференцируемая. А также производная от данной функции в точке x равна самой интегрируемой функции. От сюда следует, что любая непрерывная функция имеет первообразную в виде квадратуры: . А так как класс первообразных функций функции f отличается на константу, легко показать, что: определенный интеграл от функции f на равен разности значений первообразных в точках b и а


Wikimedia Foundation . 2010 .

  • Плеяда
  • 6174 (число)

Смотреть что такое "Основная теорема анализа" в других словарях:

    Основная теорема о вычетах - Теорема о вычетах явлется мощным инструментом для вычисления интеграла мероморфной функции по замкнутому контуру. Ее часто используют также для вычисления вещественных интегралов. Она является обобщением интегральной теоремы Коши и интегральной… … Википедия

    Основная теорема алгебры - утверждает, что Всякий отличный от константы многочлен (от одной переменной) с комплексными коэффициентами имеет по крайней мере один корень в поле комплексных чисел. Эквивалентная формулировка теоремы следующая: Поле комплексных чисел… … Википедия

    Теорема Ньютона - Формула Ньютона Лейбница или основная теорема анализа даёт соотношение между двумя операциями: взятием определенного интеграла и вычислением первообразной. Если непрерывна на отрезке и ее любая первообразная на этом отрезке, то имеет … Википедия

    Формула Ньютона-Лейбница

    Формула Ньютона - Лейбница - Основная теорема анализа или формула Ньютона Лейбница даёт соотношение между двумя операциями: взятием определенного интеграла и вычислением первообразной Формулировка Рассмотрим интеграл от функции y = f(x) в пределах от постоянного числа a до… … Википедия

    Интеграл - Определённый интеграл как площадь фигуры У этого термина существуют и другие значения, см. Интеграл (значения). Интеграл функции … Википедия - для функции это совокупность всех первообразных данной функции. Если функция определена и непрерывна на промежутке и её первообразная, то есть при, то … Википедия