El capítulo anterior terminaba con una pregunta muy concreta:
una vez elegidos el estado, las coordenadas y la clase de ley que
queremos estudiar, ¿de dónde sale la ley de movimiento? Este
capítulo cambia de punto de vista: deja de mirar solo estados
instantáneos y empieza a comparar historias completas.
Este capítulo no nace de cero. Llega después de haber aclarado,
en el capítulo 1, qué entendemos por sistema, configuración, ley
y estado.
Empezamos fijando nuestro foco en un
sistema:
qué parte del mundo queremos estudiar. Después vimos, en
¿Qué observamos?,
que lo que realmente tenemos delante son historias en el tiempo,
y que la configuración no tiene por qué
escribirse siempre en cartesianas. Un péndulo deja ver muy bien
esa idea: puedes describir la masa con \((x,y)\), pero la ligadura
hace visible que una sola coordenada, el ángulo, captura mejor la
geometría real del problema.
Cuando pasamos a
Ley dinámica
y a
Mundos posibles,
apareció la pregunta decisiva: ¿qué clase de ecuación puede
describir la evolución temporal de esa configuración? Ahí
comparamos tres posibilidades. A las leyes de primer orden les
faltaba inercia: la misma posición fijaba demasiado del futuro. A
las de tercer orden les sobraba memoria: pedían un dato extra que
ya no se parece a la mecánica ordinaria. Pero la moraleja fina no
era “la naturaleza ama el segundo orden”. La moraleja era otra:
el estado mínimo debía cerrar la predicción sin romper la
reversibilidad ordinaria.
Y eso nos llevó, por fin, al
estado
y, más limpiamente todavía, al
espacio de estados.
Allí vimos la formulación más nítida: lo fundamental es una ley
de primer orden en un espacio más grande, donde cada grado de
libertad lleva una configuración y un dato independiente de
cambio. Cuando proyectas esa dinámica sobre las configuraciones,
aparece la forma de segundo orden. En coordenadas generalizadas,
y contando solo grados de libertad efectivos, el presente mínimo
se escribe de forma natural como
\[
(q(t_0),\dot q(t_0)).
\]
La forma general que hemos retenido
\[
\ddot x = a(x,\dot x,t)
\]
Todavía no sabemos cuál es la ley concreta de nuestro mundo.
Lo que sí hemos fijado es la arquitectura mínima del caso
ordinario: una evolución de primer orden en espacio de
estados que, vista solo desde la configuración, toma la forma
de una ecuación de segundo orden.
Así que la pregunta ya tiene forma limpia: ¿cuál es esa ley y
puede formularse a partir de lo que observamos, de esas
historias en el tiempo?
Eso es exactamente lo que vamos a construir aquí.
2.1 De estados a historias
¿De dónde sale la ley de movimiento?
Newton nos da una respuesta local: en cada instante, a partir del estado
presente -coordenadas y velocidades generalizadas-, calcula la aceleración
y empuja el sistema paso a paso hacia el siguiente estado. El sistema evoluciona
en pequeños incrementos infinitesimales del estado.
La formulación lagrangiana propone otra
mirada: fijar un comienzo, fijar un final y mirar historias
completas entre ambos.
Muchos caminos, los mismos extremos
Piensa en una partícula en una línea. Si fijas
\[
x(t_1)=x_1,\qquad x(t_2)=x_2,
\]
entre esos extremos hay muchísimas historias cinemáticamente
posibles. La nueva pregunta ya no es “qué empuje instantáneo toca
ahora”, sino “cómo comparar, entre todas esas curvas posibles, la
que realiza la naturaleza”.
Todas las curvas de esta familia salen del mismo punto en
\(t_1\) y llegan al mismo punto en \(t_2\). Lo que cambia es
la historia completa entre medias.
Aquí conviene separar dos ingredientes. El primero es
cinemático: una vez has dicho cuál es el
espacio de configuraciones y qué extremos fijas, ya sabes qué
historias son admisibles. El segundo es
dinámico: hace falta una regla que permita
compararlas y decidir cuál de ellas merece el título de
historia física.
\(\lambda=0.00\)
Cinemática
Dice qué historias están permitidas una vez fijas el
sistema, las coordenadas y los extremos.
Dinámica
No basta con saber qué historias son posibles. Hace
falta una regla que permita compararlas y seleccionar
la que realmente realiza la naturaleza.
El giro conceptual
La formulación lagrangiana cambia la unidad básica de
pensamiento: de la foto instantánea pasa a la película
entera entre dos instantes.
2.2 Premisas nuevas
¿Qué añadimos para poder comparar historias completas?
Hasta aquí habíamos aceptado cosas bastante básicas: sistemas,
estados, coordenadas y la idea de que la mecánica ordinaria se
organiza con un estado mínimo reversible. Ahora añadimos una capa
nueva: condiciones que debe satisfacer cualquier criterio sensato
para comparar historias completas.
Premisa 1 · Un número por historia
Si queremos comparar historias, debemos asignar a cada
candidata una cantidad escalar. Llamemos \(S[q;t_1,t_2]\) a
esa cantidad.
Premisa 2 · Composicionalidad temporal
Si una historia va de \(t_1\) a \(t_3\) pasando por \(t_2\), la
cantidad asociada al tramo total debe componerse a partir de
los dos subtramos.
Premisa 3 · Localidad temporal
Queremos que la contribución de un intervalo muy pequeño
dependa solo de lo que la historia está haciendo en ese trozo,
no de información remota de toda la trayectoria.
Premisa 4 · La clase ordinaria de teorías
La razón profunda no es que adoremos las segundas derivadas.
Es que, en la clase ordinaria de teorías reversibles, el
estado mínimo por grado de libertad contiene una
configuración y un dato independiente de cambio. Cuando
reescribimos esa estructura usando solo configuraciones, la
dependencia natural pasa por \(q\), por \(\dot q\) y por el
tiempo.
Composicionalidad temporal
\[
S[q;t_1,t_3]=S[q;t_1,t_2]+S[q;t_2,t_3]
\]
La cantidad asignada a la historia completa debe poder
descomponerse en trozos temporales.
Lectura correcta
La acción no nace de un truco algebraico. Nace del paquete de
premisas que acabamos de aceptar: una forma de comparar
historias que sea componible en el tiempo y local por trozos.
2.3 Por qué eso lleva a una integral
¿Por qué aparece una integral y no otra cosa?
Si la cantidad asociada a la historia es componible por intervalos
y local por trozos, el tramo infinitesimal \([t,t+dt]\) debe
aportar algo como
Contribución infinitesimal
\[
dS=\mathcal{L}(q,\dot q,t)\,dt
\]
\(\mathcal{L}\) es simplemente el nombre de la densidad local
que estamos introduciendo. Todavía no sabemos cuál es su forma
concreta.
La integral no aparece por elegancia literaria. Aparece
porque hemos pedido una regla sobre historias que sea aditiva
en el tiempo y local por intervalos.
Descomponer la historia en trozos
Si el criterio sobre la historia completa debe nacer de
sumar contribuciones locales, la forma integral aparece de
manera natural.
Lo que sí hemos fijado
Hemos fijado la arquitectura del problema: historias
completas, composicionalidad temporal y localidad por
trozos.
Lo que aún no
No hemos dicho todavía cuál es la \(\mathcal{L}\) del
mundo real. Solo hemos explicado por qué la forma
integral aparece de manera natural.
Matiz importante
Nada obliga por lógica pura a que \(\mathcal{L}\)
dependa solo de \(q\) y \(\dot q\). Eso depende de la
clase de teorías que queremos estudiar aquí.
La limpieza importante de esta sección
No estamos diciendo “el universo tuvo que escoger una acción
local de primer orden”. Estamos diciendo algo más preciso: si
queremos comparar historias completas, componer intervalos en el
tiempo, trabajar localmente por trozos y permanecer en la clase
ordinaria de teorías donde la evolución se organiza con
\(q\) y un dato independiente de cambio, entonces la forma
natural es
\[
S[q]=\int \mathcal{L}(q,\dot q,t)\,dt.
\]
2.4 Acción estacionaria
¿Qué significa que la acción sea estacionaria?
La trayectoria física no se obtiene, en general, haciendo la
acción mínima. La palabra correcta es
estacionaria. Igual que en cálculo ordinario, una
variación de primer orden que se anula puede corresponder a un
mínimo, a un máximo o a un caso más sutil.
La acción se convierte, para cada deformación concreta, en una
función ordinaria de \(\varepsilon\). La trayectoria física es
aquella para la cual esa función no cambia en primer orden.
Deformar la historia y mirar la acción
A la izquierda ves una familia de trayectorias con los
mismos extremos. A la derecha, la acción como función de
\(\varepsilon\) en un caso simple tipo mínimo.
La palabra correcta sigue siendo
estacionaria, no mínima. Aquí visualizamos un
caso especialmente simple para que se vea la idea: en
\(\varepsilon=0\), la acción tiene derivada nula y la
trayectoria central queda destacada frente a sus vecinas.
\(\varepsilon=0.00\)
La idea de fondo
No estás moviendo un número, sino una trayectoria
entera. La acción se convierte en una función corriente
cuando mides cuánto deformas esa historia.
Por qué fijamos los extremos
En este primer problema variacional no estamos
preguntando dónde empieza o termina la partícula. Eso ya
está decidido. Comparamos historias que conectan los
mismos extremos.
Lo que viene después
El siguiente paso será convertir esta condición global
sobre historias completas en una ecuación diferencial
local: Euler–Lagrange.
Precisión importante sobre la frontera
La acción, por sí sola, no define todavía todo el problema
variacional. Hace falta decir además qué variaciones se permiten
en la frontera. En nuestro caso escogemos una clase muy
concreta: fijamos \(q(t_1)\) y \(q(t_2)\), y por eso las
deformaciones admisibles cumplen \(\eta(t_1)=\eta(t_2)=0\).
Otra elección de datos de borde exigiría replantear el término
de frontera de la acción.
Ahora viene el paso decisivo
Ya tenemos la arquitectura del problema variacional: historias
completas, una cantidad escalar por historia, composicionalidad,
localidad y una condición de estacionariedad. El siguiente paso
convierte esa condición global en una ecuación local y empieza
a preguntar qué forma concreta tiene la \(\mathcal{L}\) del
mundo ordinario.
2.5 Euler–Lagrange
¿Cómo se convierte una condición global en una ecuación local?
Aquí llega el paso más bonito del capítulo: la condición sobre
historias completas va a convertirse en una ecuación diferencial
local. Pero conviene separar dos preguntas que suelen mezclarse:
qué ecuación sale de \(\delta S=0\) para una
\(\mathcal{L}(q,\dot q,t)\) cualquiera, y qué forma concreta de
\(\mathcal{L}\) describe de hecho el mundo ordinario.
Vamos a hacerlo sin atajos. Partimos de una trayectoria candidata
\(q(t)\) y la deformamos ligeramente:
\(\eta(t)\) fija la forma de la deformación y \(\varepsilon\)
mide su tamaño. Los extremos se mantienen fijos porque éste
sigue siendo el mismo problema variacional del apartado
anterior.
Para cada deformación concreta, la acción se convierte ahora
en una función ordinaria de \(\varepsilon\). La condición de
estacionariedad pide
\[
\left.\frac{d\Phi_\eta}{d\varepsilon}\right|_{\varepsilon=0}=0.
\]
Paso 1 · Derivar bajo la integral
Aplicamos la regla de la cadena a
\(\mathcal{L}(q+\varepsilon\eta,\dot q+\varepsilon\dot\eta,t)\).
Como \(\mathcal{L}\) depende de \(q\) y de \(\dot q\),
aparecen exactamente dos contribuciones.
Paso 2 · Evaluar en \(\varepsilon=0\)
Al poner \(\varepsilon=0\) recuperamos la trayectoria original
\(q(t)\). Lo que queda es la primera variación de la acción,
que llamamos \(\delta S\).
Aquí las derivadas parciales de \(\mathcal{L}\) se evalúan en
\((q+\varepsilon\eta,\dot q+\varepsilon\dot\eta,t)\). Al poner
\(\varepsilon=0\), obtenemos
El segundo término contiene \(\dot\eta\), y eso no conviene.
La arbitrariedad de la deformación debería quedar toda
concentrada en \(\eta\), no en su derivada. Si no hacemos nada,
aún no podemos leer de aquí una condición local limpia sobre
\(q\).
Paso 3 · Integración por partes
Reescribimos el término con \(\dot\eta\) para desplazar la
derivada temporal fuera de la deformación y dejarla actuando
sobre \(\partial\mathcal{L}/\partial\dot q\).
Paso 4 · Separar bulk y borde
Al integrar por partes, la variación se descompone de manera
natural en un término de borde y un término interior. Ésa es
la arquitectura real del problema variacional.
La variación de la acción se separa en dos piezas: un
término de borde, que vive en los extremos, y un término de
bulk, que vive en el interior del intervalo.
La ecuación local
Como \(\eta(t)\) es arbitraria en el interior, el
corchete que la multiplica tiene que anularse punto a
punto:
\[
\frac{\partial\mathcal{L}}{\partial q}
-
\frac{d}{dt}\left(\frac{\partial\mathcal{L}}{\partial \dot q}\right)=0.
\]
Lo importante
Hasta aquí no ha aparecido todavía la receta \(T-V\).
Euler–Lagrange no nace de una forma concreta del
lagrangiano. Nace de la arquitectura variacional misma.
Generalización natural
Si el sistema tiene \(n\) grados de libertad y
coordenadas \(q=(q_1,\dots,q_n)\), aparece una ecuación
de Euler–Lagrange para cada coordenada \(q_i\).
Ahora llega la idea clave. La deformación \(\eta(t)\) es
arbitraria en el interior del intervalo. Así que, para que
\(\delta S\) se anule para toda deformación admisible, el
corchete que multiplica a \(\eta\) tiene que anularse:
Ésta es la ecuación buscada. Lo importante es que no nace de
una forma particular del lagrangiano, sino del hecho de que la
acción sea estacionaria frente a deformaciones admisibles.
Nada esencial dependía de que la coordenada se llamara \(q\)
ni de que fuese una posición cartesiana. Los \(q_i\) son
simplemente etiquetas para describir configuraciones, y los
\(\dot q_i\) son sus tasas de cambio.
¿Por qué el integrando tiene que ser cero?
Porque \(\eta(t)\) puede elegirse con soporte muy localizado.
Si el corchete fuese positivo en una pequeña región, podríamos
escoger allí una \(\eta\) positiva y la integral no se anularía.
Si fuese negativo, elegiríamos una \(\eta\) negativa. La única
forma de que \(\delta S\) sea cero para toda deformación
admisible es que ese corchete valga cero punto a punto.
Lo verdaderamente importante de esta derivación
Hasta aquí no ha aparecido todavía la receta \(T-V\). Eso es
exactamente lo que hay que retener. Euler–Lagrange no nace de
una forma concreta del lagrangiano. Nace de la arquitectura
variacional misma. Vale para cualquier candidata
\(\mathcal{L}(q,\dot q,t)\) que queramos poner a prueba.
2.6 La \(\mathcal{L}\) de la partícula libre
¿Qué fija la forma del lagrangiano libre?
Ahora sí podemos volver a la pregunta física aplazada: qué forma
concreta de \(\mathcal{L}\) describe la mecánica ordinaria. En el
caso más sobrio —una partícula libre— la respuesta no sale de una
costumbre escolar, sino de una cadena de simetrías.
Homogeneidad espacial
Si no hay lugar privilegiado, \(\mathcal{L}\) no puede
depender explícitamente de la posición:
\[
\mathcal{L}=\mathcal{L}(\dot{\mathbf{x}},t).
\]
Homogeneidad temporal
Si no hay instante privilegiado, tampoco puede depender
explícitamente del tiempo:
\[
\mathcal{L}=\mathcal{L}(\dot{\mathbf{x}}).
\]
Isotropía
Si no hay dirección privilegiada, no puede depender de la
dirección de la velocidad, sino solo de su módulo:
\[
\mathcal{L}=f(v^2).
\]
Boosts galileanos
La equivalencia entre marcos inerciales no exige invariancia
estricta, sino cuasi-invariancia:
\[
\mathcal{L}'=\mathcal{L}+\frac{dF}{dt}.
\]
Bajo un boost infinitesimal, la variación del lagrangiano debe
poder escribirse como una derivada total, es decir, como algo
a lo sumo afín en \(\mathbf{v}\).
Conclusión
\[
f'(v^2)=\text{constante}
\quad\Rightarrow\quad
\mathcal{L}_{\text{libre}}=\frac12 m v^2+\text{const.}
\]
La constante es irrelevante dinámicamente. Lo que fijan las
simetrías es la forma cuadrática; el valor numérico de \(m\)
lo fija el experimento.
Cadena de rigidez estructural
La cuadrática \(\frac12 m v^2\) no sale de memorizar \(T\),
sino de imponer homogeneidad, isotropía y cuasi-invariancia
galileana.
Comprobación con un boost finito
Si
\[
\mathcal{L}=\frac12 mv^2
\]
y hacemos un boost \(\mathbf{v}'=\mathbf{v}-\mathbf{u}\),
entonces
\[
\mathcal{L}'-\mathcal{L}
=
-m\mathbf{u}\cdot\mathbf{v}+\frac12 mu^2
=
\frac{d}{dt}\left(-m\mathbf{u}\cdot\mathbf{x}+\frac12 mu^2t\right).
\]
El lagrangiano libre cuadrático no es estrictamente invariante:
es cuasi-invariante, y eso es exactamente lo que hace falta.
2.7 Interacciones
¿Cómo aparecen las interacciones?
Una vez entendido el caso libre, la pregunta siguiente es qué
añadimos cuando ya no estamos en el vacío dinámico. Si la
interacción es conservativa y depende solo de la posición y del
tiempo, la elección natural es
Potencial escalar
\[
\mathcal{L}=\frac12 mv^2 - V(x,t)
\]
En una dimensión, Euler–Lagrange devuelve precisamente
\[
m\ddot x=-\frac{\partial V}{\partial x}.
\]
Idea estructural
La moraleja no es memorizar la receta \(T-V\). Es entender que,
una vez fijada la arquitectura variacional, la forma concreta
de \(\mathcal{L}\) viene determinada por las simetrías del
sistema y por el tipo de interacción que decides permitir.
Por qué el signo importa
Si cambiásemos \(T-V\) por \(T+V\), la partícula aceleraría
cuesta arriba del potencial. Matemáticamente es una teoría
posible; físicamente no describe la mecánica ordinaria.
Lectura física
Si el potencial crece hacia la derecha, la aceleración
apunta hacia la izquierda: el sistema tiende a bajar
potencial.
Más allá de \(T-V\)
Si además permites términos lineales en la velocidad,
aparece una clase más amplia:
\[
\mathcal{L}=\frac12 mv^2+\mathbf{A}\cdot\mathbf{v}-\phi.
\]
Ésa es la puerta de entrada natural a la estructura
electromagnética.
2.8 Derivadas altas
¿Por qué no subimos de orden alegremente?
Hasta aquí hemos explicado por qué la forma
\[
S[q]=\int \mathcal{L}(q,\dot q,t)\,dt
\]
es el punto de partida natural de la mecánica ordinaria. Queda
una pregunta honesta: si eso funciona, ¿por qué no permitir sin
más lagrangianos con \(\ddot q\), \(\dddot q\) y más arriba?
Primera consecuencia: más memoria
Si la ecuación de movimiento sube de orden, hacen falta más
datos iniciales para arrancarla. El sistema recuerda más
cosas de su pasado inmediato. Ése es el efecto que ya
habíamos visto en el capítulo 1.
Problema más serio: energía sin suelo
En el caso no degenerado, al pasar a la formulación
hamiltoniana aparecen grados de libertad extra y el
hamiltoniano deja de estar acotado inferiormente. La energía
ya no tiene fondo.
Lo peligroso no es solo recordar más
Si una parte del sistema puede ganar energía positiva mientras
otra compensa con energía negativa, la conservación total no
protege. Solo deja abierta la puerta al intercambio ilimitado.
La carga de la prueba cambia
No toda teoría con derivadas superiores está condenada. Hay
casos degenerados especiales que evitan este problema. Pero
salir de \(\mathcal{L}(q,\dot q,t)\) ya no es gratis: exige
una estructura adicional muy particular.
La primera parte se parece a un oscilador ordinario. La
segunda viene con el signo malo. Eso basta para perder la
idea de “suelo” energético.
Moraleja física
El salto conceptual importante es separar dos cosas. Una
teoría de orden alto puede pedir más memoria sin que
eso sea todavía un drama. El drama llega cuando esa memoria
extra se organiza en modos con energía positiva y negativa a
la vez. Ahí nace la intuición que luego bautizamos con el
apellido Ostrogradsky.
Maqueta de una energía sin suelo
Esta demo no es una derivación literal del teorema de
Ostrogradsky. Es una maqueta pedagógica: un modo de energía
positiva acoplado a otro de energía negativa. Lo que debe
verse es que el total puede mantenerse casi fijo mientras
\(E_+\) y \(E_-\) crecen en magnitud.
\(\varepsilon=0.090\)
Qué mirar
La barra \(E_{\rm total}\) cambia poco. En cambio,
\(E_+\) y \(E_-\) pueden separarse cada vez más. Ésa es
justamente la intuición de una energía sin fondo.
Por qué esto importa
Una teoría así no falla porque “recuerde demasiado”.
Falla porque permite reorganizar la energía sin un nivel
mínimo que detenga el proceso.
Lectura correcta
Primero ves la enfermedad: no hay suelo. Después le
pones el apellido: ésa es la clase de inestabilidad que
hace sospechoso el caso no degenerado de derivadas
altas.
2.9 Alcance
¿Qué explica esto y qué no?
Ya podemos formular con honestidad lo que hemos conseguido y lo
que no. Hemos mostrado una cadena lógica bastante limpia, pero no
hemos probado que toda ley física concebible tenga que escribirse
como acción local de primer orden.
Lo que sí explica
Si quieres comparar historias completas, componer intervalos,
trabajar localmente por trozos y mantenerte en la clase
ordinaria de teorías organizada por \(q\) y \(\dot q\),
entonces el objeto natural es
\[
S[q]=\int \mathcal{L}(q,\dot q,t)\,dt.
\]
Lo que no demuestra
No demuestra que cualquier dinámica imaginable deba escribirse
así. El problema inverso del cálculo de variaciones muestra
precisamente que unas ecuaciones admiten formulación
lagrangiana y otras no.
Derivadas altas
Tampoco demuestra que toda derivada temporal más alta sea
ilegítima. Lo fino es otra cosa: el caso genérico no
degenerado introduce dificultades profundas, y por eso la
forma de primer orden es el punto de partida sano de la
mecánica ordinaria.
Alcance de Noether
Noether no dice “cualquier simetría imaginable produce una
conservación por magia”. Dentro del marco variacional, la
invariancia de la acción bajo simetrías continuas implica
identidades de divergencia y, en problemas unidimensionales,
primeras integrales o cantidades conservadas.
2.10 La intuición Feynman
¿Por qué esta formulación deja de sonar misteriosa en cuántica?
En formulación clásica,
\[
\delta S=0
\]
es un postulado. Si te quedas solo ahí, la formulación global
puede parecer misteriosa, casi como si la partícula supiera de
antemano el futuro.
La regla cuántica
\[
e^{iS[q]/\hbar}
\]
En cuántica no desaparecen las trayectorias vecinas: todas
contribuyen, pero cada una con una fase determinada por la
acción.
La lectura de fase estacionaria
Si al deformar un poco el camino, \(S\) cambia a primer
orden, la fase gira rápidamente y las contribuciones vecinas
se cancelan. Si \(\delta S=0\), las fases permanecen alineadas
más tiempo y su contribución se refuerza.
La limpieza conceptual
El principio de acción estacionaria deja de sonar a teleología y
pasa a leerse así: en el límite clásico sobreviven las familias
de caminos cuyas fases no se desajustan linealmente. La
formulación global y la formulación local no compiten: la local
es excelente para calcular paso a paso; la global reorganiza la
misma física y hace visibles estructuras que luego se vuelven
centrales.
2.11 Qué conviene retener
La cadena lógica antes de seguir
Si miramos el capítulo desde arriba, la idea ya no debería verse
como una receta, sino como una construcción.
Primero preparamos el problema en términos de estados y
coordenadas. Después decidimos comparar historias completas.
Para hacerlo con limpieza, aceptamos composicionalidad
temporal y localidad por trozos.
La recompensa
Eso hace emerger una acción. Pedir que la acción sea
estacionaria produce Euler–Lagrange. Y las simetrías del
sistema empiezan a fijar qué forma concreta puede tener
\(\mathcal{L}\).
El capítulo siguiente recogerá exactamente esa recompensa:
simetrías, coordenadas generalizadas y el teorema de Noether
como organización profunda de la dinámica.