Sur Les Dynamiques de Langevin et l'Optimisation Globale
En appliquant la seconde loi de Newton à une particule brownienne représentative, Langevin a inventé la
- La force de friction, par la loi de Stoke’s a la forme suivante
où
la force aléatoire causées par les collisions aléatoire des particules.
La loi de Newton donne :
Où m est la masse de la particule.
On remarque que:
Le résultat
Le nombre de particules supendus dans un fluide avec un déplacement sur un petit intervalle
en manipulant cette équation Einstein arrive a l’équation de diffusion:
-
est la densité de probabilité de qui est supposée symmétrique: non nulle pour des petites valeurs de . -
est le nombre de particules par unité de volume et la position.
A partir de cette équation Einstein est arrivé à la prédiction du déplacement quadratique moyen
En 1908 Langevin a publié un article sur ce sujet où il a suggéré ce qu’ensuite serait connu sous le nom de « l’équation de Langevin ». La simplicité perçue de l’approche de Langevin a été largement utilisé au coût de pousser à l’existence de nouveaux objets mathématiques avec des propriétés moins classiques.
Faisant partie des équations stochastiques, le model de Langevin est heuristique, au sens qu’on espère des solutions de la théorie des équations différentielles ordinaires classique (non homogènes) mais qu’on a pas à priori une preuve analytique de l’existence des solutions; on exprime un modèle approximé qui peut, à partir d’un certain temps, aller terriblement faux. On ne peut pas, à cette heure, en général justifiablement proposer des solutions à des équations différentielles stochastiques par des extensions des solutions déterministes des équations différentielles ordinaires. On aura besoin d’une théorie d’analyse propre, l’analyse d’Ito en l’occurence.
Cette équation en particulier, est une approximation de l’équation du mouvement d’une particule brownienne.
Langevin a manipulé ces objets avec caution et intuitivement, toutefois, leurs propriétés formelles ont été développées et sont largement utilisées.
2. Dans quel cas le modèle de Langevin est-il utile ?
Dans la modélisation de quelques phénomènes dynamiques où les dynamiques exactes du système sont incertains. L’effet du bruit thermal dans les circuits électriques et plusieurs types de perturbations dans les systèmes de télécommunications peuvent être modélisés par des équations différentielles stochastiques.
Par exemple, ce genre de modèle est souvent utilisé dans les systèmes de navigation et de controle.
Dans l’analyse de la course de la bourse, on se sert souvent de formes particulière de l’équation de Langevin, celle du Black Scholes, ainsi d’autres variations du modèle pour l’analyse des grandeurs apparentées.
Dans cet article on touche un peu, un de ses usage dans l’apprentissage automatique.
3. De l’énergie physique à l’énergie espérée du point mathématique ?
Intuitivement et de manière très grossière, partant du principe que les particules
Les particules sont caractérisées par une distribution de probabilité mais les poids de notre réseau de neurones sont fixes ?
- Une manière de quantifier la certitude autour des prédictions.
- Régularisation.
- Réduction de variabilité pour les résultats de l’algorithme d’apprentissage.
Ces avantages ont fait de l’apprentissage profond Bayesien un des domaines les plus actifs de recherche en apprentissage.
Pour plusieurs systèmes d’optimisation avec contraintes en physique, les distributions de probabilité qui minimisent l’énergie ont souvent la même allure :
Ce qu’on appelle en physique la distribution de Boltzmann.
Où:
et est la température.
6. Pour illustrer la relation de entre les optimums de et une fonction test double puits .
On peut estimer l’ordre de la méthode stochastique expérimentalement (ici en comparant l’erreur avec l’intégrale exacte ou intégrale mieux estimée d’une fonction test par une autre méthode où l’analyse nous assure l’ordre) dans ce cas on peut voir qu’avec une intégration Euler Maruyama, notre intégration est estimée au sens faible du premier ordre, et dans ce cas on vérifie qu’elle du premier ordre au sens faible.

Bibliographie
[1] P. (1872-1946) A. du texte Langevin, Oeuvres scientifiques de Paul Langevin / Centre national de la recherche scientifique. 1950. Consulté le: 13 novembre 2021. [En ligne]. Disponible sur: https://gallica.bnf.fr/ark:/12148/bpt6k2387g
[2]deepbayes-2019/lectures/day5/2. Kirill Neklyudov - Langevin dynamics at master · bayesgroup/deepbayes-2019. GitHub [https://github.com/bayesgroup/deepbayes-2019/tree/master/lectures/day5/2.%20Kirill%20Neklyudov%20-%20Langevin%20dynamics](https://github.com/bayesgroup/deepbayes-2019/tree/master/lectures/day5/2. Kirill Neklyudov - Langevin dynamics).
[3] « A look at SGD from a physicists’ perspective - Part 2, Bayesian Deep Learning », Henri Palacci, 30 Janvier 2018. https://henripal.github.io/blog/nealbayesian (consulté le 13 novembre 2021).