[AUDIO_VIDE] Bienvenue dans cette nouvelle séance de Simuler l'aléatoire! Le but de cette séance va être d'illustrer la notion d'indépendance d'un couple de variables aléatoires. Nous allons illustrer cette notion d'indépendance avec ce qu'on appelle des fléchettes aléatoires et nous allons considérer deux sortes de fléchettes aléatoires. Le premier exemple est un jeu de fléchettes gaussiennes, dans le sens suivant : pour tirer un point X, Y dans R 2, de manière aléatoire, plus précisément, vous prenez X et Y indépendants. Et X et Y suivent tous deux une loi normale centrée réduite. Ce qui va nous intéresser est deux nouvelles variables aléatoires qu'on peut déduire de celle-là, qui sont tout simplement les coordonnées polaires, c'est-à-dire le rayon, qui n'est rien d'autre que la distance du point que vous avez tiré au centre de la cible et l'angle qui est l'arc tangente de Y/X. On s'intéresse à la question suivante : fixer deux angles, thêta 1 et thêta 2 dans 0, 2 pi et vous demander quelle est la loi du rayon, sachant que l'angle est compris dans cet intervalle d'angle. Vous pouvez faire la chose symétrique et vous demander : si je fixe deux rayons, r 1 et r 2, comment va dépendre la loi de l'angle, sachant que le rayon est assujetti à être dans cet intervalle? Nous allons faire une simulation numérique de ce problème pour voir ce qui se passe et après, nous analyserons mathématiquement la situation. Voici l'expérience numérique que nous vous proposons. On peut tirer donc un certain nombre de points dont les coordonnées sont indépendantes et chacune suit une loi normale centrée réduite. Ҫa fait un nuage de points comme ça, qui a une symétrie approximativement radiale. Dessous, ce qu'on représente, ici, c'est l'histogramme des rayons, c'est-à-dire on prend chaque point, on regarde sa distance au centre, on regarde combien de points tombent, des rayons qui tombent dans un certain intervalle, puisqu'on a divisé des rayons possibles en petits intervalles ici. Et la question que nous, on formulait, revient à se demander ce qui se passe si, on regarde seulement ce qui se passe dans ce secteur angulaire, et qu'on regarde l'histogramme correspondant pour les rayons. Donc faisons-le ensemble. Nous voyons que si nous modifions le secteur angulaire et que nous regardons seulement les points qui sont dans ce secteur angulaire, leur histogramme des rayons, on constate qu'ils varient très peu, en fait. On peut continuer à explorer le secteur angulaire. Vous voyez qu'à de petites fluctuations près, on a quand même une forme à peu près définie pour l'histogramme des rayons. Ҫa semble indiquer qu'on a beau conditionner à avoir un angle qui est compris entre ces deux valeurs, la distribution des rayons est assez insensible. On peut faire la même chose pour les angles. C'est-à-dire fixer un anneau et regarder comment est distribué, comment sont distribués les angles de ces points dans cet anneau, et ce qu'on constate, c'est que, vous voyez, si je prends un anneau, il y a pas mal de points, on constate une répartition approximativement uniforme des angles et qui est assez insensible au fait qu'on modifie cet anneau. Bien entendu, si on prend un anneau comme ça, par exemple, qui s'écarte vraiment du centre, étant donné qu'on a des tirages gaussiens, la probabilité de tomber assez loin, ici, est assez petite, donc c'est pour ça que l'histogramme est beaucoup plus fluctuant. Mais si on reste dans la zone où les points se concentrent essentiellement, vous voyez que l'histogramme des angles est à peu près insensible à l'anneau qu'on choisit. Dans cette expérience numérique, on peut, bien sûr, augmenter le nombre de tirages. Là, on constate qu'à de petites fluctuations près, l'angle semble uniformément distribué dans cet anneau. Donc la conclusion de cette petite expérience numérique, c'est qu'il semblerait que le rayon et l'angle comme variables aléatoires sont indépendantes. On va essayer de voir mathématiquement pourquoi c'est vrai. Et pour ça, on va changer de variable. Alors il faut faire un peu attention au changement de variable. On va passer des coordonnées x, y aux coordonnées r, thêta, donc des coordonnées cartésiennes aux coordonnées polaires. On a une fonction g qui va du plan privé de l'origine dans 0 plus l'infini fois 0, 2 pi. Il faut faire attention aux intervalles ouverts, pour que ce soit bien une bisection. L'inverse de cette bisection, qui associe à un rayon et un angle des coordonnées cartésiennes, on le connaît explicitement, c'est qu'on a x égal r cosinus thêta et y égal r sinus thêta. La fonction réciproque donc, que je réécris ici, on peut calculer la matrice jacobienne associée à ce changement de variable, qu'on écrit souvent comme ça : ici donc, j'ai la dérivée partielle de x par rapport à r, qui donne cosinus thêta, la dérivée de x par rapport à thêta, qui donne donc moins r sinus thêta. Ici, je dérive y par rapport à r, ça fait sinus thêta, et y par rapport à thêta, ça fait r cosinus thêta. Le déterminant de cette matrice va nous donner le jacobien, qui est ici, et vous voyez qu'on trouve r cosinus carré thêta plus r sinus carré thêta, donc tout simplement r. Grâce à ce calcul, on va pouvoir transformer la densité de départ, qui est en coordonnées cartésiennes, en une densité qui maintenant s'exprimera en fonction de r et thêta. J'applique la formule du cours. La densité associée au couple R, grand thêta, ça va être le jacobien qui est r fois la densité de départ exprimée dans les nouvelles variables, qui sont r cosinus thêta, r sinus thêta. Et il ne faut pas oublier l'indicatrice de r, l'indicatrice de 0 plus l'infini, r est un rayon strictement positif. Et l'angle est compris strictement entre 0 et 2 pi. Vous vous souvenez qu'on tire indépendamment X et Y selon les lois normales centrées réduites, ce qui veut dire que f (X, Y) (x, y) s'écrit comme le produit des densités de chacune des coordonnées. On a donc 1 sur racine de 2 pi exponentielle moins x au carré sur 2 fois 1 sur racine de 2 pi exponentielle de moins y 2 sur 2, ce qui donne cette expression. Il nous reste à remplacer dans la formule du dessus ce qu'on trouve. Et le r de départ. Alors j'ai juste réorganisé le produit des termes pour mettre tout ce qui dépend que de r ici, tout ce que dépend que de thêta ici. J'obtiens cette formule, juste en remplaçant, et vous constatez que si j'intègre cette densité sur thêta, ça va faire tout simplement disparaître ça, qui va valoir 1. Et si, d'autre part, j'intègre sur la variable r, il est facile de vérifier que l'intégrale de ça est bien 1, autrement dit la densité du couple R, thêta s'écrit comme le produit de la densité pour R et de la densité pour thêta. D'après le théorème du cours, ça signifie que les variables R et thêta sont indépendantes. Je mentionne en passant que cette loi ici, vous voyez, il y a un terme e moins r carré et il y a un r devant, on appelle ça la loi de Rayleigh. Et ici, on reconnaît la loi uniforme, ce qu'on avait observé dans l'expérimentation numérique. Le deuxième jeu de fléchettes auquel on va jouer, est différent. Cette fois-ci, on va tirer les fléchettes uniformément, ce qui signifie la chose suivante. Le point X, Y dans le plan est composé de deux variables indépendantes X et Y, et chacune est tirée uniformément dans l'intervalle moins 1, 1. Voyons ce que ça donne, si on fait une expérience numérique. Voilà l'expérience numérique correspondante à ces fléchettes uniformes. On a donc à tirer un grand nombre de points uniformément en X et en Y dans l'intervalle moins 1, 1. Ҫa donne ce nuage et on se demande maintenant comment est influencé l'histogramme des rayons de ces points, donc leur distance à l'origine, quand on regarde des secteurs angulaires différents. On se doute assez vite que, vu la symétrie de cette figure, quand on regarde l'histogramme des rayons dans ce secteur angulaire, les rayons ici ne peuvent pas dépasser 1. L'histogramme va s'arrêter ici. Alors que si on prend un secteur angulaire qui contient un coin, les choses vont être manifestement différentes, puisqu'ici, le rayon peut aller jusqu'à racine de 2. Donc déjà on voit une nette différence, c'est que l'histogramme va jusqu'à des valeurs plus élevées. C'est une situation très différente de tout à l'heure, qui n'est pas très surprenante, étant donné que maintenant, on constate que ce nuage de points aléatoire n'a plus du tout la symétrie radiale de tout à l'heure. On peut également regarder ce qui se passe pour les angles. Si on prend un anneau assez petit, on trouve une répartition uniforme de l'angle, ce qui n'est pas très surprenant, puisque là, vous voyez, statistiquement, on ne sait pas distinguer des directions différentes, on voit à peu près la même chose dans tous les rayons. Par contre, si je prends un anneau qui va commencer à être assez grand et qui va, en particulier, dépasser comme ça, on voit un phénomène très différent de tout à l'heure. En particulier, vous voyez, si je commence à aller par là, on voit quatre pics qui apparaissent et ces quatre pics correspondent à ces zones-là, qui sont très particulières, puisqu'ici il n'y a plus de points, alors qu'ici, il y a encore des points et donc ça fabrique cet histogramme périodique pour les angles. Nous allons voir pourquoi mathématiquement on a cette situation, qui est que, en fait, l'angle et le rayon ne sont plus du tout indépendants, dans ce cas de figure. Si nous reprenons l'hypothèse de départ, la densité du couple X, Y, c'est le produit des densités, puisqu'on tire indépendamment l'abscisse et leurs données, et chacune suit une loi uniforme dans l'intervalle moins 1, 1. Donc on obtient un demi fois l'indicatrice de moins 1, 1 pour x et un demi de l'indicatrice de moins 1, 1 y. Pour y. Le calcul que nous avons fait tout à l'heure pour passer des coordonnées cartésiennes aux coordonnées polaires, nous a donné le jacobien qui est le même, qui est R, qui est ici. J'ai remis un quart de ces deux indicatrices où maintenant, j'ai remplacé x et y par respectivement r cosinus thêta et r sinus thêta. Et il nous reste à multiplier par l'indicatrice que le rayon est bien strictement positif et l'angle, strictement compris entre 0 et 2 pi. Vous constatez facilement que cette densité pour le couple R, thêta, vous ne pourrez jamais la mettre sous la forme d'un produit de deux fonctions, l'une dépendant que de R, l'autre dépendant que de thêta. Qui montre que R, thêta ne sont plus des variables indépendantes. Remarquez que quand on était en coordonnées cartésiennes, nous avions deux variables indépendantes, X était indépendant de Y. Le fait que nous soyons passés en coordonnées polaires a brisé cette indépendance. Nous avons maintenant deux variables dépendantes. La raison sous-jacente est simplement que les coordonnées polaires sont très mal adaptées aux symétries du problème, contrairement au cas précédent, qui était le cas gaussien, où précisément les variables R et thêta étaient très bien adaptées au fait que la densité associée pour le couple avait une symétrie radiale. Donc il faut faire attention quand on s'intéresse à l'indépendance des variables aléatoires, que le choix qu'on fait de représentation influe de façon très importante sur leur dépendance ou leur indépendance et c'est souvent lié aux symétries sous-jacentes de votre loi de probabilité. Ainsi s'achève cette séance. Maintenant, vous pouvez utiliser ces expériences numériques pour continuer votre exploration.