fix

xadupre · xadupre · commit e965a7f27856 · 2025-11-07T00:42:38.000+01:00
diff --git a/.github/workflows/ci.yml b/.github/workflows/ci.yml
@@ -44,4 +44,10 @@ jobs:
       - name: run tests
         run: |
           pip install pytest
-          PYTHONPATH=. UNITTEST_GOING=1 pytest --durations=10 _unittests  --ignore-glob=**pygame*.py
+          PYTHONPATH=. UNITTEST_GOING=1 pytest --durations=10 _unittests  --ignore-glob=**pygame*.py --ignore _unittests/ut_xrun_doc/test_documentation_examples.py --ignore _unittests/ut_xrun_doc/test_documentation_notebook.py
+
+      - name: run tests examples
+        run: PYTHONPATH=. UNITTEST_GOING=1 python --durations=10 _unittests/ut_xrun_doc/test_documentation_examples.py
+
+      - name: run tests notebooks
+        run: PYTHONPATH=. UNITTEST_GOING=1 python --durations=10 _unittests/ut_xrun_doc/test_documentation_notebooks.py
diff --git a/_doc/practice/exams/td_note_2025.ipynb b/_doc/practice/exams/td_note_2025.ipynb
@@ -15,12 +15,12 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "## Q1"
+    "## Q1 - Implémenter une fonction qui calcule la distance entre deux matrices"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 3,
+   "execution_count": 1,
    "metadata": {},
    "outputs": [
     {
@@ -29,7 +29,7 @@
        "np.int64(45)"
       ]
      },
-     "execution_count": 3,
+     "execution_count": 1,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -51,12 +51,12 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "## Q2"
+    "## Q2 - Implémenter une fonction qui retourne les p ermutations des n premiers entiers"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 6,
+   "execution_count": 2,
    "metadata": {},
    "outputs": [
     {
@@ -88,7 +88,7 @@
        " (3, 2, 1, 0)]"
       ]
      },
-     "execution_count": 6,
+     "execution_count": 2,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -108,12 +108,12 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "## Q3, Q4"
+    "## Q3, Q4 - Implémenter une fonction qui p ermute les colonnes d'une matrice."
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 23,
+   "execution_count": 3,
    "metadata": {},
    "outputs": [
     {
@@ -124,7 +124,7 @@
        "       [ 8,  7]])"
       ]
      },
-     "execution_count": 23,
+     "execution_count": 3,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -145,12 +145,12 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "## Q5"
+    "## Q5 - Ecrire une fonctionne qui retourne les deux p ermutations ligne/colonne qui minimise la distance entre les deux matrices, en déduire la case qui a changé."
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 24,
+   "execution_count": 4,
    "metadata": {},
    "outputs": [
     {
@@ -159,7 +159,7 @@
        "((1, 0, 2), (1, 0))"
       ]
      },
-     "execution_count": 24,
+     "execution_count": 4,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -184,7 +184,7 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "## Q6\n",
+    "## Q6 - Quel est le coût de cette fonction ?\n",
     "\n",
     "Si $i$ et $j$ sont les dimensions de deux tables, c'est $O((i!)(j!))$."
    ]
@@ -193,12 +193,14 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "## Q7"
+    "## Q7 - C'est b eaucoup trop long.\n",
+    "\n",
+    "On prop ose que calculer chaque p ermutation séparément. On cherche donc la meilleure p ermutation qui minimise la distribution de la somme par ligne et par colonne entre les deux matrices. Ecrire une fonctionne qui implémente ce raisonnement.\n"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 25,
+   "execution_count": 6,
    "metadata": {},
    "outputs": [
     {
@@ -207,7 +209,7 @@
        "((0, 1), (1, 0, 2))"
       ]
      },
-     "execution_count": 25,
+     "execution_count": 6,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -244,45 +246,162 @@
   {
    "cell_type": "markdown",
    "metadata": {},
-   "source": []
+   "source": [
+    "## Q8 - Mais c'est encore trop coûteux.\n",
+    "\n",
+    "On cherche la matrice M qui minimise AM =B\n",
+    "où A et B sont les sommes sur les colonnes où lignes des matrices de statistiques observées sur deux années."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Précisons d'abord ce qu'est une matrice de permutations $M$ : une matrice carrée dont les coefficients sont 0 ou 1. De plus, sur chaque ligne et chaque colonne, on ne trouve qu'un et un seul 1."
+   ]
   },
   {
    "cell_type": "code",
-   "execution_count": null,
+   "execution_count": 9,
    "metadata": {},
-   "outputs": [],
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "A\n",
+      "[[0 1]\n",
+      " [2 3]\n",
+      " [4 5]]\n",
+      "M\n",
+      "[[0 1 0]\n",
+      " [0 0 1]\n",
+      " [1 0 0]]\n",
+      "M @ A\n",
+      "[[2 3]\n",
+      " [4 5]\n",
+      " [0 1]]\n"
+     ]
+    }
+   ],
    "source": [
-    "import numpy as np\n",
-    "\n",
+    "M = np.array([[0, 1, 0], [0, 0, 1], [1, 0, 0]])\n",
+    "A = np.arange(6).reshape((3, -1))\n",
+    "print(\"A\")\n",
+    "print(A)\n",
+    "print(\"M\")\n",
+    "print(M)\n",
+    "print(\"M @ A\")\n",
+    "print(M @ A)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "$MA$ permute les lignes, $AM$ permute les colonnes. Donc trouver la matrice $M$ qui minimise $\\lVert AM - B \\rVert^2$ où $B$ obtenue avec une permutation des colonnes de la matrice $A$ permettrait de déterminer cette permutation. Ce n'est pas un système d'équations en bonne et due forme mais c'en est un."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 14,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "[[ 1.76711027  2.68346008]\n",
+      " [-1.00760456 -1.85931559]]\n",
+      "rang 2\n"
+     ]
+    }
+   ],
+   "source": [
+    "M, _, rang, _ = np.linalg.lstsq(table1, table2)\n",
+    "print(M)\n",
+    "print(\"rang\", rang)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Le problème est qu'il y a plus d'inconnues que d'équations, d'où le rang faible (2). Avant de revenir à cette option. On part dans une autre direction. La plus grande des catégories de populations a beaucoup de chance d'être la plus grande l'année suivante. Donc la recherche du maximum dans les matrices A et B dévoile une partie de la matrice M. On applique cette idée aux sommes des lignes et des colonnes."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 17,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "((0, 1), (2, 0, 1))"
+      ]
+     },
+     "execution_count": 17,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "def optimise_vecteur_tri(vec1, vec2):\n",
+    "    pos_vec1 = [(v, i) for i, v in enumerate(vec1)]\n",
+    "    pos_vec1.sort()\n",
+    "    return tuple(p[1] for p in pos_vec1)\n",
     "\n",
-    "coef = np.random.rand(5).reshape((-1, 1))\n",
-    "coef[:, 0] = 1\n",
-    "print(coef)\n",
-    "t1 = np.ones((5, 1)) @ np.array([[5, 1, 2, 3, 4]], dtype=np.float32)\n",
-    "t2 = np.ones((5, 1)) @ np.array([[2, 3, 1, 4, 5]], dtype=np.float32)\n",
-    "M = np.array(\n",
-    "    [\n",
-    "        [0, 0, 1, 0, 0],\n",
-    "        [0, 0, 0, 1, 0],\n",
-    "        [0, 1, 0, 0, 0],\n",
-    "        [0, 0, 0, 0, 1],\n",
-    "        [1, 0, 0, 0, 0],\n",
-    "    ]\n",
-    ").T\n",
     "\n",
-    "# Il faut diminuer le nombre de solutions pour n'en garder qu'une.\n",
-    "for i in range(5):\n",
-    "    t1[i, t1[i, :] == i] = i + 0.01\n",
-    "    t2[i, t2[i, :] == i] = i + 0.01\n",
+    "def optimise_fast_tri(table1, table2):\n",
+    "    return (\n",
+    "        optimise_vecteur_tri(table1.sum(axis=0), table2.sum(axis=0)),\n",
+    "        optimise_vecteur_tri(table1.sum(axis=1), table2.sum(axis=1)),\n",
+    "    )\n",
     "\n",
-    "assert (t1 @ M - t2).max() < 1e-6\n",
     "\n",
-    "m = np.linalg.lstsq(t1, t2)\n",
-    "print(t1)\n",
-    "print(t2)\n",
-    "print(M)\n",
-    "print((m[0] * 100).astype(int) / 100)"
+    "optimise_fast_tri(table1, table2)"
    ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "On revient au problème d'optimisation : $\\lVert AM - B \\rVert^2$. Il faudrait pouvoir forcer les coefficients de la matrice à être 0 ou 1 en ajoutant une contrainte. On utilise pour cela fonction $f(x)=x(1-X)$ qui vaut 0 quand $x \\epsilon \\{0,1\\}$. On cherche donc $M$ qui minimise $\\lVert AM - B \\rVert^2 + \\lambda \\lVert M^2*(1-M)^2\\rVert$ où $*$ est une multiplication terme à terme. Mais résoudre ce problème n'est pas simple. On en restera là pour le moment."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Q9 - Comment utiliser cette fonction p our implémenter une version plus rapide de la fonction à la question 5."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Le code de la question précédente répond à la question."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Q10 - La troisième année, une colonne est coupée en deux : une catégorie est divisée en deux sous-catégorie. Que proposez-vous p our y remédier ?"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "L'idée est assez simple, on choisit au hasard deux lignes de la seconde matrice et on les aggrège. On la fonction précédente pour en déduire les deux permutations les moins coûteuses puis on conserve le coût de cette permutation. On fait pour toutes les paires et on ne garde que la meilleure paire."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": []
   }
  ],
  "metadata": {