🔮Explication du modèle de détection

Les détections disponibles dans « Signaux Faibles » sont issues d’un modèle d’apprentissage statistique. Ce modèle calcule la probabilité d’une entreprise d’entrer en défaillance, c’est-à-dire en procédure collective sous 18 mois.

Pour en savoir plus sur la lecture des motifs de détection, rendez-vous ici.

Sur quelles données reposent les détections ?

Le modèle de détection croise des données :

  • Données de retards de paiement fournisseurs – source : Altares

  • Données d’activité partielle – source : Ministère du Travail

  • Données de cotisations appelées et d’impayés URSSAF – source : ACOSS

  • Données de délai accordés par l’URSSAF – source : ACOSS

  • Données issues des liasses fiscales – source : DGFiP

  • Données générales : SIREN, Effectif

Quelles sont les spécificités de la nouvelle détection ?

  • Le modèle a évolué : la méthode de calcul mathématique a été modifiée pour ce qui est de l’apprentissage automatique. Les règles expertes ont été supprimées.

  • Les données utilisées ne sont plus les mêmes : on utilise toutes les données mises à notre disposition sur la période allant de 2016 à 2024.

  • Les variables exploitées lors d’une prédiction ont été modifiées et augmentées. Par exemple, de nombreux ratios financiers ont été ajoutés à l’analyse. Ils sont consultables dans la documentation.

La détection est ensuite organisée en trois niveaux de risque, représentés par palier :

  • un niveau « risque fort » 🔴 où la précision est privilégiée, c'est-à-dire que le niveau de confiance en une prédiction positive (l'algorithme prédit une entrée en défaillance sous 18 mois) est élevé.

  • un niveau « risque modéré » 🟠 est construite de sorte à capturer un plus grand nombre d'entreprise que dans le niveau précédent, en privilégiant le rappel, quitte à ce que des entreprises de cette liste ne soient en réalité pas considérées comme à risque par les utilisateurs (« faux positifs »).

  • un niveau « aucun signal » de risque 🟢, comprenant toutes les entreprises de notre périmètre n'entrant pas dans les deux catégories ci-dessus.

L’explication détaillée de cette nouvelle détection se trouve ici : Documentation publique de l’algorithme.

Pour en savoir plus sur le modèle, consultez notre documentation.

Des questions ?

Tout d’abord, n’hésitez pas à vous rendre sur la page de documentation publique de l’algorithme.

Nous restons à votre disposition pour toute demande d’information complémentaire :

  • anna.ouhayoun@beta.gouv.fr

  • esther.spindler@beta.gouv.fr

Last updated

Was this helpful?