Reprenons l’exemple du calcul du coût de revient d’un tuyau métallique, composé de différentes sections et coudes, soudés entre eux. La valeur de sortie (le coût de revient) est une combinaison des valeurs d’entrée avec certains coefficients que vous pouvez détailler selon différents cas.

Regardons 2 approches pour calculer le prix de ce tuyau :

L’approche classique

Le coût d’un tuyau métallique peut se décomposer  :

Coût d’un tuyau =

coût de la matière

+  coût de la soudure

+  coût de la peinture

+  frais fixe.

Si vous faites cette opération de manière fréquente, plutôt que de calculer à la main, vous aurez vite fait d’écrire un algorithme qui demande les longueurs, nombreux de coudes et diamètre de tuyaux pour vous donner le coût de revient final selon une somme de calculs intermédiaires. Pour cela, il vous faudra cependant réfléchir au lien entre le diamètre et la masse du tuyau d’une part, le temps de soudure d’autre part et bien d’autres liens, certes simples, entre vos variables d’entrées.

 

L’approche Supergeek : avec un peu de machine learning

(et beaucoup de données), dans ce cas, vous pouvez vous illustrer à la machine à café par une approche innovante :
– Rassembler toutes vos estimations précédentes dans un tableau avec des paramètres d’entrée x1, x2, x3 donnant un y. Ici x1, x2, x3 sont respectivement le diamètre, le nombre de section droite d’une longueur minimale et le nombre de coudes et y le prix.
– Séparer votre tableau en 2 jeux de données : le jeu d’apprentissage et le jeu de tests (c’est là qu’il faut beaucoup de données)
– Effectuer une régression linéaire par un algorithme type « gradient descent » sur l’ensemble de votre jeux d’apprentissage en postulant que  h(x) = ao.x0 + a1.x1 + a2x2. a3.x3  (avec xo=1). Ce faisant, votre algorithme va définir par « l’expérience », les valeurs de ai (i=1 à 4) qui minimisent l’écart entre y constaté et h(x) calculé
– vérifier que ça marche sur votre jeu de test en comparant y et h(x) pour ces lignes du tableau.

Une fois cela terminé, vous pourrez rentrer directement x1, x2, x3 pour vos prochains calculs pour trouver le prix y correspondant. Et vous n’aurez même pas eu besoin de connaitre le taux horaire du soudeur, ni la densité de l’acier, ni le lien entre les 2 !!

 

Quelle leçon en retenir ?

Dans ce petit exemple illustratif, sous réserve d’avoir un grand nombre de données et le bon modèle entre y et xi (ici linéaire), vous pourrez potentiellement vous affranchir de l’étape de réflexion de l’approche classique. En fait, il suffit d’un grand nombre de données et d’algorithme robuste pour pouvoir recréer une boîte noire qui transforme des valeurs d’entrées en une valeur de sortie, même sans rien connaitre au système interne.

Une leçon à méditer?