Nachaz Logo

Une introduction
à l'« Intelligence Artificielle »

Fondements et usages

LiSa Digit SARL

Anas Ghrab · 3 et 4 juillet 2025

Programme - Jour 1

Heure Durée Activité
9h30–11h00 1h30 Concepts fondamentaux / Principaux types d'IA / Les 3 Ingrédients de l'IA (I et II)
11h00–11h20 20 min Pause
11h20–12h50 1h30 Les 3 ingrédients de l'IA (III. Éléments théoriques / Modèles IA)
12h50–13h30 40 min Pause déjeuner
13h30–15h00 1h30 Exploration IA générative multimodale : Suno AI

Programme - Jour 2

Heure Durée Activité
9h30–11h00 1h30 Initiation Python & premières manipulations IA
11h00–11h20 20 min Pause
11h20–12h50 1h30 Applications génératives : texte, image, son
12h50–13h30 40 min Pause déjeuner
13h30–15h00 1h30 Enjeux éthiques, conclusion

Concepts fondamentaux

Introduction

  • L'IA (machine learning) transforme les pratiques culturelles, sociales, citoyennes, industrielles, etc.
  • Outil d'émancipation, de création, mais aussi de vigilance éthique
  • Un enjeu qui concerne toutes les générations et tous les milieux

Applications du machine learning

  • Traitement du texte (traduction, analyse de sentiments, génération de texte)
  • Reconnaissance d'images et de vidéos (classification, détection d'objets, génération d'images)
  • Traitement de la voix et du son (reconnaissance vocale, synthèse vocale, analyse d'émotions, etc.)
  • Prédiction et recommandations (moteurs de recommandation, prévisions financières, détection de fraudes…)
  • Applications génératives (création d'images, musique, vidéos, texte…)

Les systèmes de recommandation

Algorithmes qui suggèrent des contenus, produits ou contacts pertinents à chaque utilisateur.

Autres exemples
de système de recommentation

  • Vidéo & musique : Netflix, YouTube, Spotify
  • E-commerce : Amazon, Cdiscount
  • Réseaux sociaux : Facebook, Instagram, TikTok, LinkedIn
  • Actualités & articles : Google News, Medium
  • Voyages & idées : TripAdvisor, Airbnb, Pinterest

Principes de fonctionnement

  • Suggestions selon l'historique et les intérêts de l'utilisateur => filtrage basé sur le contenu
  • Recommandations basées sur les préférences d'utilisateurs similaires =>filtrage collaboratif
  • Systèmes hybrides : combinaison des deux approches

Objectif : Nous aider à découvrir ce qui nous intéresse parmi une grande quantité de choix
=> mais...

L'IA générative

Les trois ingrédients
de l'IA actuelle

À partir de 2012
(= Deep Learning)

I. Internet
=> Les données massives
(= Big Data)

II. Le matériel informatique

=> Les cartes graphiques (GPU)

III. La théorie mathématique

=> Les réseaux de neurones

Ordre de grandeur des nombres

Préfixe SI Valeur Échelle pratique Échelle longue (EU) Échelle courte (US)
kilo (k) 10³ mille mille mille
méga (M) 10⁶ million million million
giga (G) 10⁹ milliard milliard billion
téra (T) 10¹² mille milliards billion trillion
péta (P) 10¹⁵ million de milliards billiard quadrillion
exa (E) 10¹⁸ milliard de milliards trillion quintillion
zetta (Z) 10²¹ mille milliards de milliards trilliard sextillion
Domaine Utilisation bots Bases de données (★)
Vision Reconnaissance objets/scènes (robots mobiles, surveillance) ImageNet ★★★★★
COCO ★★★★☆
Parole Reconnaissance/parole (assistants, robots accueil) LibriSpeech ★★★★☆
Common Voice ★★★★☆
Langage Dialogue/texte (chatbots, robots sociaux) Wikipedia ★★★★★
Cornell Dialogs ★★★☆☆
Manipulation Manipuler objets (bras robotisés) YCB ★★★★☆
KITTI ★★★★☆
Navigation Se déplacer (robots exploration, domestiques) Matterport3D ★★★★☆
AI2-THOR ★★★★☆
Geste Gestes humains (robots interactifs, jeux) MPII Pose ★★★★☆
Human3.6M ★★★★☆
Multimodal Comprendre scènes complètes (robots compagnons) VQA ★★★★☆
AVSD ★★★☆☆
Caractéristiques des modèles les plus récents
Modèle Société Open Source Taille (paramètres) Multilingue Date de création
Gemma 3 Google Mind Oui Non divulgué (~Trillion*) Oui Février 2025
GPT-4o OpenAI Non Non divulgué (~Trillion*) Oui Mai 2024
Gemini 1.5 Pro Google DeepMind Non Non divulgué Oui Février 2024
Llama 3 Meta Oui 8B, 70B Oui Avril 2024
Claude 3 Opus Anthropic Non Non divulgué Oui Avril 2024
Mixtral 8x22B Mistral AI Oui 141B (MoE) Oui Décembre 2023
Gemma Google Oui 2B, 7B Oui Février 2024
Qwen2-72B Alibaba Oui 72B Oui Mai 2024
Yi-34B 01.AI Oui 34B Oui Novembre 2023
Mistral 7B Mistral AI Oui 7B Oui Septembre 2023
BLOOM BigScience Oui 176B Oui Juillet 2022

* La taille exacte de GPT-4o n'est pas publique, mais les estimations évoquent plusieurs centaines de milliards à un trillion de paramètres.
MoE = Mixture of Experts (architecture hybride).

Les erreurs systémiques

Biais

  • Données d'entraînement déséquilibrées
  • Décisions injustes ou discriminatoires

Hallucinations

  • Génération de contenu inventé
  • Apparaît surtout dans les modèles de langage
  • Solutions : vérification, récupération d'information

L'IA & la manipulation des masses

IA & manipulation des masses

  • Deepfakes politiques – Vidéos truquées diffusées lors d’élections
  • Bots sur réseaux sociaux – Amplification artificielle de messages ou hashtags
  • Fake news automatisées – Génération d’articles ou de commentaires trompeurs
  • Micro-ciblage électoral – Messages personnalisés pour influencer le vote
  • Phishing avancé – Arnaques adaptées à chaque profil grâce à l’IA
  • Recommandations extrêmes – Algorithmes poussant des contenus polarisants

Le « fake » sur Facebook ?

  • Comptes fake : environ 4 à 5 % des comptes actifs mensuels sont considérés comme faux ou dupliqués (source : Meta 2024)
  • Contenus fake (désinformation) : difficile à estimer, mais études indépendantes : 1 à 3 % des publications publiques pourraient être des fausses informations
  • La majorité des fake news ne sont ni signalées ni supprimées ; le chiffre réel pourrait varier selon la période et le contexte

Estimations du contenu "fake" sur le web

  • Pas de % unique pour tout le web, mais des tendances claires :
    • 5-15% des contenus viraux sur réseaux sociaux lors de crises (élections, pandémie…) seraient faux ou trompeurs
    • Jusqu’à 20-30% des infos COVID-19 sur réseaux sociaux identifiées comme fausses (OMS, 2020)
    • Deepfakes : +50 000 vidéos détectées en 2020, double chaque année (Deeptrace)
  • Types de contenus fake : Fake news (textes), images/vidéos truquées, faux profils, faux avis…
  • Sujets les plus touchés : Politique, santé, finance
  • Difficile à mesurer précisément : Le web est en constante évolution

Sources : Science (2018), WHO (2020), Deeptrace (2020), EU DisinfoLab (2024)

Contenu généré par IA (utile, non fake) : estimations

  • 3 à 10 % du contenu web grand public déjà généré ou rédigé par IA (2024, tous types confondus)
  • Jusqu’à 20 % des nouveaux articles publiés chaque jour sur le web seraient partiellement ou totalement créés par IA (SEO, guides, FAQ…)
  • 30 % de la documentation technique et des synthèses générées par IA dans de grandes entreprises tech
  • Domaines les plus concernés : blogs, tutoriels, FAQ, documentation technique, résumés, newsletters, code
  • Difficile à détecter : beaucoup de contenus IA ne sont pas signalés

Sources : Originality.ai (2024), NewsGuard (2024), Europol (2024)

Souverainté numérique

Centres de données en Tunisie (2025)

  • DataXion (Tunis) : Seul centre certifié Tier IV en Tunisie, offrant des services de colocation et d'hébergement sécurisé
  • EO Data Center (Enfidha, Sousse) : Fournit des services Cloud, IaaS, SaaS et PaaS, ainsi que des solutions de sauvegarde et de reprise après sinistre
  • Orange Data Center (Kalaa Kebira, Sousse) : Centre de données de 1 000 m², inauguré en mai 2025, supportant les services d'Orange et les besoins des clients
  • CenterServ Tunis Data Center (Tunis) : Offre des services de colocation, cloud et IT managés avec des infrastructures avancées et des mesures de sécurité robustes
  • [Poulina Group Holding Data Center (Tunis) : Centre de données opéré par Poulina Group Holding, participant à l'infrastructure numérique croissante de la Tunisie]

Répartition estimée des types de données hébergées

  • Services Cloud & Virtualisation : 35%
    Hébergement de sites web, applications métiers, services SaaS/IaaS/PaaS pour entreprises et administrations
  • Télécommunications & Fournisseurs d'accès Internet : 25%
    Données réseau, logs internet, téléphonie pour les opérateurs tels qu'Orange, Tunisie Télécom, Ooredoo
  • Banques & Secteur Financier : 15%
    Transactions électroniques, données clients, conformité réglementaire pour les institutions financières
  • Gouvernement & Secteur Public : 15%
    Services e-gouvernement, dossiers citoyens, éducation, sécurité sociale
  • Médias & Contenus Numériques : 10%
    Streaming, portails web, archives de presse et contenus multimédias

Nb datacenters/pays (2025)

Pays Nombre de centres
États-Unis 5 383
Allemagne 522
Royaume-Uni 512
Chine 449
France 316
Afrique (total) 167
Tunisie 4

Premiers pas Python et manipulations IA

  • Découverte de l'environnement Python/Notebook
  • Exercices pratiques : premiers algorithmes, manipulation simple de données
  • Initiation aux concepts de base de l'IA via la pratique

Réseaux de neurones, IA moderne, concepts et démo

  • Explication des réseaux de neurones et de l'IA moderne
  • Manipulation sur un exemple visuel (ex : MNIST)
  • Discussion sur les usages et limites

IA appliquée : texte, image, son

  • Découverte des modèles appliqués au texte, à l'image et au son
  • Ateliers pratiques sur chaque modalité
  • Analyse critique des résultats

Liens utiles