Une introduction
à l'« Intelligence Artificielle »

Fondements et usages

Anas Ghrab · 3 et 4 juillet 2025

Programme - Jour 1

Heure	Durée	Activité
9h30–11h00	1h30	Concepts fondamentaux / Principaux types d'IA / Les 3 Ingrédients de l'IA (I et II)
11h00–11h20	20 min	Pause
11h20–12h50	1h30	Les 3 ingrédients de l'IA (III. Éléments théoriques / Modèles IA)
12h50–13h30	40 min	Pause déjeuner
13h30–15h00	1h30	Exploration IA générative multimodale : Suno AI

Programme - Jour 2

Heure	Durée	Activité
9h30–11h00	1h30	Initiation Python & premières manipulations IA
11h00–11h20	20 min	Pause
11h20–12h50	1h30	Applications génératives : texte, image, son
12h50–13h30	40 min	Pause déjeuner
13h30–15h00	1h30	Enjeux éthiques, conclusion

Concepts fondamentaux

Introduction

L'IA (machine learning) transforme les pratiques culturelles, sociales, citoyennes, industrielles, etc.
Outil d'émancipation, de création, mais aussi de vigilance éthique
Un enjeu qui concerne toutes les générations et tous les milieux

Applications du machine learning

Traitement du texte (traduction, analyse de sentiments, génération de texte)
Reconnaissance d'images et de vidéos (classification, détection d'objets, génération d'images)
Traitement de la voix et du son (reconnaissance vocale, synthèse vocale, analyse d'émotions, etc.)
Prédiction et recommandations (moteurs de recommandation, prévisions financières, détection de fraudes…)
Applications génératives (création d'images, musique, vidéos, texte…)

Les systèmes de recommandation

Algorithmes qui suggèrent des contenus, produits ou contacts pertinents à chaque utilisateur.

Autres exemples
de système de recommentation

Vidéo & musique : Netflix, YouTube, Spotify
E-commerce : Amazon, Cdiscount
Réseaux sociaux : Facebook, Instagram, TikTok, LinkedIn
Actualités & articles : Google News, Medium
Voyages & idées : TripAdvisor, Airbnb, Pinterest

Principes de fonctionnement

Suggestions selon l'historique et les intérêts de l'utilisateur => filtrage basé sur le contenu
Recommandations basées sur les préférences d'utilisateurs similaires =>filtrage collaboratif
Systèmes hybrides : combinaison des deux approches

Objectif : Nous aider à découvrir ce qui nous intéresse parmi une grande quantité de choix
=> mais...

L'IA générative

Les trois ingrédients
de l'IA actuelle

À partir de 2012
(= Deep Learning)

I. Internet
=> Les données massives
(= Big Data)

II. Le matériel informatique

=> Les cartes graphiques (GPU)

III. La théorie mathématique

=> Les réseaux de neurones

Ordre de grandeur des nombres

Préfixe SI	Valeur	Échelle pratique	Échelle longue (EU)	Échelle courte (US)
kilo (k)	10³	mille	mille	mille
méga (M)	10⁶	million	million	million
giga (G)	10⁹	milliard	milliard	billion
téra (T)	10¹²	mille milliards	billion	trillion
péta (P)	10¹⁵	million de milliards	billiard	quadrillion
exa (E)	10¹⁸	milliard de milliards	trillion	quintillion
zetta (Z)	10²¹	mille milliards de milliards	trilliard	sextillion

Domaine	Utilisation bots	Bases de données (★)
Vision	Reconnaissance objets/scènes (robots mobiles, surveillance)	ImageNet ★★★★★ COCO ★★★★☆
Parole	Reconnaissance/parole (assistants, robots accueil)	LibriSpeech ★★★★☆ Common Voice ★★★★☆
Langage	Dialogue/texte (chatbots, robots sociaux)	Wikipedia ★★★★★ Cornell Dialogs ★★★☆☆
Manipulation	Manipuler objets (bras robotisés)	YCB ★★★★☆ KITTI ★★★★☆
Navigation	Se déplacer (robots exploration, domestiques)	Matterport3D ★★★★☆ AI2-THOR ★★★★☆
Geste	Gestes humains (robots interactifs, jeux)	MPII Pose ★★★★☆ Human3.6M ★★★★☆
Multimodal	Comprendre scènes complètes (robots compagnons)	VQA ★★★★☆ AVSD ★★★☆☆

Caractéristiques des modèles les plus récents

Modèle	Société	Open Source	Taille (paramètres)	Multilingue	Date de création
Gemma 3	Google Mind	Oui	Non divulgué (~Trillion*)	Oui	Février 2025
GPT-4o	OpenAI	Non	Non divulgué (~Trillion*)	Oui	Mai 2024
Gemini 1.5 Pro	Google DeepMind	Non	Non divulgué	Oui	Février 2024
Llama 3	Meta	Oui	8B, 70B	Oui	Avril 2024
Claude 3 Opus	Anthropic	Non	Non divulgué	Oui	Avril 2024
Mixtral 8x22B	Mistral AI	Oui	141B (MoE)	Oui	Décembre 2023
Gemma	Google	Oui	2B, 7B	Oui	Février 2024
Qwen2-72B	Alibaba	Oui	72B	Oui	Mai 2024
Yi-34B	01.AI	Oui	34B	Oui	Novembre 2023
Mistral 7B	Mistral AI	Oui	7B	Oui	Septembre 2023
BLOOM	BigScience	Oui	176B	Oui	Juillet 2022

* La taille exacte de GPT-4o n'est pas publique, mais les estimations évoquent plusieurs centaines de milliards à un trillion de paramètres.
MoE = Mixture of Experts (architecture hybride).

Les erreurs systémiques

Biais

Données d'entraînement déséquilibrées
Décisions injustes ou discriminatoires

Hallucinations

Génération de contenu inventé
Apparaît surtout dans les modèles de langage
Solutions : vérification, récupération d'information

L'IA & la manipulation des masses

IA & manipulation des masses

Deepfakes politiques – Vidéos truquées diffusées lors d’élections
Bots sur réseaux sociaux – Amplification artificielle de messages ou hashtags
Fake news automatisées – Génération d’articles ou de commentaires trompeurs
Micro-ciblage électoral – Messages personnalisés pour influencer le vote
Phishing avancé – Arnaques adaptées à chaque profil grâce à l’IA
Recommandations extrêmes – Algorithmes poussant des contenus polarisants

Le « fake » sur Facebook ?

Comptes fake : environ 4 à 5 % des comptes actifs mensuels sont considérés comme faux ou dupliqués (source : Meta 2024)
Contenus fake (désinformation) : difficile à estimer, mais études indépendantes : 1 à 3 % des publications publiques pourraient être des fausses informations
La majorité des fake news ne sont ni signalées ni supprimées ; le chiffre réel pourrait varier selon la période et le contexte

Estimations du contenu "fake" sur le web

Pas de % unique pour tout le web, mais des tendances claires :

5-15% des contenus viraux sur réseaux sociaux lors de crises (élections, pandémie…) seraient faux ou trompeurs
Jusqu’à 20-30% des infos COVID-19 sur réseaux sociaux identifiées comme fausses (OMS, 2020)
Deepfakes : +50 000 vidéos détectées en 2020, double chaque année (Deeptrace)

Types de contenus fake : Fake news (textes), images/vidéos truquées, faux profils, faux avis…
Sujets les plus touchés : Politique, santé, finance
Difficile à mesurer précisément : Le web est en constante évolution

Sources : Science (2018), WHO (2020), Deeptrace (2020), EU DisinfoLab (2024)

Contenu généré par IA (utile, non fake) : estimations

3 à 10 % du contenu web grand public déjà généré ou rédigé par IA (2024, tous types confondus)
Jusqu’à 20 % des nouveaux articles publiés chaque jour sur le web seraient partiellement ou totalement créés par IA (SEO, guides, FAQ…)
30 % de la documentation technique et des synthèses générées par IA dans de grandes entreprises tech
Domaines les plus concernés : blogs, tutoriels, FAQ, documentation technique, résumés, newsletters, code
Difficile à détecter : beaucoup de contenus IA ne sont pas signalés

Sources : Originality.ai (2024), NewsGuard (2024), Europol (2024)

Souverainté numérique

Centres de données en Tunisie (2025)

DataXion (Tunis) : Seul centre certifié Tier IV en Tunisie, offrant des services de colocation et d'hébergement sécurisé
EO Data Center (Enfidha, Sousse) : Fournit des services Cloud, IaaS, SaaS et PaaS, ainsi que des solutions de sauvegarde et de reprise après sinistre
Orange Data Center (Kalaa Kebira, Sousse) : Centre de données de 1 000 m², inauguré en mai 2025, supportant les services d'Orange et les besoins des clients
CenterServ Tunis Data Center (Tunis) : Offre des services de colocation, cloud et IT managés avec des infrastructures avancées et des mesures de sécurité robustes
[Poulina Group Holding Data Center (Tunis) : Centre de données opéré par Poulina Group Holding, participant à l'infrastructure numérique croissante de la Tunisie]

Répartition estimée des types de données hébergées

Services Cloud & Virtualisation : 35%
Hébergement de sites web, applications métiers, services SaaS/IaaS/PaaS pour entreprises et administrations
Télécommunications & Fournisseurs d'accès Internet : 25%
Données réseau, logs internet, téléphonie pour les opérateurs tels qu'Orange, Tunisie Télécom, Ooredoo
Banques & Secteur Financier : 15%
Transactions électroniques, données clients, conformité réglementaire pour les institutions financières
Gouvernement & Secteur Public : 15%
Services e-gouvernement, dossiers citoyens, éducation, sécurité sociale
Médias & Contenus Numériques : 10%
Streaming, portails web, archives de presse et contenus multimédias

Nb datacenters/pays (2025)

Pays	Nombre de centres
États-Unis	5 383
Allemagne	522
Royaume-Uni	512
Chine	449
France	316
Afrique (total)	167
Tunisie	4

Premiers pas Python et manipulations IA

Découverte de l'environnement Python/Notebook
Exercices pratiques : premiers algorithmes, manipulation simple de données
Initiation aux concepts de base de l'IA via la pratique

Réseaux de neurones, IA moderne, concepts et démo

Explication des réseaux de neurones et de l'IA moderne
Manipulation sur un exemple visuel (ex : MNIST)
Discussion sur les usages et limites

IA appliquée : texte, image, son

Découverte des modèles appliqués au texte, à l'image et au son
Ateliers pratiques sur chaque modalité
Analyse critique des résultats

Liens utiles

Introduction à l'intelligence artificielle (vidéos par Roger Vandomme)
Histoire du Deep Learning
Dive into Deep Learning (excellent ouvrage collectif, mais très technique)

Une introductionà l'« Intelligence Artificielle »