Sitegeek.frSitegeek.fr
  • Technologie
    • Hardware & Gaming
    • Image & Son
    • Logiciels & Cyber
    • Maison Connectée
    • Makers & DIY
    • Mobilité & Smartphones
    • Science & Espace
    TechnologieVoir plus
    SSD Samsung rapide : Le guide pour booster les performances de votre PC
    6 mai 2026
    MOVA V70 Ultra Complete : L’aspirateur robot sans sac de 40 000 Pa
    18 mai 2026
    Test Epomaker TH40 : le clavier mécanique 40% ultime ?
    17 mai 2026
    Test LawnMaster OcuMow DM16-150 : le robot tondeuse sans fil
    Test OneOdio Studio Max 2 : La claque Lossless qui change tout
  • Jeux Vidéo
    • JDR & Plateau
    • Rétrogaming
    Jeux VidéoVoir plus
    Test Kusan City of Wolves : le Hotline Miami version Tetris ?
    18 mai 2026
    Test MotoGP 26 : La simulation Milestone devient-elle accessible ?
    Preview LightSup! : Le digne héritier d’Overcooked et Hammerwatch ?
    17 mai 2026
    Test Mixtape : une claque visuelle et musicale incontournable
    Test Pragmata PC : Le chef-d’œuvre spatial surprise de Capcom
  • Culture Geek
    • Comics & Mangas
    • Films et séries
    • Parcs & Loisirs
    Culture GeekVoir plus
    Pourquoi la VF est une hérésie : IA, doublage et gâchis artistique
    8 mars 2026
    Team Building High-Tech : Pourquoi c’est vital pour vos équipes ?
    5 mars 2026
    Guide des meilleures activités geeks à Lyon : VR, Gaming et Immersion
    23 février 2026
    Vrais Voisins, Faux Amis : Pourquoi la Patek Philippe de Jon Hamm est une fausse (et pourquoi c’est du génie)
    25 janvier 2026
    Les meilleurs animes du moment : la sélection de la communauté (Janvier 2026)
    22 janvier 2026
  • Web & Société
    • Business & Digital
    • Monde Numérique
    Web & SociétéVoir plus
    Piratage de jeux vidéo en 2026 : impact réel, risques et mythes
    17 mai 2026
    Avion perturbé : Suivez votre vol et calculez votre indemnisation avec AirHelp
    6 mai 2026
    L’IA et l’analyse prédictive : la révolution des logiciels de demain
    22 avril 2026
    Top 5 agences développement web sur mesure france 2026
    21 avril 2026
    Signature électronique gratuite : Gagnez en productivité et en sécurité
    21 avril 2026
  • Bons plans
    Bons plansVoir plus
    Bon Plan Tablette : Android 15 et 128 Go à moins de 80€, c’est possible !
    19 janvier 2026
    Bon Plan : Le vidéoprojecteur Oscal PV800 Pro (Google TV, 1400 Lumens) s’affiche à prix cassé !
    19 janvier 2026
    Epic games store jeux gratuits
    Jeux gratuits Epic Games Store : La liste complète et l’historique (2025-2026)
    16 janvier 2026
    Bons plans de dernière minute : 5 idées tech pour sauver votre Noël (et votre réputation)
    24 décembre 2025
    BLUETTI B500K
    BLUETTI casse les prix pour le Black Friday : jusqu’à -73 % et un AC300 offert avec la batterie B500K
    4 décembre 2025
Sitegeek.frSitegeek.fr
  • Tech
  • Geek
  • JV
  • Web
  • Bons plans
Recherche
  • Maison Connectée
  • Hardware & Gaming
  • Image & Son
  • Mobilité & Smartphones
  • Logiciels & Cyber
  • Monde Numérique
  • Films et séries
  • Makers & DIY
  • Business & Digital
  • Mentions légales
  • Contact
Réseaux sociaux
Sitegeek.fr > Technologie > Évolution de GPT-4 : OpenAI en avance, mais la sécurité en question
Technologie

Évolution de GPT-4 : OpenAI en avance, mais la sécurité en question

Par
Gwen
Publié 2 novembre 2023
Aucun commentaire
4 min
Transparence : Sitegeek reste indépendant grâce à vous. Lorsque vous achetez via nos liens, nous pouvons toucher une commission (sans surcoût pour vous). Voir notre éthique et notre méthode de test.
PARTAGE

Des recherches soutenues par Microsoft ont montré que les utilisateurs peuvent tromper le modèle IA GPT-4 pour obtenir des résultats biaisés et leaker des informations privées.

Selon une étude (en anglais) menée par des chercheurs de l’université de l’Illinois Urbana-Champaign, de l’université de Stanford, de l’université de Californie à Berkeley, du Center for AI Safety et de Microsoft Research, le grand modèle de langage GPT-4 d’OpenAI obtient un score de fiabilité supérieur à celui de GPT-3.5. Néanmoins, même si le modèle IA GPT-4 est plus fiable que son prédécesseur, il serait également plus vulnérable au jailbreaking et aux problèmes de partialité.

GPT-4 : une précision qui peut parfois lui jouer des tours…

Durant l’étude, les chercheurs ont constaté que le modèle IA GPT-4 protégeait globalement mieux les informations privées, qu’il évitait les résultats toxiques tels que les informations biaisées et qu’il résistait mieux aux attaques adverses. Toutefois, le grand modèle de langage d’OpenAI peut parfois également être amené à ignorer les mesures de sécurité et à divulguer des informations personnelles et l’historique des conversations. Les chercheurs ont constaté que les utilisateurs pouvaient contourner les mesures de protection intégrées à GPT-4, car le modèle IA « suit plus précisément les informations trompeuses » et est plus susceptible de suivre à la lettre des instructions piégeuses.

En revanche, l’équipe de chercheurs précise que les vulnérabilités testées n’ont pas été trouvées dans les produits GPT-4 destinés au grand public. Ceci s’explique par le fait que les applications d’intelligence artificielle actuelles appliquent « une série d’approche d’atténuation pour traiter les dommages potentiels qui peuvent survenir au niveau du modèle IA qui alimente la technologie ».

Lire aussi :  OpenAI met le Turbo sur son modèle IA GPT-4

L'interface de ChatGPT

Pour mesurer la fiabilité du grand modèle de langage d’OpenAI, les chercheurs ont évalué les résultats dans plusieurs catégories comme la toxicité, les stéréotypes, la protection de la vie privée, l’éthique des machines, l’équité et la capacité à résister à des tests contradictoires. Pour tester ces différentes catégories, les chercheurs ont d’abord essayé les deux modèles GPT-3.5 et GPT-4 à l’aide de requêtes standard, qui incluaient l’utilisation de mots susceptibles d’être interdits. Ensuite, les chercheurs ont utilisé des invites textuelles conçues pour inciter les modèles à enfreindre leurs propres restrictions sans être ouvertement biaisés, avant de les défier en tentant intentionnellement de les amener à ignorer complètement les mesures de protection.

Les chercheurs ont déclaré avoir partagé leurs travaux avec les équipes d’OpenAI et ont publié leurs critères de référence afin que d’autres chercheurs puissent recréer leurs résultats. L’équipe a déclaré : « Notre objectif est d’encourager les autres membres de la communauté des chercheurs à utiliser et à développer ce travail, afin d’anticiper les actions néfastes d’adversaires qui pourraient exploiter les vulnérabilités pour causer des dommages […] Cette évaluation de fiabilité n’est qu’un point de départ, et nous espérons collaborer avec d’autres pour exploiter ses résultats et créer des modèles IA puissantes et plus fiables à l’avenir ».

Les modèles IA comme GPT-4 sont souvent soumis à des tests de validation au cours desquels les développeurs testent plusieurs messages pour voir s’ils ne produisent pas de résultats indésirables. Lorsque le modèle a été présenté pour la première fois, le PDG d’OpenAI, Sam Altman, a admis que GPT-4 était « encore imparfait, encore limité ».

TAGGED:GPTOpenAI
Partage cet article
Facebook Whatsapp Whatsapp LinkedIn Copie Lien Imprime
Donne ton avis !
Love0
Sad0
Happy0
Sleepy0
Angry0
Dead0
Wink0
ParGwen
Follow:
Rédacteur augmenté et expert IT, je mets la tech à votre portée. Fort de 20 ans d’expérience dans l’ingénierie système, je décortique l’univers high-tech avec précision et passion. Produits connectés, domotique, gadgets du quotidien : je teste, j’analyse, je conseille. Mes contenus sont conçus pour être clairs, utiles et accessibles à tous, afin de vous aider à faire les bons choix dans un monde numérique en perpétuelle évolution.
Article précédent Qualcomm et Google Intègrent RISC-V dans Wear OS : Une Révolution en 2023
Article suivant Idées de Jeux Éducatifs pour Enfants et Adolescents : Sélection de Noël 2023
Aucun commentaire

Laisser un commentaire Annuler la réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

Réseaux Sociaux

10KLike
14.7KFollow
526Subscribe
113Follow

Donne ton avis

Trustpilot Stars Logo PNG vector in SVG, PDF, AI, CDR format

Derniers articles

Test Kusan City of Wolves : le Hotline Miami version Tetris ?
Jeux Vidéo
SSD Samsung rapide : Le guide pour booster les performances de votre PC
Hardware & Gaming
Test MotoGP 26 : La simulation Milestone devient-elle accessible ?
MOVA V70 Ultra Complete : L’aspirateur robot sans sac de 40 000 Pa
Maison Connectée

Derniers commentaires

  • Jo dans Test/Preview Wreckfest 2 : Le roi de la destruction est de retour, mais attention les dégâts !
  • donking dans Carillon Honeywell Home – Test et installation du Série 9
  • donking dans Test | Un nouveau XR ? Pas d’idée de coque ? En voici 4 testées pour vous !
  • Pinoy dans Distributions Linux Légères pour Vieux Ordinateurs : Boostez les Performances de Votre PC
  • jkt jkt APK dans Playstation Plus : L’arnaque de Sony toujours active

Le Magazine Geek & Tech

Sitegeek.fr est votre magazine indépendant dédié à l’actualité High-Tech et à la culture Geek depuis 2013.
Nous décryptons pour vous les innovations technologiques, les objets connectés et l’univers du jeu vidéo à travers des tests complets, des guides d’achat et des dossiers passionnés.
Notre mission : vous aider à mieux comprendre et bien choisir vos technologies au quotidien.

Sites Amis

  • Nerd Chic
  • Famille Bio
  • Bistro Geek
  • Be-Games.be
  • Arcade Belgium
  • Couple of pixels
  • Julsa.fr
  • Byothe.fr
  • Papa blogueur

Hébergement

La Rédaction

    • À propos de nous
    • Contact
      ⚖️ Notre Méthodologie de Test

 

Réseaux sociaux

9.9KLike
14.7KFollow
526Subscribe
113Follow
Sitegeek.frSitegeek.fr
Sitegeek.fr - ® 2013-2026 - Tous droits réservés - Marque et logos déposés
  • Charte éditoriale
  • Mentions légales
  • Politique d’affiliation
  • Politique de confidentialité
  • Sitegeek.fr : Actus, Tests et Bons Plans Geek et High-Tech
Welcome Back!

Sign in to your account

Username or Email Address
Password

Oublié votre mot de passe?