dimanche 2 septembre 2012

L'avenir des CAPTCHA et de l'intelligence artificielle : les humains échoueront-ils au test de Turing ?

CAPTCHA-breaking bots soon make it impossible to prove we’re human? (un article de Singularity Hub réagit lui aussi à l'article de Forbes).

Intéressant article (via Jean-Marc Luna. Pour résumer, les CAPTCHAs deviennent de plus en plus difficiles pour un humain et de plus en plus facile pour les ordinateurs. Les nouvelles méthodes, qui utilisent des objets (bouger la souris, compter le nombre de micro-secondes avant la frappe d'une touche…) seront facilement contournées. Bref, la fin du CAPTCHA est-elle pour bientôt ?

Ci-dessous quelques remarques.

Les CAPTCHAs améliorent l’intelligence artificielle

Les technologies de reconnaissance de forme mises en œuvre pour casser un CAPTCHA est ensuite utilisée dans d’autres domaines, même au-delà de l’application évidente qu’est l’OCR. Dommage que les casseurs de CAPTCHAs (principalement des délinquants ou des criminels) ne partagent pas leurs trouvailles, ça ferait progresser la science d’autant plus. Comme dit l’article : Every step backward for CAPTCHA is a step forward for AI.

CAPTCHAs sémantiques

Une solution temporaire est les CAPTCHAs sémantiques. En plus de « réinitialiser » les astuces des casseurs de CAPTCHAs, ce qui donne un répit, ils sont aussi accessibles aux handicapés (sous réserve : un handicapé mental ou visuel, voire auditif dans le cas des CAPTCHAs audio, pourrait avoir du mal). Il va sans dire que, une fois ces CAPTCHAs-là cassés par les casseurs de CAPTCHAs, l’intelligence artificielle aura encore progressé (IBM Watson est un bon candidat pour les ceci).

CAPTCHAs de connivence

Il reste ce que j’appelle les CAPTCHAs de connivence. C’est un sous-ensemble des CAPTCHAs sémantiques qui font appel à une information connue uniquement d’une communauté. Ils ne sont pas parfaits, mais ils devraient tenir un peu plus longtemps qu’un CAPTCHA sémantique classique. Il y a cependant deux problèmes dans ces CAPTCHAs de connivence :

  • Par définition, ils ne sont pas universels : il faut appartenir à la communauté pour connaitre la réponse.
  • Les questions ne sont pas créées automatiquement (donc, techniquement, ce n’est pas du CAPTCHA), ce qui la limite à des petits sites.

Exemple de CAPTCHA de connivence que j’ai implémenté avec succès sur forum.scriptarium.fr (ZÉRO spammeur inscrit depuis sa mise en place) :

Les livres-jeux les plus populaires datent des années soixante-dix, quatre-vingts ou quatre-vingts-dix (donnez la réponse sur DEUX CHIFFRES).

Dans cet exemple, j’ai aussi utilisé une astuce de CAPTCHA sémantique, à savoir mettre les années en lettres (et mieux encore, demander une année en chiffre). Certes, c’est un CAPTCHA basique dans le sens qu’il n’y a qu’une seule question, mais on peut très bien imaginer une méthode permettant de tirer une question au choix d’une liste - la liste étant créée manuellement, cependant.

Flattr: cliquez pour une micro-donation [web payable]