Depuis quelques années, la reconnaissance des visages est une technologie connue… Mais ce n’est qu’un début. Car d’ici quelques années les logiciels seront probablement capables de reconnaitre ce qui se passe sur une photo, pour la décrire en mots.
Je vous laisse imaginer la suite… Les milliards d’images qui sont mises en ligne sur le net sans le moindre mot-clé, ni légende, sont actuellement une « terra inconita » pour les moteurs de recherche : elles n’existent tout simplement pas… Mais lorsque les moteurs de recherche (ou tout simplement votre logiciel de gestion d’image), seront capables de les « lire » et de les décrite en texte, alors la face d’internet en sera changée.
Actuellement, des scientifiques de l’université de Stanford ont développé un programme appelé NeuralTalk dont le but est de décrire les images : « Multimodal Recurrent Neural Architecture generates sentence descriptions from images ». Voici des exemples de légendes générées par leur programme de façon autonome (cela ne marche pas encore à tous les coups ;-) Reste à savoir dans combien d’années cette technologie arrivera dans nos ordinateurs individuels… Peut-être moins de 10 ans ?
Bonjour,
Article intéressant et peut être visionnaire, ou presque :). Il me semble que c’est exactement ce que propose le nouveau Google photo. Peut être que ce n’est accessible qu’aux États-Unis ou je vis. En tout ca, c’est impressionnant et il est clair que cette technologie sera accessibles à tous très rapidement.
bonne continuation a ton blog.
ps: j’attends mon canon sl1 avec impatience pour peut être savoir un jour faire de belles photos a mon tour
J’en parle beaucoup de cette technologie lors de mes formations, notamment lorsqu’on aborde la partie consacrée aux mots-clés et métadonnées.
Je suis très impatient de voir ce genre d’outils débarquer dans les catalogueurs, tout simplement parce qu’en 2015, je trouve la saisie manuelle de mots-clés et de légendes non seulement fastidieuse, mais également très arriérée dans son principe.