
n
programme informatique sera-il, un jour, assez élaboré pour décortiquer
un texte et en extraire les sentiments ou les opinions, affichés ou
non, de l'auteur ? Tel est en tout cas l'objet des recherches d'une
équipe de l'université de Pittsburgh, en Pennsylvanie.
"Nous cherchons à créer des algorithmes et des modèles qui puissent distinguer (dans un texte) les
affirmations factuelles des propos subjectifs, identifier les opinions
tenues, en évaluant mathématiquement, grâce à ces outils, l'intensité
des propos", résume Janyce Wiebe, directrice de ce programme, qui a
déjà publié de nombreux travaux sur l'analyse linguistique assistée par
ordinateur.
Ces recherches
sont financées par le ministère américain de la sécurité intérieure,
qui prévoit de leur allouer un budget de 2,4 millions de dollars.
Quatre centres affiliés à des universités (de Pennsylvanie, du New
Jersey, de Californie du Sud, de l'Illinois) vont être créés à cet
effet.
"Ce travail vise à extraire de l'information qui pourrait
aider les experts du ministère à analyser les sentiments et les
convictions exprimés dans des déclarations publiques", a expliqué à l'AFP Christophe Kelly, un porte-parole du ministère.
A
peine connu outre-Atlantique, ce projet de recherche a fait l'objet
d'une polémique. Plusieurs associations de défense de la liberté de la
presse se sont inquiétées de la possible utilisation de ces techniques
à des fins de surveillance par le gouvernement américain. Il serait en
effet possible, avec ce type d'outil, de classer les médias afin, par
exemple, d'identifier les plus critiques à l'égard du gouvernement.
Les
chercheurs se défendent d'un tel dessein et annoncent ne pas prévoir
d'utilisations spécifiques, du moins pour l'instant, même si "une grande variété d'applications" sont possibles, répond laconiquement Mme
Wiebe. A l'heure de l'apparition du Web 2.0, qui a entraîné une
profusion d'expression libre sur le Net, la matière première, en tout
cas, ne manque pas pour évaluer à grande échelle le fond de la pensée
de ceux qui écrivent. Dans une publication datant de 2006 et intitulée Sens des mots et subjectivité,
la chercheuse esquisse des pistes d'applications : évaluer la réaction
et l'affectivité des gens face à un nouveau produit, comprendre les
orientations d'opinions publiques étrangères sur un sujet de société...
Reste
encore à mettre au point le procédé. Le laboratoire a pour l'instant
étudié des documents provenant de 180 sources internationales
différentes. Chaque texte est annoté manuellement par un linguiste,
puis ces informations sont informatisées. "Nous voulons que le logiciel apprenne à comprendre", explique Mme Wiebe, qui ne s'attend pas à des résultats immédiats. Et pour cause. Le principal défi réside encore, selon elle, dans "la
complexité du langage humain. Une simple phrase peut avoir plusieurs
significations, en fonction du contexte. Nous voulons développer des
techniques pour déceler la signification exacte de chaque phrase".