Pour aller un peu plus loin, même si j'avoue que ce n'est que de la spéculation.
Il est à mon avis impossible de produire un résumé exploitable tel quel avec le meilleur algorithme du monde. Par contre il devrait être possible d'extraire les mots clés d'un texte. Ca ne demande pas spécialement de grosses connaissances en informatique (Traitement des chaînes de caractère, Expressions Régulières, Stats).
Si je devais travailler sur ce genre de programme, je procéderais ainsi.
- Il faut un texte déjà assez verbeux de manière à pouvoir avoir une bonne dose de statistiques.
- Dans un premier temps je "nettoie" le texte de tous les mots grammaticaux (déterminants, prépositions, pronoms) sauf les conjonctions (J'estime qu'en ne lisant qu'elles on peut avoir une bonne idée de la logique du texte).
- Ensuite je nettoie les mots très communs.
- Je récupère ensuite des extraits pour chaque phrases contenant sujet, verbe, complément, conjonction (de quoi avoir le sens et la logique de chaque phrase)
Moi je m'arrêterais là mais tu peux tout a fait faire des statistiques des mots les plus utilisés, des verbes, les combiner et jouer avec pour obtenir quelque chose qui soit représentatif.
(Par contre je ne connais pas le Perl =()