La tâche Bacteria Biotope, soutenue financièrement par l'Institut DATAIA, au BioNLP-OST 2019
La tâche Bacteria Biotope, soutenue financièrement par l'Institut DATAIA, au BioNLP-OST 2019
- L'événement
- La tâche Bacteria Biotope
- Aller plus loin
- Actualités sur le même thème
Le workshop de BioNLP Open Shared Tasks 2019 co-organisé par l'INRA-MaIAGE et le DBCLS (Tokyo) a réuni à Hong Kong le 4 novembre les organisateurs et participants des 7 tâches et les scientifiques du domaine.
Les tâches portent sur une grande variété de besoins (extraction fine d'information, normalisation par des ontologies, recherche d'information, annotation linguistique), de langue (anglais, espagnol) et d'objets (plantes, microorganismes, humains).
Le programme riche de 23 exposés et 5 posters a permis de présenter et de discuter les tâches et les résultats publiés par l'Association for Computational Linguistics (ACL) sous forme d'articles sélectionnés par un comité de lecture international (actes disponibles en ligne).
Robert Bossy, ingénieur de recherche dans l'équipe Bibliome (MaIAGE INRA), impliqué dans l'évaluation, le développement et l'application de méthodes d'Extraction d'Information en Sciences de la Vie, a présenté la tâche Bacteria Biotope au workshop.
La tâche Bacteria Biotope dans sa 4è édition, outre les noms de microorganismes, d'habitats et de lieux géographique inclut des phénotypes (ex. antibiotic resistant) à extraire de résumés et d'articles. La popularité des approches d'apprentissage automatique à base de réseaux de neurone exploitant ou non de l'informations linguistiques se confirme.
La tâche Bacteria Biotope présente le défi de la représentation formelle des informations textuelles par une base de connaissance grâce à la normalisation automatique par des ontologies.
Les systèmes des participants ont su pallier au petit nombre d'exemples d'entraînement (small or no data) relativement au nombre de classes. L'ensemble des données et des résultats suivant différentes métriques peut être trouvé sur le site web et dans l'article de la tâche [Bossy et al., BioNLP-OST 2019].
Les meilleurs résultats obtenus par les participants sur les 6 sous-tâches sont supérieurs de plusieurs points à ceux de l'édition de 2016, malgré la complexité croissante, à l'exception de la reconnaissance et de la normalisation des noms de microorganismes.
Tous les chercheurs sont encouragés à continuer à utiliser dans le futur les données de la tâche Bacteria Biotope, le service d'évaluation et les supporting resources (ex. word embeddings), publics, et en ligne. Un prochain appel à article dans un numéro spécial de journal prolongera leur exploitation comme ce fut le cas dans les éditions précédentes.
Références :
Robert Bossy, Louise Deléger, Estelle Chaix, Mouhamadou Ba, and Claire Nédellec. 2019. Bacteria Biotope at BioNLP Open Shared Tasks 2019. In Proceedings of the BioNLP Open Shared Task 2019 Workshop joint to EMNLP-IJCNLP 2019, Association for Computational Linguistics pub., pages 121-131, Hong Kong 4 novembre 2019.
Kim Jin-Dong, Nédellec Claire, Bossy Robert, Deléger Louise (éditeurs). Proceedings of The 5th Workshop on BioNLP Open Shared Tasks joint to EMNLP-IJCNLP 2019, Association for Computational Linguistics pub., Hong Kong 4 novembre 2019.