roberta-large-bne-massive
PlanTL-GOB-ES
Clasificación de texto
El modelo roberta-large-bne-massive es un modelo de clasificación de intenciones para el idioma español afinado a partir del modelo roberta-large-bne-massive, un modelo basado en RoBERTa preentrenado en un corpus de tamaño medio recopilado de corpus públicos y rastreadores. El modelo utiliza MASSIVE 1.1, un conjunto de datos paralelo de más de 1 millón de expresiones en 52 idiomas con anotaciones para las tareas de comprensión del lenguaje natural de predicción de intenciones y anotación de slots. Las expresiones abarcan 60 intenciones e incluyen 55 tipos de slots.
Como usar
Aquí se muestra cómo usar este modelo:
from transformers import pipeline
from pprint import pprint
nlp = pipeline("text-classification", model="PlanTL-GOB-ES/roberta-large-bne-massive")
ejemplo = "m'agraden les cançons del serrat"
intent = nlp(ejemplo)
pprint(intent)
Funcionalidades
- Modelo basado en RoBERTa
- Preentrenado en corpus de tamaño medio
- Predicción de intenciones
- Anotación de slots
- Afinado para el idioma español
- Utiliza el conjunto de datos MASSIVE 1.1
Casos de uso
- Predicción de intenciones en oraciones de texto plano en español
- Implementación de asistentes de voz en combinación con un modelo de reconocimiento automático de voz