deutsche-telekom/bert-multi-english-german-squad2
deutsche-telekom
Pregunta y respuesta
Creamos German Squad 2.0 (deQuAD 2.0) y la fusionamos con SQuAD2.0 en un conjunto de datos de entrenamiento en inglés y alemán para responder preguntas. Se utiliza bert-base-multilingual-cased para afinar la tarea de preguntas y respuestas bilingües.
Como usar
from transformers import pipeline
qa_pipeline = pipeline(
"question-answering",
model="deutsche-telekom/bert-multi-english-german-squad2",
tokenizer="deutsche-telekom/bert-multi-english-german-squad2")
contexts = ["Die Allianz Arena ist ein Fußballstadion im Norden von München und bietet bei Bundesligaspielen 75.021 Plätze, zusammengesetzt aus 57.343 Sitzplätzen, 13.794 Stehplätzen, 1.374 Logenplätzen, 2.152 Business Seats und 966 Sponsorenplätzen. In der Allianz Arena bestreitet der FC Bayern München seit der Saison 2005/06 seine Heimspiele. Bis zum Saisonende 2017 war die Allianz Arena auch Spielstätte des TSV 1860 München.",
"Harvard is a large, highly residential research university. It operates several arts, cultural, and scientific museums, alongside the Harvard Library, which is the world's largest academic and private library system, comprising 79 individual libraries with over 18 million volumes. "]
questions = ["Wo befindet sich die Allianz Arena?",
"What is the worlds largest academic and private library system?"]
qa_pipeline(context=contexts, question=questions)
Funcionalidades
- Modelo de lenguaje: bert-base-multilingual-cased
- Datos de entrenamiento: deQuAD2.0 + SQuAD2.0 training set
- Datos de evaluación: SQuAD2.0 test set; deQuAD2.0 test set
- Infraestructura: 8xV100 GPU
- Publicado: 9 de julio de 2021
Casos de uso
- Responder preguntas en inglés y alemán
- Utilización en aplicaciones multilingües
- Análisis de documentos bilingües
- Sistemas de búsqueda de información
- Asistentes virtuales multilingües