henryk/bert-base-multilingual-cased-finetuned-polish-squad1

henryk

Pregunta y respuesta

Este modelo es el modelo multilingüe proporcionado por el equipo de investigación de Google con una tarea de preguntas y respuestas en polaco ajustada.

Como usar

Uso rápido con pipelines:
from transformers import pipeline

qa_pipeline = pipeline(
"question-answering",
model="henryk/bert-base-multilingual-cased-finetuned-polish-squad1",
tokenizer="henryk/bert-base-multilingual-cased-finetuned-polish-squad1")

qa_pipeline({'context': "Warszawa jest największym miastem w Polsce pod względem liczby ludności i powierzchni", 'question': "Jakie jest największe miasto w Polsce?"})

Output:
{"score": 0.9988, "start": 0, "end": 8, "answer": "Warszawa"}

Funcionalidades

Modelo de lenguaje multilingüe (bert-base-multilingual-cased): 12 capas, 768 ocultas, 12 cabezales, 110M parámetros.
Entrenado en texto con mayúsculas en los 104 idiomas con las mayores Wikipedias.
Traducción automática de SQuAD1.1 usando el módulo de Python mtranslate.
Entrenamiento y evaluación realizados en un GPU de Tesla V100.

Casos de uso

Responder preguntas en polaco utilizando datos de Wikipedia.
Implementación de aplicaciones de preguntas y respuestas multilingües.
Investigación y desarrollo en procesamiento de lenguaje natural para el idioma polaco.