sergeyzh/rubert-tiny-turbo
sergeyzh
Similitud de oraciones
Modelo BERT rápido para el cálculo de embeddings de oraciones en ruso. El modelo se basa en cointegrated/rubert-tiny2 - tiene tamaños de contexto (2048), embeddings (312) y rendimiento similares.
Como usar
from sentence_transformers import SentenceTransformer, util
model = SentenceTransformer('sergeyzh/rubert-tiny-turbo')
sentences = ["привет мир", "hello world", "здравствуй вселенная"]
embeddings = model.encode(sentences)
print(util.dot_score(embeddings, embeddings))
Funcionalidades
- Transformadores de sentencia
- Safetensors
- Extracción de características BERT
- Embeddings en ruso
- Modelo pequeño optimizado para un rendimiento rápido
Casos de uso
- Comparación de la similitud entre oraciones en ruso
- Extracción de características a partir de texto en ruso
- Generación de embeddings de texto para aplicaciones de inteligencia artificial
- Implementación en sistemas de inferencia de baja latencia