sergeyzh/LaBSE-ru-turbo
sergeyzh
Similitud de oraciones
Modelo BERT para el cálculo de embeddings de oraciones en ruso. El modelo se basa en cointegrated/LaBSE-en-ru, con tamaños de contexto (512), embeddings (768) y rendimiento similares.
Como usar
from sentence_transformers import SentenceTransformer, util
model = SentenceTransformer('sergeyzh/LaBSE-ru-turbo')
sentences = ["привет мир", "hello world", "здравствуй вселенная"]
embeddings = model.encode(sentences)
print(util.dot_score(embeddings, embeddings))
Funcionalidades
- Calculo de embeddings de oraciones
- Basado en cointegrated/LaBSE-en-ru
- Compatibilidad con transformers y safetensors
- Optimizado para el idioma ruso
Casos de uso
- Similitud de oraciones
- Extracción de características de texto
- Inferencia de embeddings de texto