sergeyzh/LaBSE-ru-turbo

sergeyzh
Similitud de oraciones

Modelo BERT para el cálculo de embeddings de oraciones en ruso. El modelo se basa en cointegrated/LaBSE-en-ru, con tamaños de contexto (512), embeddings (768) y rendimiento similares.

Como usar

from sentence_transformers import SentenceTransformer, util

model = SentenceTransformer('sergeyzh/LaBSE-ru-turbo')

sentences = ["привет мир", "hello world", "здравствуй вселенная"]
embeddings = model.encode(sentences)
print(util.dot_score(embeddings, embeddings))

Funcionalidades

Calculo de embeddings de oraciones
Basado en cointegrated/LaBSE-en-ru
Compatibilidad con transformers y safetensors
Optimizado para el idioma ruso

Casos de uso

Similitud de oraciones
Extracción de características de texto
Inferencia de embeddings de texto

Recibe las últimas noticias y actualizaciones sobre el mundo de IA directamente en tu bandeja de entrada.