Dostosuj preferencje dotyczące zgody

Używamy plików cookie, aby pomóc użytkownikom w sprawnej nawigacji i wykonywaniu określonych funkcji. Szczegółowe informacje na temat wszystkich plików cookie odpowiadających poszczególnym kategoriom zgody znajdują się poniżej.

Pliki cookie sklasyfikowane jako „niezbędne” są przechowywane w przeglądarce użytkownika, ponieważ są niezbędne do włączenia podstawowych funkcji witryny.... 

Zawsze aktywne

Niezbędne pliki cookie mają kluczowe znaczenie dla podstawowych funkcji witryny i witryna nie będzie działać w zamierzony sposób bez nich. Te pliki cookie nie przechowują żadnych danych umożliwiających identyfikację osoby.

Brak plików cookie do wyświetlenia.

Funkcjonalne pliki cookie pomagają wykonywać pewne funkcje, takie jak udostępnianie zawartości witryny na platformach mediów społecznościowych, zbieranie informacji zwrotnych i inne funkcje stron trzecich.

Brak plików cookie do wyświetlenia.

Analityczne pliki cookie służą do zrozumienia, w jaki sposób użytkownicy wchodzą w interakcję z witryną. Te pliki cookie pomagają dostarczać informacje o metrykach liczby odwiedzających, współczynniku odrzuceń, źródle ruchu itp.

Brak plików cookie do wyświetlenia.

Wydajnościowe pliki cookie służą do zrozumienia i analizy kluczowych wskaźników wydajności witryny, co pomaga zapewnić lepsze wrażenia użytkownika dla odwiedzających.

Brak plików cookie do wyświetlenia.

Reklamowe pliki cookie służą do dostarczania użytkownikom spersonalizowanych reklam w oparciu o strony, które odwiedzili wcześniej, oraz do analizowania skuteczności kampanii reklamowej.

Brak plików cookie do wyświetlenia.

O nas

SpeakLeash /ˈspix.lɛʂ/ a.k.a. Spichlerz jest nową inicjatywą utworzenia Polish Large Language Model (LLM). Są to modele o wielu zastosowaniach, oparte na transformerach, używane do generowania i przetwarzania języka naturalnego.

Naszym celem jest zbudowanie nowego i skatalogowanie istniejących zbiorów danych aby zapewnić naukowcom możliwość prowadzenia najnowocześniejszych badań nad modelowaniem języka. Zbiory danych opracowane w ramach SpeakLeash są dostarczane z manifestami opisującymi licencjonowanie oraz zawierającymi statystyki, aby zapewnić lepsze dopasowanie do prowadzonych badań.

Dzięki bezpośrednim rozmowom z zagranicznymi deweloperami LLM, m.in. Big Science (BLOOM), EleutherAI (GPT-J/GPT-NeoX-20B), otrzymaliśmy szereg szczegółowych informacji i dostęp do (otwartych) narzędzi do budowania zróżnicowanych zbiorów danych tekstowych. Mamy nadzieję, że dołączymy nasze zbiory danych do tych grup badawczych, co zaowocuje pierwszorzędnym wsparciem dla języka polskiego w bieżących i przyszłych projektach.

Zastosowania LLM są praktycznie nieograniczone, począwszy od generowania treści, m.in. artykułów, czasopism, notatek, po bardzo zaawansowane prognozy w medycynie, m.in. przewidywanie kolejnych wariantów COVID-19. Co ty z tym zrobisz?