Kategorie
AI dataset

Wesołego Jajka!

W najbliższe dni życzymy Wam dużo spokoju i radości!

My tymczasem raportujemy o zaimportowaniu kolejnych danych. Jak obiecaliśmy kolejne z kategorii blogi i edukacja co wraz z wcześniejszymi tekstami daję nam ponad 145 GB danych tekstowych. Więcej szczegółów możecie zobaczyć na naszym dashboradzie: Speakleash Dashboard · Streamlit

Wesołego jajka!

Kategorie
AI dataset

141GB

Kolejne 3 datasety są już w naszym spichlerzu! Dane pochodzą z ogólno pojętych mediów jak również ze stron związanych z blogami internetowymi. Obecnie nasza liczba danych zatrzymała się na 141GB, i możecie liczyć że w najbliższym czasie będzie kolejny przyrost z tych obszarów jak media i blogi.
A poniżej możecie zobaczyć na wykresie kołowym jakie kategorie dominują. 

Kategorie
AI dataset

Nie zwalniamy!

Mamy wielkie plany i niezawodny zespół, jednak ilość danych jest zbyt duża, aby dotychczasowy sztab był w stanie zrealizować nasz ambitny cel w wyznaczonym terminie.

Dlatego, jeśli znasz język Python i uwielbiasz dane, napisz do nas. Potrzebujemy właśnie Twojej pomocy!

Kończąc pozytywnymi wieściami, kolejne 6GB z kategorii prawnej jest już w naszym SpeakLeash. Szczegóły możecie zobaczyć na naszym dashboard( https://speakleash.streamlit.app/ )

Kategorie
AI dataset

Wiosna, ach to Ty!

Wiosnę witamy świetnymi wieściami! Dzięki pozyskaniu danych z kategorii mediów i sklepów internetowych udało nam się przekroczyć 120GB danych! Jest to oczywiście zasługa całego zespołu, którego zaangażowanie jest inspiracją dla nas samych.
Jak myślicie, ile uda nam się zebrać tej wiosny?

Kategorie
AI dataset

Kolejny kamień milowy

Po miesiącach ciężkiej pracy i niekończących się rozmów możemy powiedzieć że dołożyliśmy kolejną dużą cegiełkę ku realizacji naszego celu. Osiągnęliśmy ponad 100 GB danych tekstowych! A wśród nich są takie źródła z polskojęzycznej Wikipedii, prace naukowe czy powieści. Co Wy na to? Jakie jeszcze dane, z jakich źródeł chcielibyście aby się znalazły w pierwszym polskim GPT? Zapraszamy do wglądu.

Kategorie
AI dataset

Wielkie Ogłoszenie!


Od teraz na rozszerzeniu naszej strony(https://speakleash.streamlit.app/) możesz zobaczyć live dashboard! Dzięki czemu możesz na bieżąco śledzić przebieg naszych prac, zaczynając od pojemności danych, rozbieżności danych między branżami i wiele więcej! Dodatkowo możesz zastosować filtry, które pomogą dopasować dashboard do Twoich potrzeb. Jeśli masz jakieś pytania, zachęcamy do kontaktu.