Kategorie
AI dataset

141GB

Kolejne 3 datasety są już w naszym spichlerzu! Dane pochodzą z ogólno pojętych mediów jak również ze stron związanych z blogami internetowymi. Obecnie nasza liczba danych zatrzymała się na 141GB, i możecie liczyć że w najbliższym czasie będzie kolejny przyrost z tych obszarów jak media i blogi.
A poniżej możecie zobaczyć na wykresie kołowym jakie kategorie dominują. 

Kategorie
AI dataset

Nie zwalniamy!

Mamy wielkie plany i niezawodny zespół, jednak ilość danych jest zbyt duża, aby dotychczasowy sztab był w stanie zrealizować nasz ambitny cel w wyznaczonym terminie.

Dlatego, jeśli znasz język Python i uwielbiasz dane, napisz do nas. Potrzebujemy właśnie Twojej pomocy!

Kończąc pozytywnymi wieściami, kolejne 6GB z kategorii prawnej jest już w naszym SpeakLeash. Szczegóły możecie zobaczyć na naszym dashboard( https://speakleash.streamlit.app/ )

Kategorie
AI dataset

Wiosna, ach to Ty!

Wiosnę witamy świetnymi wieściami! Dzięki pozyskaniu danych z kategorii mediów i sklepów internetowych udało nam się przekroczyć 120GB danych! Jest to oczywiście zasługa całego zespołu, którego zaangażowanie jest inspiracją dla nas samych.
Jak myślicie, ile uda nam się zebrać tej wiosny?

Kategorie
AI dataset

Kolejny kamień milowy

Po miesiącach ciężkiej pracy i niekończących się rozmów możemy powiedzieć że dołożyliśmy kolejną dużą cegiełkę ku realizacji naszego celu. Osiągnęliśmy ponad 100 GB danych tekstowych! A wśród nich są takie źródła z polskojęzycznej Wikipedii, prace naukowe czy powieści. Co Wy na to? Jakie jeszcze dane, z jakich źródeł chcielibyście aby się znalazły w pierwszym polskim GPT? Zapraszamy do wglądu.

Kategorie
AI dataset

Wielkie Ogłoszenie!


Od teraz na rozszerzeniu naszej strony(https://speakleash.streamlit.app/) możesz zobaczyć live dashboard! Dzięki czemu możesz na bieżąco śledzić przebieg naszych prac, zaczynając od pojemności danych, rozbieżności danych między branżami i wiele więcej! Dodatkowo możesz zastosować filtry, które pomogą dopasować dashboard do Twoich potrzeb. Jeśli masz jakieś pytania, zachęcamy do kontaktu.

Kategorie
konferencja

PyTech Summit 2022

Jeżeli chcesz dowiedzieć się więcej o projekcie SpeakLeash weź udział w zimowej edycji konferencji PyTech Summit 2022 (online) [ 08.12.2022 ], gdzie jeden z naszych założycieli – Sebastian Kondracki będzie miał okazję prowadzić prezentację na nasz temat. Możesz zgarnąć darmowe bilety na konferencję tutaj.

Kategorie
AI dataset

Social & GitHub uruchomione!

Jesteśmy szczęśliwi, że możemy ogłosić: nasze platformy social media i GitHub są uruchomione! Linki znajdziesz w stopce na dole strony i w zakładce Społeczność i kontakt. Jeżeli chcesz być na bieżąco informowany o naszych postępach obserwuj nasze konta społecznościowe.