Blog - Strona 3 z 3 - SpeakLeash

Wesołego Jajka!

Autor wpisu Autor: Maciej Ogrodnik
Data wpisu 9 kwietnia 2023

W najbliższe dni życzymy Wam dużo spokoju i radości!

My tymczasem raportujemy o zaimportowaniu kolejnych danych. Jak obiecaliśmy kolejne z kategorii blogi i edukacja co wraz z wcześniejszymi tekstami daję nam ponad 145 GB danych tekstowych. Więcej szczegółów możecie zobaczyć na naszym dashboradzie: Speakleash Dashboard · Streamlit

Wesołego jajka!

AI dataset

141GB

Autor wpisu Autor: Maciej Ogrodnik
Data wpisu 29 marca 2023

Kolejne 3 datasety są już w naszym spichlerzu! Dane pochodzą z ogólno pojętych mediów jak również ze stron związanych z blogami internetowymi. Obecnie nasza liczba danych zatrzymała się na 141GB, i możecie liczyć że w najbliższym czasie będzie kolejny przyrost z tych obszarów jak media i blogi.
A poniżej możecie zobaczyć na wykresie kołowym jakie kategorie dominują.

AI dataset

Nie zwalniamy!

Autor wpisu Autor: Maciej Ogrodnik
Data wpisu 23 marca 2023

Mamy wielkie plany i niezawodny zespół, jednak ilość danych jest zbyt duża, aby dotychczasowy sztab był w stanie zrealizować nasz ambitny cel w wyznaczonym terminie.

Dlatego, jeśli znasz język Python i uwielbiasz dane, napisz do nas. Potrzebujemy właśnie Twojej pomocy!

Kończąc pozytywnymi wieściami, kolejne 6GB z kategorii prawnej jest już w naszym SpeakLeash. Szczegóły możecie zobaczyć na naszym dashboard( https://speakleash.streamlit.app/ )

AI dataset

Wiosna, ach to Ty!

Autor wpisu Autor: Maciej Ogrodnik
Data wpisu 22 marca 2023

Wiosnę witamy świetnymi wieściami! Dzięki pozyskaniu danych z kategorii mediów i sklepów internetowych udało nam się przekroczyć 120GB danych! Jest to oczywiście zasługa całego zespołu, którego zaangażowanie jest inspiracją dla nas samych.
Jak myślicie, ile uda nam się zebrać tej wiosny?

AI dataset

Kolejny kamień milowy

Autor wpisu Autor: Maciej Ogrodnik
Data wpisu 17 marca 2023

Po miesiącach ciężkiej pracy i niekończących się rozmów możemy powiedzieć że dołożyliśmy kolejną dużą cegiełkę ku realizacji naszego celu. Osiągnęliśmy ponad 100 GB danych tekstowych! A wśród nich są takie źródła z polskojęzycznej Wikipedii, prace naukowe czy powieści. Co Wy na to? Jakie jeszcze dane, z jakich źródeł chcielibyście aby się znalazły w pierwszym polskim GPT? Zapraszamy do wglądu.

AI dataset

Wielkie Ogłoszenie!

Autor wpisu Autor: Maciej Ogrodnik
Data wpisu 16 marca 2023

Od teraz na rozszerzeniu naszej strony(https://speakleash.streamlit.app/) możesz zobaczyć live dashboard! Dzięki czemu możesz na bieżąco śledzić przebieg naszych prac, zaczynając od pojemności danych, rozbieżności danych między branżami i wiele więcej! Dodatkowo możesz zastosować filtry, które pomogą dopasować dashboard do Twoich potrzeb. Jeśli masz jakieś pytania, zachęcamy do kontaktu.

konferencja

PyTech Summit 2022

Autor wpisu Autor: SpeakLeash.org
Data wpisu 5 grudnia 2022

Jeżeli chcesz dowiedzieć się więcej o projekcie SpeakLeash weź udział w zimowej edycji konferencji PyTech Summit 2022 (online) [ 08.12.2022 ], gdzie jeden z naszych założycieli – Sebastian Kondracki będzie miał okazję prowadzić prezentację na nasz temat. Możesz zgarnąć darmowe bilety na konferencję tutaj.

AI dataset

Social & GitHub uruchomione!

Autor wpisu Autor: SpeakLeash.org
Data wpisu 4 grudnia 2022

Jesteśmy szczęśliwi, że możemy ogłosić: nasze platformy social media i GitHub są uruchomione! Linki znajdziesz w stopce na dole strony i w zakładce Społeczność i kontakt. Jeżeli chcesz być na bieżąco informowany o naszych postępach obserwuj nasze konta społecznościowe.