Články
Zprávičky
Fórum
Podpořte Root
Školení
Galerie
Kalendář
Root do mailu
RSS
Blogy
Knihy
Speciály
Manuály
Licence
Jak na Linux
Zdroják
Hledat
Root.cz
»
Věda a výzkum
Věda a výzkum
Vědecké nástroje, studie, pokusy, sci-fi.
1
–
30
/
715
První strana
Předchozí strana
1
2
3
4
5
6
7
Následující strana
Poslední strana
Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP), 2.část
Dnes si vysvětlíme algoritmy pro vektorizaci jazykového korpusu, což je proces, při kterém se z jednotlivých textových dokumentů (každý dokument je představován řetězcem) konstruuje matice s numerickými hodnotami.
Pavel Tišnovský
Dnes
Doba čtení:
60 minut
Nový test FrontierMath AI nezvládá
V červenci jsme informovali, že umělá inteligence Google si celkem dobře vedla v Mezinárodní matematické olympiádě. Například v testu GSM-8k dosahují LLM běžně 96% úspěšnosti. Společnost EpochAI vyvinula nový matematický test pro AI s názvem…
Jan Fikar
15. 11. 2024
Počet nových komentářů
30
Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP)
V článcích o scikit-learn jsme se zabývali zpracováním a predikcí numerických dat. Ovšem v praxi je zapotřebí pracovat i s dokumenty psanými v přirozeném jazyce. I v takových případech najde scikit-learn své využití.
Pavel Tišnovský
14. 11. 2024
Počet nových komentářů
1
Doba čtení:
55 minut
ChatGPT má novou doménu chat.com
CEO OpenAI Sam Altman ve středu oznámil novou doménu chat.com pro ChatGPT. Zajímavé je, jak se k lukrativní doméně dostal. Dharmesh Shah koupil doménu na začátku roku 2023 za 15,5 miliónů dolarů. Tu poté prodal za neupřesněnou částku právě OpenAI…
Jan Fikar
8. 11. 2024
Manipulace s tenzory v knihovně PyTorch
Vysvětlíme si, jak jsou tenzory uloženy v paměti počítače nebo TPU. Taktéž si ukážeme získání pohledu (view) na tenzor a následně si popíšeme i různé operace, které je možné s tenzory provádět jako s celkem.
Pavel Tišnovský
7. 11. 2024
Počet nových komentářů
9
Doba čtení:
27 minut
Od projektu Scikit-learn ke knihovně PyTorch
Začneme se zabývat knihovnou PyTorch, která je poměrně intenzivně využívána v oblasti strojového učení (machine learning) a zejména pak hlubokého učení (deep learning).
Pavel Tišnovský
5. 11. 2024
Počet nových komentářů
1
Doba čtení:
20 minut
OFF Radio Kraków ukončilo po týdnu experiment s AI
Jak jsme tu psali, OFF Radio Kraków propustilo své hlasatele a pokusně vysílalo výhradně pomocí tří AI. Experiment měl podle slov šéfa rozhlasu původně trvat tři měsíce. Ovšem po negativních reakcích posluchačů byl ukončen již po týdnu. Bývalý…
Jan Fikar
4. 11. 2024
Počet nových komentářů
7
Největší známé prvočíslo má 41 milionů číslic, můžete se přidat k hledání dalších
Objevování největších prvočísel fascinujícím způsobem spojuje vědu, technologie a komunitu. Dnes se zaměřujeme na jejich hledání pomocí distribuovaných výpočtů, do kterých se může zapojit každý.
David Bařina
30. 10. 2024
Počet nových komentářů
25
Doba čtení:
4 minuty
Jazykový model Claude umí nově ovládat počítač
Nově vydaný velký jazykový model Claude 3.5 Sonnet umožňuje ovládat aplikace v počítači. Funkcionalita se jmenuje computer use a je v betaverzi. Computer use je postavený na jednoduchém protokolu, kdy model ovládá klientskou aplikaci pomocí…
radekm
24. 10. 2024
Počet nových komentářů
3
Neuronové sítě v knihovně scikit-learn: dokončení
Prozkoumáme, jaký vliv mají hyperparametry modelů MLPRegressor i MLPClassifier na kvalitu natrénované neuronové sítě. Budeme přitom sledovat interní stav velmi jednoduché sítě s pouhými třemi neurony.
Pavel Tišnovský
24. 10. 2024
Doba čtení:
49 minut
Volba funkcí a algoritmů pro trénink neuronových sítí ve scikit-learn
Popíšeme si aktivační funkce, které lze vybrat při konstrukci neuronových sítí. Taktéž se zmíníme o možnosti výběru algoritmů použitých při tréningu neuronových sítí a jejich vlivu na kvalitu výsledků.
Pavel Tišnovský
17. 10. 2024
Počet nových komentářů
4
Doba čtení:
44 minut
Větrné elektrárny využívající proudu vzduchu z ventilátorů na střeše datacentra
V Nature Scientific Reports vyšel článek, který zabývá využitím malých větrných turbín v datovém centru. Turbíny zachycují energii z proudu vzduchu od chladících ventilátorů. Podle článku ventilátory spotřebují 336,39 MWh ročně, zatímco větrné…
ledvinap
11. 10. 2024
Počet nových komentářů
43
Mravenčí kolonií na Nurikabe
blog
Algoritmus mravenčí kolonie patří do rodiny pravděpodobnostních optimalizačních algoritmů zaměřených na hledání cest v grafech. Je pokusem napodobit chování mravenčí kolonie při hledání co nejkratší cesty k potravě.
Redakce
11. 10. 2024
Rozpoznávání obrázků s knihovnou scikit-learn
Ukážeme si jeden ze způsobů rozpoznání rastrových obrázků. Použijeme obrázky s rozlišením pouze 8×8 pixelů, které lze reprezentovat vektorem s 64 prvky. Takto krátké vektory můžeme využít pro trénink různých modelů.
Pavel Tišnovský
10. 10. 2024
Počet nových komentářů
3
Doba čtení:
48 minut
Vydání QtRvSim 0.9.8: grafický simulátor RISC-V pro výuku
Nové vydání k vizualizaci zřetězeného zpracování instrukcí (pipeline) a činnosti vyrovnávacích pamětí (cache) přidává predikci skoků a její vizualizaci (Branch target Buffer, Branch History Buffer, Global History Register). Prediktor implementoval…
Pavel Píša
4. 10. 2024
Počet nových komentářů
3
Neuronové sítě v knihovně scikit-learn (2.část)
Budeme se opět zabývat neuronovými sítěmi. Ukážeme si změnu topologie neuronové sítě provádějící regresi, ale například i použití takzvané matice záměn (confusion matrix). Nakonec neuronovou síť naučíme malou násobilku.
Pavel Tišnovský
3. 10. 2024
Počet nových komentářů
3
Doba čtení:
52 minut
Neuronové sítě v knihovně scikit-learn: vytvoření a učení malé sítě
Dnes si ukážeme, jak vytvořit neuronovou síť s volitelným počtem skrytých vrstev, naučit tuto síť řešit zvolený problém s využitím sady trénovacích dat a následně tuto síť použít nad další sadou (validačních) dat.
Pavel Tišnovský
24. 9. 2024
Počet nových komentářů
4
Doba čtení:
46 minut
Linux na čtyřbitovém procesoru Intel 4004 z roku 1971
Dmitry Grinberg před dvanácti lety nabootoval Linux na osmibitovém mikrořadiči AVR. Nyní se rozhodl posunout laťku ještě dál, tedy spíše zpět. Nabootoval Debian na čtyřbitovém procesoru Intel 4004, což je zároveň vůbec první mikroprocesor na…
Petr Krčmář
23. 9. 2024
Počet nových komentářů
7
AutoEncoder na ořechy
blog
Ony ty AutoEncoder modely jsou na první pohled sice jednoduché, ale jejich využití je dost zajímavé. Jednou z oblastí využití je tzv. Anomaly Detection (někdy také Outlier Detection).
Redakce
20. 9. 2024
Redukce atributů v datových sadách před tréninkem modelů ve scikit-learn
Často se setkáme s datovými sadami, které obsahují velké množství atributů. Většinou ovšem dopředu nevíme, které z nich má smysl použít pro trénink modelu a které atributy jsou naopak zbytečné či dokonce nevhodné.
Pavel Tišnovský
19. 9. 2024
Doba čtení:
41 minut
Důkaz bezpečnosti linuxového generátoru náhodných čísel
Čtyři vědci zveřejnili formální důkaz [PDF], že nový deterministický generátor náhodných bitů (DRBG) v Linuxu je bezpečný. Konkrétně to znamená, že počet dotazů, které by bylo třeba provést, aby se odhalil jeho vnitřní stav, závisí na kvalitě…
Petr Krčmář
18. 9. 2024
Počet nových komentářů
21
Nové „uvažující“ modely AI od OpenAI o1-preview a o1-mini
Společnost OpenAI ve čtvrtek představila svůj jazykový model „Strawberry“ a tvrdí, že oproti předchozím velkým jazykovým modelům (LLM) výrazně zlepšila schopnosti, které nazývá „uvažováním“ a řešením problémů. Rodina modelů s formálním názvem…
Petr Krčmář
13. 9. 2024
Počet nových komentářů
18
Lokalizace infekce malárie – AutoEncoder
blog
Získání validních dat pro učení může být někdy velice pracné (obvykle jsou potřeba nějací odborníci, kteří data správně klasifikuji), a někdy získání takových dat může být úplně nereálně (z finančních nebo organizačních důvodů).
Redakce
13. 9. 2024
AI vytvořilo hru Super Mario jen podle videa
Výzkumníci z Virtuals Protocol vytvořili AI MarioVGG (Virtual Game Generation), která dokáže vytvořit video hru jen podle videa, v tomto případě Super Mario Bros. Dataset s obrázky ze hry je dostupný na GitHubu. Obsahuje přes 700 tisíc obrázků…
Jan Fikar
6. 9. 2024
Lokalizace infekce malárie: klasifikační model a heatmap
blog
Tímto příspěvkem bych chtěl volně navázat na předchozí články zabývající se klasifikací obrázků do několika tříd. V těch dřívějších článcích se jednalo o rozpoznání zápalu plic na základě RTG snímků.
Redakce
6. 9. 2024
Scikit-learn: jednoduchý a současně i univerzální model lineární regrese
Ještě jednou se vrátíme k modelu pro lineární regresi. S ním jsme se již setkali, ovšem ve skutečnosti je i zdánlivě jednoduchý koncept lineární regrese realizován tak, že ho lze využít mnoha dalšími způsoby.
Pavel Tišnovský
5. 9. 2024
Doba čtení:
45 minut
Křížová validace modelů v knihovně scikit-learn
Budeme se zabývat důležitou problematikou, konkrétně jak vybrat co nejvhodnější model, jak nastavit hyperparametry modelů a jak vlastně zjistit, které atributy se mají použít při tréninku modelu.
Pavel Tišnovský
29. 8. 2024
Počet nových komentářů
1
Doba čtení:
41 minut
Taxi bez řidiče na sebe troubila v San Franciscu
V San Franciscu mají autonomní auta bez řidiče Waymo, která slouží jako taxi. Tato auta zaplňovala parkoviště v blízkosti obytných budov a přitom na sebe navzájem troubila. Troubení dosahovalo vrcholu vždy kolem 4 hodin ráno. Obyvatelé si…
Jan Fikar
23. 8. 2024
Počet nových komentářů
41
Balíček scikit-learn: trénink a předpovědi modelů provádějících regresní analýzu
Dokončíme popis problematiky modelů provádějících regresní analýzu. Ukážeme si, jak tyto modely natrénovat, jak zjistit, které atributy způsobují špatné předpovědi modelu i to, jak zjistit atributy způsobující nestabilitu předpovědí.
Pavel Tišnovský
22. 8. 2024
Počet nových komentářů
7
Doba čtení:
39 minut
Balíček scikit-learn: modely provádějící regresní analýzu
Na článek, v němž jsme se zabývali základní problematikou modelů provádějících klasifikaci dat, dnes navážeme. Ukážeme si jeden z modelů, jenž namísto klasifikace provádí regresi. Jedná se o model lineární regresní analýzy.
Pavel Tišnovský
15. 8. 2024
Počet nových komentářů
6
Doba čtení:
42 minut
1
–
30
/
715
První strana
Předchozí strana
1
2
3
4
5
6
7
Následující strana
Poslední strana
Zprávičky
Bezpečnostní chyba v balíčku Needrestart umožňuje ovládnout systém
V balíčku Needrestart, který je ve výchozím nastavení nainstalován například v Ubuntu Serveru od verze 21.04, bylo odhaleno několik velmi…
8:49
Počet nových komentářů
2
Jádro Linux 6.13 přinese podporu Raspberry Pi Camera Front End
Spolu s dále rozvinutou obecnou podporu běhu Linuxu na Raspberry Pi 5, která se objevila v jádru 6.12, přinese následné jádro 6.13 též podporu…
7:00
Žebříček TOP 500: El Capitan s CPU+GPU AMD vede, Intel až na třetím místě
Superpočítač El Capitan je novým králem světového žebříčku. Tento stroj s více než 11 milióny CPU jader v podobě procesorů EPYC generace Zen…
0:00
Další zprávičky
Napište zprávičku
Komerční sdělení
Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC
Budoucnost zpracování dokumentů s AI
ŠKOLENÍ: Jak bezpečně spravovat a provozovat linuxové servery?
VÍCE INFO
ČLÁNKY DO MAILU