Benfordův zákon - Jak nás klame intuice 3 - s Mirko Rokytou

  Рет қаралды 90,595

Marek Valášek

Marek Valášek

Күн бұрын

Пікірлер: 328
@dodomarek
@dodomarek 5 жыл бұрын
Výborný video. Sice jsem tak od 20. minuty ničemu nerozuměl ale i tak jsem se naučil víc než za celý gympl. Děkuji pěkně! :)
@grandfatherandfatmanparkou3486
@grandfatherandfatmanparkou3486 4 жыл бұрын
Pánové, děkuji za Vaši tvorbu. Je to koncert pro nadšence. Určitě si odpočinu u vlídného vysvětlování matematických dějů, a zároveň se poučím. DĚKUJU!
@marekvalasek7251
@marekvalasek7251 4 жыл бұрын
Dekujeme :-)
@mispanludensprinck5652
@mispanludensprinck5652 5 жыл бұрын
Velice pěkné. Připomnělo mi to takové to Paretovo pravidlo, které jsem si kdysi ověřoval pro obce a města v ČR a skutečně: Prvních 20% měst a obcí seřazených podle počtu obyvatel má dohromady skoro přesně 80% všech obyvatel ČR.
@martinkroufek1699
@martinkroufek1699 5 жыл бұрын
Naprosto úžasná série videí! Děkuji moc a doufám, že v budoucnu vzniknou i další videa ve spolupráci s panem doc. Rokytou.
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Pokud čas dovolí, tak ano.
@miroslavmaly9505
@miroslavmaly9505 5 жыл бұрын
Bude do budoucna ještě více videí s panem Rokytou? Mám z nich opravdu velikou radost.
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
To zalezi hlavne na panu docentovi, ale verim, ze ano :-)
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Já taky věřím, že ano. A omlouvám se za dlouhé čekací doby, já jsem skutečně poměrně zaměstnaný člověk. Ale s Markem je to příjemná spoupráce a věřím, že ještě nějaké zajímavé téma spolu vymyslíme
@grandfatherandfatmanparkou3486
@grandfatherandfatmanparkou3486 4 жыл бұрын
@@mirkorokyta9694 Hurá! To je koncert...DĚKUJI
@armandonicolas2651
@armandonicolas2651 3 жыл бұрын
Sorry to be off topic but does anybody know a way to log back into an Instagram account?? I stupidly forgot the login password. I love any help you can give me
@zakailondon2979
@zakailondon2979 3 жыл бұрын
@Armando Nicolas Instablaster =)
@Anton_cz
@Anton_cz 5 жыл бұрын
Tak tohle byl klenot.
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
Dekujeme :-)
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
@@marekvalasek7251 Přidávám se s poděkováním. M.R.
@dusansimunek893
@dusansimunek893 5 жыл бұрын
Jsem to hned vyzkoušel na souboru čísel účetního deníku naší firmy (cca 110 tis řádků) a na nich Benford funguje :-)
@Pavel_III
@Pavel_III Жыл бұрын
V Octave (Matlabu) to jde krásně nasimulovat. Ale diferenciální počet je na to elegantnější a průkazný. Super videa, rád se k nim vracím. Díky
@jurajkubis5591
@jurajkubis5591 4 жыл бұрын
Tymto ste ma dostali a zacinam rozmyslat o aplikovani do realnych alanyz, ktore vytvaram. Dakujem krasne, velmi inspirativne
@jindrakjan
@jindrakjan 5 жыл бұрын
Moc děkuji za tuto sérii. Mělo by to být povinné pro základní a střední školy. Opravdu pěkná práce. A přidám jednu myšlenku nebo spíše další otázku. Nejsem matematik a vysokoškolskou matematiku jsem už pozapoměl, ale to, že lze Benfordův soubor čísel vynásobit libovolným číslem, mě přivedlo na myšlenku, že Benfordův soubor čísel lze dostat postupným náhodným násobením souboru obsahujícím původně samé jedničky. A tabulka malé násobilky 1-9 x 1-9 je soubor 81 čísel kde je výskyt první platné číslice 1-22,2% a postupně klesá k 9 s výskytem 3,7%. Zkusil jsem i tabulku násobilky 999x999 -soubor téměr 1 000 000 čísel, ale zde je výskyt 1-24,9% a 9-3,4%. Je možné, že pokud zvětším matici násobilky na "nekonečno" dostanu se k požadovaným 30,1%? Pokud ano, pak Benfordův soubor čísel je každý "náhodný" výběr z této nekonečné matice?
@fraancek1
@fraancek1 5 жыл бұрын
K tomuto asi jen takový laický nezasvěcený poznatek - nabyl jsem dojmu, že Benfordovský soubor by měl mít možnost obsahovat jakékoliv číslo. Soubor součinů je ale o část čísel ochuzen - nejsou v něm prvočísla, ne?
@MarvinCZ
@MarvinCZ 4 жыл бұрын
@@fraancek1 Soubor nemusí mít možnost obsahovat jakékoliv číslo. To není mezi jeho podmínkami ani v jeho definici. Existuje dost příkladů Benfordovských souborů, které toto nesplňují, včetně několika uvedených ve videu: mocniny dvou, faktoriály, Fibonacciho posloupnost.
@itanek
@itanek Жыл бұрын
Já myslím, že vaše úvaha je naprosto správná! Dle mého Benford vychází z velikostí chlívečku vůdči tomu číslu. Když vezmu Váš příklad s násobilkou. Řekněme, že neumím počítat, ale 2x5 je 10 a mám jedničku, kdybych se spletl, tak vlastně až do necelé 20 to padne do stejného chlívečku. Tedy 10-19,999... - k mému výpočtu 2x5 =10 si můžu dovolit až "+99,9..% navíc chybu". Zatímco když chcete aby vyšla 9tka, tak ta velikost chlívečku je "10x menší", 9x10 = 90 a mohu si dovolit chybu jen do 10% tedy do mého výsledku 99. Je to stejné jako Benford u počtu obyvatel obcí. Jeslti má městečko 9 tis bude hodně blízko i výsledku 10tis, 11tis obyvatel atd.. Tedy vedle chlívečku 9tis obyvatel je 10 pozic 10+tis.. Všiměte si že 1čka má 30% a 9tka 4,7% (kdyby byla další položka v řadě, tak by měla 3%)
@11patron
@11patron 5 жыл бұрын
Aplikace v praxi... Mysli si jakekoliv cislo, vynasobime ho mym nahodnym cislem. Kdyz vysledek zacina cifrou 1-3 vyhral jsem, 4-9 vyhravas ty. A takto muzeme hrat nejlepe cely vecer, at nam pravdepodobnost pekne vydelava.
@loskutak777
@loskutak777 4 жыл бұрын
no jo, ale kdybych hral o penize, chtel bych znat pravidal. Kdyz budu znat pravidla, nebudu si myslet cisla zacinajici na 1-3
4 жыл бұрын
19:02 A tady se odpojuju, děkuju pánové, bylo to zajmavé :)
@_peterroni
@_peterroni 5 жыл бұрын
Parádne video - videá!👍👏
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
Diky :-)
@eNtyck
@eNtyck 5 жыл бұрын
Už jsem na tohle téma něco v minulosti viděl, ale děkuji za připomenutí. Jak si to vysvětluju já "selským rozumem" je zhruba takhle... Když budu brát třeba čísla popisná domů s tím, že začínám od jedničky a jdu nahoru. Pokud budu mít devět domů, tak každá cifra od 1 do 9 bude zastoupena jednou, následuje pak ale 10-19, což je dalších 10 čísel s číslicí začínající jedničkou. Samozřejmě pokud půjdu dál, tak s dalšími deseti domy číslice 2 tu jedničku dožene, dalších deset domů bude s číslicí 3, ale v reálným světě se nebavíme o nekonečných řadách domů. Takže číslo jedna musí mít logicky větší šanci na výskyt u prvního čísla... Z 19 domů jich má 11 číslo 1 na začátku, ze 199 domů jich bude mít 101 číslo 1 na začátku a ostatní číslice MŮŽOU jedničku vždy jen dohnat, ale nikdy předehnat a spíše se stane, že řada domů skončí a některý čísla budou "tratný". Jedná se o velice konkrétní a zjednodušený koncept, ale myslím si, že se to takhle nějak dá chápat, což? :)
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
Selskym rozumem to vypada dobre, ale nejsem si jisty, jestli by z toho vysel Benford. Chybi tam totiz to, ze jsou data pres mnoho radu. A to se ukazuje jako dulezite. Spis si myslim, ze by z toho vypadlo neco jako hodne jednicek, mene dvojek, par trojek a dal skoro nic. Ale je mozny ze se pletu. Chtelo by to zpracovat data :-)
@eNtyck
@eNtyck 5 жыл бұрын
@@marekvalasek7251 To je bezpochyby pravda. Je to spíš takovej mikroskopickej vzorek, na kterym to nemusí být špatné vysvětlit. Je to hodně podobné jako u zmiňovaných bankovních transakcí. Pravděpodobně bude drtivá většina v řádech desítek, stovek a tisíců. O mnoho méně desetitisíců a tak dále... A přehoupnutí řádu vždy začne novou číselnou řadu začínající jedničkou. Pravděpodobnost, že číslo bude začínat jedničkou se tak pohybuje mezi cca 11-56% (1-9, 1-99, 1-999, 1-9999.... vs 1-19, 1-199, 1-1999). Na YT je toho o tomto uděláno mraky videí, ale hledám jedno specifické, myslím že to bylo od VSauce, ale za boha ho nemůžu najít :D Ještě zkusím později pohledat.
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Dobrý den, tohle k benfordovskému rozdělění nepovede, i kdybyste šel přes mnoho řádů čísel domů. Tomuto přístupu se říká tzv. paradox šatnářky - často se to uvádí jako situace, kdy šatnářka vydává lístky do šatny. To bohužel s Benfordem nijak nesouvisí, je to jen a prostě statistika prvních cifer v deterministické posloupnosti všech přirozených čísel. Chvíli převáží jedničky, pak je doženou dvojky, ty pak doženou čtyřky atd., pak se všechny cifry vyrovnají. A pak to začne nanovo, jedničky se dostanou dopředu atd. Důležité je to, že tento proces se nestabilizuje, bude oscilovat mezi chvilkovou převahou nižších cifer nad vyššími a situací, kdy bude všech rovnoměrně stejně. Benford má jako každý jiný statistický zákon tu důležitou vlastnost, že s větším počtem dat se stabilizuje a moc se nemění. Tohle bude pořád oscilovat a neustálí se to. Ona "logicky větší šance jedničky" je právě ten moment, kdy je člověk veden tím, že ví, co má vyjít a snaží se to nějak zdůvodnit. :) Nic si z toho nedělejte, takto se o vysvětlení Benforda snažili dřív i poměrně erudovaní matematici.
@rastothesuchsoft6546
@rastothesuchsoft6546 4 жыл бұрын
Toto by určite nefungovalo, nejde o to, že sú ulice, kde by sme došli len po 27, alebo po 45, ale že celý ten súbor vznikol akoby logaritmicky (prirodzený logaritmus). Teraz som si uvedomil, že ak by sme použili špeciálnu číselnú sústavu, a to sústavu, ktorá by sa správala logaritmicky, tak by hustoty pravdepodobností mali byť 11.1111 % vo všetkých skupinách. Verím, že sa dá takáto číselná sústava vytvoriť, ale nemám šajnu ako, a asi by to bolo matematicky dosť náročné. ;) A najzaujímavejšie by bolo takúto číselnú sústavu použiť na riešenia nevyriešených otázok v matematike. Z toho mi vyplýva, ak sa také niečo dá, určite sa to už používa. ;)
@jannovak2996
@jannovak2996 4 жыл бұрын
Myslím si že na to jak se dívat na počty obyvatel může pomoci právě intuice. 1)např. na obec s 900 Obyvateli potřebuji o dost více lidí než na obec se 100 obyvateli.(tzn. obec s 900 je méně pravděpodobná) 2)taky rozdíl mezi 100 a 200 // rozdíl mezi 900-1000 je sice matematicky stejný, ale lidsky intuitivně je daleko větší rozdíl mezi 100 a 200(protože i když člověk řekne rozdíl jeho mysl pracuje poměrově). 3)Když už je ve vesnici 900 lidí tak určitě netrvá tak dlouho průměrně aby přerostla nad 1000. Oproti tomu ze 100 jít na 200 trvá průměrně určitě déle. Moje nematematické a neúplné výpočty počítáme pravděpodobnosti pro 10 až 99 obyvatel (jedná se o mou teroii) a -> (pravděpodobnost že počet obyvatel začíná cifrou 1) b -> (pravděpodobnost že počet obyvatel začíná cifrou 2) c -> (...) ... i -> (...) a+b+c+...+i=1 (pravděpodobnost) a=a b=a29/49 (interval 10-19 ->10+19 -> dvojnásobek průměru daného intervalu, 20+29...) -> je 29/49 krát pravděpodobné aby číslo začalo cifrou 2 oproti cifře 1 c=a29/69 (10+19 -> 30+39...) ... i=a29/189 (...) -> a≈0,29864 (pravděpodobnost že počet obyvatel začíná cifrou 1) b≈0,17674 (pravděpodobnost že počet obyvatel začíná cifrou 2) c≈0,12551 (...) ... i≈0,04582 (...) výsledné pravděpodobnosti jsou celkem blízko pro mě uspokojivě. Výstup?Moje teorie Já to chápu tak že tam kde číslo představuje reálnou hodnotu něčeho a zároveň to není omezené(může to přirozeně zvětšovat hodnoty)tam benford funguje. Protože je těžší nabýt hodnoty například v intervalu 90 až 99. počet byvatel,v těch transakcích(je těžší dát dohromady 9000kč než 1000kč atd.) Výška stromů?Intuice říká že ne, že strom roste průměrně do svých rozměrů, není to tak že čím je vyšší tím ještě víc roste. Vodní toky? asi ano mohou být od velmi malých až po velmi velké.( jsem ale určitě ovlivněn videem) Rád bych si vyzkoušel svojí teorii na dalších věcech, a následně ji ověřil. předpověď(kdy Benfordův zákon funguje podle mě) počet stromů v lese,počet hvězd v galaxii, Kdo má kolik "lajků" na FB nebo kdekoli jinde. Kolik má video shlédnutí. Za jakékoliv reakce budu rád a děkuji za skvělé video.
@eltwarg6388
@eltwarg6388 4 жыл бұрын
No, správne ste to pochopili! Stačí takáto strohá reakcia? :) Áno, pointa je v tom, že od 1 po 2 je oveľa ďalej ako od 5 po 6 a to je ďalej ako od 9 po 10... na prirodzrenej logaritmickej škále (nie lineárnej). A to, aby tá škála bola prirodzená pre daný štatistický set, je vlastne hlavná podmienka toho rozdelenia.
@itanek
@itanek Жыл бұрын
Vysvětlení jsem pochopil ono i funkce která se objevila 1/x nám hezky klesá, nemusíme ani odčítat dva logaritmy kde logaritmus jde nahoru ale brzdí takže jsou rozdíly menší a menší. K překvapení pana Rokyty v 54:00 : Pokud má soubor dat tuhle pravděpodobnost (benfordovsky), tak po přeškálování je jasné že se bude chovat stejně. Přece číslo je jedno zda je to délka řeky nebo počet obyvatel. Tady nerozumím co mu je Rokytovi divný. Když se tam vyskytují čísla s touto relativní četností, nemusím zpětně přemýšlet o počtu lidí a pod číslami si mohu představit jinou interpretaci. Já tu problematiku pochopil jinak, jinou podstatu. Pokud si napíšu čísla přirozená čísla za sebou, tak vedle chudáka devítky je několik jedniček. Jeslti má obec řekněme Choceň 9 tis bude asi stejně pravděpodobné, jako by měla 10, nebo jako by měla 11 tis. Tedy když se budu trefovat do 9tky, tak mám vedle ní 10 podobných chlívečků začínající jedničkou.. Když se podíváte na posloupnost rozdělení, jednička má 30, devítka má 4 a něco, tedy skoro 10x méně. Pokud si vezmete můj případ s přirozenými čísly, tak devítka bude mít pré od 90-99 tis obyvatel. 10 chlívečků, kam se budu trefovat. Jenže vedle těchto 10 chlívečků je 100 chlívečků začínající jedničkou 100-199 tis. A tedy jednička má zas skoro 10x navrch! Proč skoro ? - je jasné že dál od 9tky už se do ní hůř budu trefovat, tedy zda má choceň 9 tis nebo 10 či 11 - možná 12 obyvatel, asi je velmi nepravděpodobné že by měla 18 tis.) Základní premisa - je potřeba více rúzných řádů vychazí asi z toho mého popisu viz výše. Tedy čím více přeskoků o řád víc, tím více bude vedle jedniček na úkor devítky (ostatní čísla řekněme analogicky)
@didoonka1523
@didoonka1523 5 жыл бұрын
To je tak krásný ❤️
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
To je tak krásný. :)
@DejvDesign
@DejvDesign 5 жыл бұрын
Udělal jsem kód, který mi vygeneruje můj zvolený počet náhodných číslic a následně spočítá, kolik % z nich začíná na cifru 1, 2, ... A jo... tenhle zákon opravdu funguje! :DD
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
Tak tohle je opravdu zajimave. Muzes presneji popsat parametry toho nahodneho generatoru? Protoze uplne libovolny nahodny soubor by to splnovat nemel. Nebo spis nemusel...
@DejvDesign
@DejvDesign 5 жыл бұрын
Nejdříve jsem generoval čísla přes funkci, u které to nefungovalo, počáteční cifry čísel byli u všech čísel víceméně rovnoměrně. Když jsem každé takto vygenerované číslo vynásobil jiným náhodně vygenerovaným číslem a následně zase vydělil jiným náhodně vygenerovaným číslem a takto několikrát dokola, tak mi procenta začali vycházet jako říká tenhle zákon.
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
Muzes z tech dat udelat histogram? Zajimalo by me rozlozeni tech cisel. Kdybys je scital, melo by se to blizit normalnimu rozdeleni. Ale nevim co se tam deje kdyz se nasobi...
@jaroslavsevcik3421
@jaroslavsevcik3421 5 жыл бұрын
@@marekvalasek7251 Ja som si urobil jednoduchu google sheet tabulku a tiez to funguje. Staci vygenerovat 3 stlpce dat A, B, C a vysledok ulozit ako V = A * B / C. Nasledne urobit statistiku vyskytov prvych cifier a je to. Mozem vyzdielat, ak by bol zaujem. Urobil som aj vypocet pre poslednu cifru (okrem 0), ale tam to vyzera na nahodnu distribuciu.
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
Jardo paráda. Díky moc.
@venaanek
@venaanek 5 жыл бұрын
Uff :). Z tabulky Benford - bankovní transakce (8:27) jsem, při pravděpodobnosti 62,9%, právě dopočetl kód banky účtu.
@petrsedlak9082
@petrsedlak9082 4 жыл бұрын
Přece nebudeš posílat money na 62%, já Ti pošlu svůj 100% účet a pak to spusť...
@jakubchaloupka2960
@jakubchaloupka2960 3 жыл бұрын
Super video! Nicmene nezda se mi tam dostatecne vysvetleno, jak se z intervalu (a, a+1) pro pocatecni cifry a z intervalu {1, 2, 3, 4, 5, 6, 7, 8, 9} najednou preslo k tomu, ze a je libovolne realne cislo. Predpoklad skalovani tvrdi, ze rozlozeni prvnich cifer zustava pri nasobeni konstantou nemenne, ale treba interval (Pi, Pi + 1) at prenasobim jakoukoliv konstantou, vzdy bude existovat nejaka pocatecni cifra takova, ze ve vyslednem intervalu budu mit cislo zacinajici touto cifrou, ale budu mit cislo zacinajici touto cifrou i mimo nej. Nebo ten predpoklad skalovani je ve skutecnosti silnejsi a tvrdi, ze rozlozeni pravdepodovnosti zustava po nasobeni konstantou nemenne pro libovolny podinterval v "normalizovanem" intervalu (1, 10) a ne jenom pro podintervaly (1, 2), (2, 3), (3, 4), atd.? Nebo dokonce z toho zdanlive slabsiho predpokladu vyplyva ten silnejsi? Dekuji.
@igork.1148
@igork.1148 4 жыл бұрын
naprosto úžasný pánové :) a to říkám jako absolvent filozofické fakulty, který na gymplu nesnášel matiku... jo, takhle nás to neučili.... mimochodem, minulý týden jsem použil vaše příklady (provázek kolem země a kolejnice) se svými studenty v hodinách angličtiny... (samozřejmě, že jsem jim řekl odkud jsem čerpal a odkázal na vaše videa. )
@mispanludensprinck5652
@mispanludensprinck5652 5 жыл бұрын
Ještě jsem si vzpomněl, že když jsme s milým panem docentem (který tenkrát ještě nebyl docentem :) ) probírali Jakobián, odvozovali jsme vzorec pro objem n-rozměrné koule, což tedy vlastně také vyšlo poněkud neintutivně, jelikož pro konstantní poloměr se objem n-rozměrné koule pro velká n blíží k nule. (Ale ono to je svým způsobem pochopitelné, protože když je taková jednotková koule vepsána do n-rozměrné krychle, tak její tělesová úhlopříčka, tj. vzdálenost bodů {0,0,0,...0} a {1,1,1,...,1}, je sqrt(n), čili to "masíčko" je koncentrováno pro velká n v rozích a na kouli mnoho nezbyde. 🙂) Šťastný a veselý nový rok!!!
@msumbera
@msumbera 5 жыл бұрын
Chlapi dobre, moc zajimave
@petrsedlak9082
@petrsedlak9082 4 жыл бұрын
Nevím, zda jsem jediný, koho to napadlo, ale když vezmu staré dobré logáro (pro mladší ročníky: Logaritmické pravítko), tak to je asi přesně ono: začíná to od 1 a končí 10, délka mezi 1 a 2 je cca 30% z celku, mezi 2 a 3 cca 17% atd. Vztaženo k fyzice tedy stačí třeba udělat na celých číslech nějaké "přepážky" a pustit skrze ně nějak rovnoměrně pytlík písku a pak by zřejmě ty jednotlivé hromádky byly taky v Benfordově rozdělení... Ostatně jak bylo řečeno, tak Newcomba to napadlo právě u logaritmických tabulek. A mimochodem některé přírodní (i fyziologické) děje mají fakt nějaký typ logaritmické závislosti (např. akustika - decibely stoupají logaritmicky tak, že hlasitost se zdvojnásobuje při zvýšení o cca 3 dB). V průběhu let už jsem zapomněl většinu těch definic kolem integrálů a primitivních funkcí, ale Vaše video mi to trochu oživilo a já Vám za ně, jakož i za všechna další, velice děkuji.
@jozeffranc1713
@jozeffranc1713 5 жыл бұрын
Zaujimava prednaska, len by sommal 2 otazky: 1. Dal by sa Benfordov princip pouyit na generovanie dat? Myslim tym, ze mam neuplny subor dat (dajme tomu 70%) a potrebujem doplnit dalsich 30%. 2. Ak mam subor dat a zistim ze nema Benfordovo rozlozenie, mozem o nom prehlasit, ze je tento subor ovlivneny nejakym umelym zasahom?
@vrbic207
@vrbic207 4 жыл бұрын
Nejsem přímo matematik, ale fyziky (matematické analýzy jsem prošel). Add 1) Podle mě ano. Prostě zvolíš náhodná čísla (1,10) a vložíš do té funkce co jim vyšla. A pak pronásobíš 10^x kde jsou celá náhodná čísla (0,x) podle toho jak velký řád potřebuješ. Můj názor. Add 2) Super otázka, ale podle toho co říkali na začátku, že tam je více pravidel i neznámých, tak může být porušené jiné pravidlo než jen umělý zásah. Můj názor.
@eltwarg6388
@eltwarg6388 4 жыл бұрын
Ide o štatistické rozdelenie tých dát. Obvykle sa určí, aké je rozdelenie tých dát, čo sa dá aj zo 70%, ak to nie je nejako umelo, ale náhodne vybraná časť. Napríklad sa postaví hypotéza, že tá množina dát má normálne rozdelenie s nejakým mediánom/priemerom a rozptylom (disperziou), potom sa to otestuje, či to tak je... Alebo sa zistí, že to má nejaké viac-menej logaritmické rozdelenie (a potom to bude mať aj vlastnosť toho Benfordovho rozdelenia prvých cifier). Doplníte to tak, že si náhodne vygenerujete dáta podľa daného rozdelenia. Ten bod dva neplatí, leda ak by ste predpokladali logaritmické rozdelenie tých dát. Ak napríklad predpokladáte normálne rozdelenie v úžšom intervale (malý rozptyl), ako napríklad v príklade s výškou ľudí, ktorý tu autori aj uviedli v úvode, teda že viac ako 50% dospelých mužov bude mať výšku medzi 170cm a 190cm, nie je dôvod predpokladať, že tam bude fungovať Benford na prvé cifry... To dá rozum! ;)
@livemessenger1216
@livemessenger1216 4 ай бұрын
Bankovní transakce přes hodně řádů? Nebo jak jste si modifikovali tak úzkou množinu dat? To nemůže vyjít 8:30
@TheElafis
@TheElafis 5 жыл бұрын
Podobně je v tom i Zipův zákon (snad si to pamatuji správně) když se vezme nejčastější slovo třeba v knížce v jakémkoliv jazyku a dá se mu 1, tak druhé nejčastější má četnost 50% oproti tomu prvnímu další 30% atd prostě převrácená hodnota.
@mispanludensprinck5652
@mispanludensprinck5652 5 жыл бұрын
Zipf distribution se to jmenuje, ale platí to jen pro přirozeně vzniklé jazyky.
@horymirnavratil7701
@horymirnavratil7701 3 жыл бұрын
Jak to bylo s tím bodem b, ze které ho pak vyplynula funkce c/t a vyřešila se daný integrál?
@gabrielakottova1656
@gabrielakottova1656 5 жыл бұрын
video jsem neviděla celé, protože určitou část té matematiky neznám 😃Ale chtěla zjistit a přišlo mi zajímavé to zkusit na podílech zlomku. Začla jsem na 2/1 a potom jsem k jmenovateli i čitateli přičetla 1. Takže vznikla řada 2/1, 3/2, 4/3, 5/4 … Napsala jsem si cyklus který, dokázal v řadě pokračovat a tak jsem si podílů mohla vygenerovat libovolný počet. Porovnala jsem zastoupení číslic na desetinách až desetitisícinách, když na ono místo přišla 0 přesunula jsem se na další desetinné místo a porovnávala to. Výsledek: 1……55,4% 2……18,6% 3…….9,3% 4……..5,6% 5……..3,7% 6………2,6% 7………1,98% 8………1,5% 9……..1,2% Jen tak pro zajímavost celkem jsem měla vygenerovaných skoro deset tisíc čísel (9922) a stejný výsledek vychází i když se začne třeba s 5/1 (tady jsem jich porovnala ale jenom 394).
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Dobrý den, je určitě spousta příkladů posloupností, ve kterých je rozdělení cifer nějakým způsobem nerovnoměrné. Člověk si může brát podíly, může zkoumat odmocniny, může se dívat na hodnoty funkce sinus v celých číslech - možností je nepřeberně mnoho, a pro každou takovou posloupnost je možné zjišťovat, jak jsou v něm zastoupeny jednotivé cifry. Dokud každá taková posloupnost má nějaké svoje rozdělění cifer, tak to vlastně není zas nic tak překvapivého - na jakékoli posloupnosti se dá udělat statistika a něco vyjde. Pokud byste si brala jiné zlomky, třena typu 1/2, 2/3, 3/4 ..., tak ty se všechny blíží k jedničce a jejich výsledky se čím dál více podobají hodnotě 0,9999999..... tam byste asi dostala, že naprosto převažuje cifra 9 nad všemi ostatními. Prostě každá posloupnost má nějakou svoji charakteristiku. To, kdy to začne být zajímavé, nastane tehdy, když se zjistí, že dvě spolu nesouvisející věci mají STEJNÉ rozdělení cifer. To je i případ Benforda a to bylo ono překvapení, když se třeba zjistilo, že něco mají společného délky toků řek, počty obvatel, bankovní transakce a mocniny dvojky. Pak to začne být zajímavé, a pak přijde na řadu ta nejzajímavější otázka: co mají proboha tyto jevy společného, že vedou ke stejné statistice? ... A to je chvíle, kdy začíná výzkum... Ale: tohle moje povídání vás určitě nechce nijak odradit nebo rozesmutnit, naopak, mě velice potěšilo, že vás naše video inspirovalo k tomu, že jste si sama začala dělat numerické experimenty. To je první krok k tomu, aby člověk na něco zajímavého přišel. Jen jsem chtěl tak nějak nastínit, co vlastně se má považovat za "zajímavé". Zdravím, M.R.
@vaclavm4647
@vaclavm4647 4 жыл бұрын
Hehe. S provázkem kolem Země mě klamala intuice ale chápal jsem tu primitivní matematiku/geometrii, zde mě intuice neklamala (nevím proč asi odhad, že když je potřeba více řádů, tak čísla, tak nějak přirozeně většinou ,, pro normálního smrtelníka" začínají od 1 nebo 0,1 a pak se navyšují a těch je méně a méně až se eventuálně přehoupnou do dalšího řádu od 1), nicméně faktoriály a derivace funkcí je pro mě opravdu dost podobné jako tradiční staročínština, i tak hezké video rád bych to někdy chápal, každopádně fascinující :D Čistě pro zajímavost, pokud by se držela rozmanitost řádů od 1 - 100 000 třeba, funguje to na koncová čísla? Je mi to k ničemu a jsem na to krátký, ale tak čistá zvědavost :)
@petrsvec8245
@petrsvec8245 4 жыл бұрын
Před lety jsem narazil na problém Benfordova zákona v knize The Scientist and Engineer's Guide to Digital Signal Processing (autor S. W. Smith), v závěrečné kapitole je jako zajímavost uvedeno objasnění celého problému. Pro zájemce je kniha dostupná i online: www.dspguide.com/ch34.htm
@minefricek
@minefricek 5 жыл бұрын
Dobrý den, mě by zajímalo ohledně té hustoty pravděpodobnosti f(t), která má podobu funkce. Jak zjistíme, že je derivovatelná a integrovatelná, když ji neznáme. To předpokládáme, že je derivovatelná a integrovatelná a po její následném zjištění ověříme zdali je integrovatelná a derivovatelná?
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
Mate pravdu ze to nevime. Proste to predpokladame, abychom se mohli neceho rozumneho dopocitat. Je to samozrejme matematicky prohresek, taky jsme to tam zminili. Ale takove veci se obcas delaji, abychom se dopocitali aspon neceho. Ale matematicky korektni to neni. Na druhou stranu my nedokazujeme Benforduv zakon jako matematickou vetu, takze je to snad omluvitelne :-)
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Dobrý den, dobrý dotaz, ze kterého má mateamtik radost. :) Derivovatelnost f(t) nicméně při výpočtu nepotřebujeme. Funkci f jako takovou nikde nederivujeme, derivujeme jen její primitivní funkci, F, ale ta má derivaci, protože tak je primitivní funkce definovaná, že její derivace exituje a je to f. :) Potřebujeme ale opravdu integrovatelnost f(t) a tu mlčky předpokládáme -prostě věříme, že to za tohoto předběžného předpokladu "vyjde". Chcete-li, můžete si to odůvodnit takto: předpokládáme, že existuje integrovatelná hustota f(t) a za tohto předpokladu se ji snažíme najít. A vida, opravdu jsme ji našli, takže v množině všech integrovatelných funkcí se ta naše hustota opravdu vyskytovala. Jiná forma této úvahy může znít takto: pokud se chceme dopátrat nějaké pravděpodobnosti, tak musíme mít k dispozici integrovatelnou hustotu, protože pravděpodobnost je (v případě nekonečého množsví jevů) vždy integrálem z hustoty. Kdyby neexistovala integrovatelná hustota, tak nebude ani žádný pravděpodobnostní popis zkoumaného jevu.
@minefricek
@minefricek 5 жыл бұрын
@@mirkorokyta9694 Děkuji za vysvětlení. Také pokud se mohu zeptat uděláte ještě nějaké video o Riemannově hypotéze dost mě toto téma zajímá a velmi bych ho ocenil hlavě co se týká netriviálních nulových kořenů. předem děkuji za odpověd.
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
@@minefricek Shodou okolností jsem letos na jaře měl o této hypotéze přednášku pro Sysifos: kzbin.info/www/bejne/qnnQaICkhdB1n6s . I s Markem už jsme tomuto tématu jedno naše povídání věnovali: kzbin.info/www/bejne/b5qkZnVod9yMqsU Tato dvě videa se v lecčems překrývají, ale snad to nevadí. Zdraví M. Rokyta
@minefricek
@minefricek 5 жыл бұрын
@@mirkorokyta9694 Děkuji
@potapec333
@potapec333 4 жыл бұрын
Ahoj hned z prvu jsem typoval že 1 bude nejvice to ze se postupne zmensuji k 9 jsem uz neodhadl. Mě osobně přijde, že to závisí na jedné jediné věci, z které vyplývají všechny ostatní pravidla, které pro tento princip probíráte. Jde jen o princip sčítání náhodných čísel. Nevím jak bych to v krátkosti vysvětlil a navíc jsem si nenašel čas, abych si to prověřil programem na nějakém větším vzorku dat. Jde jen o princip přetečení do dalšího řádu. 1+1, 1+2 ..... 1+8, 2+1,2+2 ... 2+7 .. 7+2, 8 + 1 do dalšího řádu nepřetečou, avšak všechny ostatní možnosti do nového řádu přetečou což je 44.4% z všech možností sčítání. U dvouciferných čísel to je 49.5%, u trojciferných téměř 50%. tedy konverfuje k 50% pro velká císla. Uvaha je jednoduchá pokud náhodné rozdělení je rovnoměrné a stejne tak je rovnomerné náhodné rozdelení poctu scitani techto nahodne vygenerovanych cisel. Pak by podle mne melo platit, že dostaneme císla, která z vetsi casti budou zacinat jednickou nez ostatními ciframi. Uz kdyz se jen opiram o fakt ze vsech moznych souctu jednocifernych cisel k preteceni na 100 a vic dojde ve vice jak 50% pripadu. Je to nedokoncena uvaha a cely jsem to o vypocty neoprel ani o nejaky statisticky pokus, ale az budu mit cas rad si svou uvahu vyvratim ;-)
@vivitatarak4233
@vivitatarak4233 5 жыл бұрын
Nevím jestli se neptám na hloupost, ale fungoval by Benfordův zákon i kdybych používal jinou soustavu než desítkovou? Pokud bych měl například soubor dat ve dvojkové (binární) soustavě, vyskytovala by se třeba 0 jako první o dost častěji než 1? Jinak děkuji za skvělé video.
@misoslav_
@misoslav_ 5 жыл бұрын
Ve dvojkové je to pro jedničku 100 % a pro nulu 0 %, protože číslo nulou začínat nemůže, ale jinak i pro ostatní soustavy to funguje, například hexadecimální
@vivitatarak4233
@vivitatarak4233 5 жыл бұрын
@@misoslav_ Pravda, jsem to trochu nedomyslel :D Ale děkuji za odpověď.
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
Na konci videa se bavime i o jinych soustavach nez je desitkova. A fungovalo by to stale.
@andrasolivier7185
@andrasolivier7185 5 жыл бұрын
Jiná soustava je pouze přeškálování, takže ano
@rastothesuchsoft6546
@rastothesuchsoft6546 4 жыл бұрын
A zrejme by to nefungovalo pri rímskych číslach. :D
@peterkrammer8968
@peterkrammer8968 5 жыл бұрын
Krasne video. Vela veci mi sice uz bolo znamych a zrejmych, ale dozvedel som sa niekolko detailov, ktore som si doteraz nie uplne uvedomoval, ktore mi dotvorili celok a chapem to teraz komplexnejsie. Na zaklade tohto videa, by sa dalo lahko urobit napr. aj odhady pravdepodobnosti prvych dvojcisli (tusim to niekto spomenul aj v diskusii nizsie), resp. urcovat pravdepodobnosti najvyssieho radu (u rovnakych typov dat ako vo videu), ale v inych ciselnych sustavach. Je to vcelku inspirujuce. OTAZKA: Viete mi poradit, kde by sa dali stiahnut data ohladne dlzok riek resp. poctu obyvatelov miest/obci v CR/SR ?? ( O dáta z bankovych transakcii p. Rokytu samozrejme neziadam ;) ).
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Počty obyvatel českých obcí jsem stáhnul ze stránek Českého statistického úřadu. Délky českých řek: tam jsem našel na wikipedii jen prvních sto českých řek podle délky, ale je pravda, že jsem moc nehledal, byl to první googlovský odkaz.
@RadomilBenes
@RadomilBenes 4 жыл бұрын
Přiznávám bez mučení, že už jsem z vyšší matematiky hooodně zapomněl, ale docela jsem se kupodivu chytal :-) Díky za super video! Napadlo mě - což třeba velký soubor náhodně vygenerovaných čísel počítačem? Fungovalo by to na něm? Vyzkouším...
@rastothesuchsoft6546
@rastothesuchsoft6546 4 жыл бұрын
Myslím si, že to nebude fungovať, rozloženie bude viac menej rovnomerné, podľa počtu náhodne vygenerovaných čísle. Čím viac čísel, tým rovnomernejšie. V princípe ide o to, že súbor dát musí vychádzať z prirodzena. Mal by vzniknúť samovoľne, prirodzene, bez zásahu inteligencie. Toť môj názor. A generátor náhodných čísel, vlastne generátor pseudonáhodných čísel nie je prirodzený.
@eltwarg6388
@eltwarg6388 4 жыл бұрын
Ak ten váš generátor bude mať logaritmické rozdelenie, tak to fungovať bude. Teda bude generovať čosi ako počty obyvateľov, alebo dĺžky riek... ;)
@JardaBar
@JardaBar 4 жыл бұрын
To je první co jsem zkusil a odpověď byla ne :-).
@nyksiss
@nyksiss 5 жыл бұрын
Konečně někdo říká "ta data" a ne "ty data"
@chatnickcz
@chatnickcz 5 жыл бұрын
Táty tadá
@michaldome8414
@michaldome8414 5 жыл бұрын
O tom už pan Rokyta mluvil v Českém rozhlase. Je skvělé to mít mnohem přesněji a podrobněji zde 😂
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
No.. hehe. My jsme to totiz natocili uz asi pred dvema lety. Spolu s temi prvnimi dily. Ale meli jsme tam chybu. Takze to cekalo na predelani :-).
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Mezi námi, příprava osmi dílů o matematice pro Meteor (v mimopracovní době, samozřejmě...) byl i jeden z důvodů, proč bylo docela těžké najít čas na tato videa...
@Krozemc
@Krozemc 4 жыл бұрын
Velice moc zajímavé, bohužel jsem neměl čas celé dokoukat. Říkali jste, že se neví, proč to tak je, že je to jen empiricky vypozorováno. Přesto by mě velmi zajímaly všemožné hypotézy, jestli vůbec jsou. Jestli se tím ve videu zabýváte, hoďte, prosím, odkaz na čas.
@AugustinFary
@AugustinFary 4 жыл бұрын
Pane učiteli můžu jít na záchod?
@vaclavtaus6383
@vaclavtaus6383 5 жыл бұрын
Nejvíc se mi líbilo, že jste dokazali, že i takto, na první pohled, nevyužitelná věc má reálné využití ( odhalení nestandardních transakcí). Měl bych, ale doplňující otázku. Platí tento zákon jen u počátečních číslic nebo i u těch posledních?
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
To je zajimava otazka. Nemam paru, ale zeptam se pana docenta.
@tomaskot9278
@tomaskot9278 5 жыл бұрын
Určitě ne. Už i z toho laického vysvětlení, kterým já tenhle princip aspoň trochu chápu - je tam nějaký vliv těch čísel s více ciframi (bližší maximální hodnotě v daném souboru), protože ty už nemůžou začínat na všechny cifry, pokud teda naprosto náhodou maximální hodnota není 999 999 apod. Pokud máte rozsah 5 až 4 000 000 (třeba nějaký počet obyvatel něčeho), u čísel se sedmi ciframi můžete začínat pouze 1, 2 nebo 3. A čísel v tomto rozsahu (1 000 000 až 3 999 999) bude v souboru dat poměrně hodně (3/4 všech), takže to výslednou statistiku hodně ovlivní. Když se budete dívat na nejnižší cifru (jednotky), bude to určitě zcela náhodné a rovnoměrné rozložení.
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Dobrý den, takto přesně nemůže platit už z toho důvodu, že poslední cifra může mít i hodnotu 0. :) Ale jinak je rozložení posledních cifer opravdu nebenfordovské - dokonce je skutečně takové, jaké bychom čekali, tj. rovnoměrné. Neboli každá z možných cifer se vyskytne zhruba v 10% případů. Škálování souboru dat nezpůsobí "přenos přes desítku", který se odehrává na počátku ciferného zápisu, jen pravidelně promíchává poslední cifry. Tomáš Kot to v tomt ovláknu napsal správně. Co je ale zajímavé je to, že se dá něco více říct o "cifrách zepředu". Ne to, jak se chovají třeba druhé cifry v pořadí, ale to, jak se chovají první dvojice cifer, první trojice cifer v zápisu čísel atd. Je to zase nerovnoměrné (už proto, že následující začátky zápisů čísel: 10..,11..,12.., ....,19.. musí dát dohromady těch cca 30%, které reprezentují to, že "číslo začíná jedničkou".) Možná je to téma na Appendix k tomuto videu. Co na to Marek? :)
@vaclavtaus6383
@vaclavtaus6383 5 жыл бұрын
Pane docente, děkuji za odpověď a rychle vysvětlení. Rozhodně se přimlouvám za video o dvojicích či trojicích cifer.
@mr.schloopka1124
@mr.schloopka1124 5 жыл бұрын
@@mirkorokyta9694 díky za vysvětlení, teď už to chápu
@tomas4999
@tomas4999 5 жыл бұрын
Jak říká sheldon. Každý by si mohl myslet, že nejčastější název ulice je První ulice, ale je to Druhá ulice. Benford nefunguje na názvy ulic :D (vtip) :)
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
Good one :-)
@eltwarg6388
@eltwarg6388 4 жыл бұрын
No, za socíku to bolo hlavne 1. mája a 9. mája
@lukasvozak7698
@lukasvozak7698 4 жыл бұрын
Dost dobrý a zajímavý :) Jen tedy předešlá videa tohoto typu měla podtext srovnání "intuice s paradoxem", docela mi to tady chybělo :-O Mně totiž Benfordův zákon přijde intuitivní, hned první minuta mě k tomu nakopla, přeci když jdeme přes více řádů, je logické, že bude více čísel začínat "předními ciframi", protože skrze ně "musíme přejít" :) Např. když vezmu hodně zjednodušené příklady jako že půjdu po jedné od 1čky do 4389, tak na prvním místě se víceX objeví číslo 1-4, než ty ostatní, na druhém místě 1-3, etc... Když to rozšíříme na náhodné, ale velké a zhruba rovnoměrně rozložené soubory, mělo by to držet, takže "klame intuice", nebo ne? :-O Maybe I am wrong :D :)...
@rastislavserbin9297
@rastislavserbin9297 Жыл бұрын
No ano, pre vedecke typy, ale chceli intuici povedat ze 90% ludi ktori o tom este nepoculi by na tuto otaku povedali, ze vyskyt cifier je uplne rovnaky bez ohladu o aku cifru ide.....cize asi to mal byt odkaz na chybnu intuiciiu
@TheOgi22
@TheOgi22 5 жыл бұрын
05:04 - No to je previazané na meranie daných dát. Ak niečo meriam, stupnica mi začína od 1 a končí pri 9. A ten príklad s počtom obyvateľov je krásny, lebo je vždy väčšia "pravdepodobnosť" že stovky sa napočítajú viac krát ako 500 kedy k 500 mi dané dáta už nemusia dosiahnuť, lebo proste nemám 500 obyvateľov. Môžem mať 545 obyvateľov, ale teda od 546 mi už vypadli čísla začínajúce na 5, teda tých bude menej, pričom pre čísla 1 2 3 4 by mala byť rovnaká pravdepodobnosť. Stavím sa, že ak by sa to skúšalo s náhodne vygenerovanými číslami, tak by tá pravdepodobnosť nefungovala. Toto teda nie je zázrak len chyba interpretácie a pochopenia. 09:10 - Je väčšia pravdepodobnosť, že budeš platiť niečo za 110€ ako za 910€ 10:54 - Je väčšia pravdepodobnosť, že sa v čechách nachádza viac riek dlhých 100 000 km ako riek dlhých 900 000 km. Môj príklad - Je väčšia pravdepodobnosť, že ľudia budú zarábať 100€ ako 900€. Je väčšia pravdepodobnosť, že strom vyrastie 10m dlhý ako 90m dlhý. Je väčšia pravdepodobnosť, že miniem 100l vody za rok ako 900l vody za rok. 18:09 - To označenie "t" so šípkou von z osi je asi chyba, nakoľko je os uzatvorená a nemá pokračovať za 10. A označovanie f(t) je dosť mätúce, nakoľko "t" sa používa hlavne pre čas. 39:15 - to prehodenie (k*a) na druhú stranu ste mohli znázorniť šípkou. 46:33 - ak niečo vysvetľujete a sú to takéto hardcore veci, prosím nerobte dva kroky naraz.
@albertmlcoch3570
@albertmlcoch3570 5 жыл бұрын
"09:10 - Je väčšia pravdepodobnosť, že budeš platiť niečo za 110€ ako za 910€" a co ceny 90€ až 100€? Bylo několikrát řečeno, že interval hodnot musí jít přes několik řádů, aby toto rozdělení platilo.
@TheOgi22
@TheOgi22 5 жыл бұрын
@@albertmlcoch3570 To áno, ale vždy hodnoty toho posledného rádu spôsobia tú percentuálnu rozdielnosť. Teda ak mám najvyšší rád 10^(20), tak tam sa použije tá logika, ktorú som sa snažil popísať. Napríklad je väčšia pravdepodobnosť, že jestvuje na zemeguli viac ciest dlhých 2,25415458 * 10^(20), než ciest dlhých 5,42879642 * 10^(20) a ešte menej je ciest dlhých 9,62158794 * 10^(20).
@albertmlcoch3570
@albertmlcoch3570 4 жыл бұрын
@@TheOgi22 jak by ji mohli způsobit, když je to rozdělení tím přesnější, přes čím víc je to řádů? U toho vašeho řešení by to platilo přesně naopak: čím více hodnot jen v posledním řádu, tím víc to platí, což není pravda.
@TheOgi22
@TheOgi22 4 жыл бұрын
​@@albertmlcoch3570 Moje riešenie nič také ako píšete nehovorí. Moje riešenie je presne o tom, že čím vyšší rád, tým menšia pravdepodobnosť a teda menšie zastúpenie.
@mysteri5850
@mysteri5850 4 жыл бұрын
Bude znovu předpříjímačková série? Jestli ano, kdy?
@levyhak6943
@levyhak6943 5 жыл бұрын
Plati to i u sportky ?
@petermikula3349
@petermikula3349 5 жыл бұрын
Syn rozdelil 80 čísel na intervaly po 10 a zistil, že medzi nimi nie je väčší rozdiel ako 16.
@petrpanenka8488
@petrpanenka8488 4 жыл бұрын
Nevím ale není to náhodou tím že 1) používáme desítkovou soustavu a 2) plusová data?? Jak by to dopadlo kdybychom měli data něčeho co" roste" do záporu?!?! Nebyla by 9 nejčetnější??? :o)
@Rubenqo
@Rubenqo 4 жыл бұрын
Máte pravdu, myslím si presne to isté. Pokiaľ teda nejde o náhodné cifry tak je pre nejakú hodnotu jednoduchšie keď dosiahne počet (iba príklad - možno obyvatelia malej dedinky) 100-199. Aby sa hodnota dostala až k číslu 900-999 musí prekonať celý rad 100-899,. Preto je pravdepodobnosť, že sa počet zastaví na číslé, ktoré začína 9 iba pár percent.
@wardoom123
@wardoom123 4 жыл бұрын
@@Rubenqo Bohužel tak jednoduché to není. Jestli jste dávali dostatečný pozor, tak to sedí například i na délku řek nebo počty obyvatel. Délky řek nemají problém s překonáváním desítkové soustavy. Mohlo by zde klidně být nejvíce řek dlouhých 9km,90km atd. u počtu obyvatel jsou to dokonce vždy celá čísla.
@pitomec1000
@pitomec1000 4 жыл бұрын
Ahoj Marku natočíš nějaká další videa?
@MartinTengler
@MartinTengler 4 жыл бұрын
Výborné video. Je možné, že by Benford fungoval jinak v jiné soustavě, třeba osmičkové nebo binární? A že by byla soustava, ve které je rozložení rovnoměrné? (Moje intuice říká, že by to mohla být binární soustava) :)
@eltwarg6388
@eltwarg6388 4 жыл бұрын
Benford nemôže fungovať v binárnej sústave, lebo tam sú len dve cifry a 0 nie je na začiatku, takže je len jedna 1ka a na tú padá 100%. Ale aj v binárnej sústave sa to dá previesť na prvé dve cifry: Viac hodnôt bude začínať na 10, menej na 11, prípadne najviac na 100, menej na 101... najmenej na 111 (pre tri cifry). Pointa je v tom, že tento číselný systém nám dáta distribuuje lineárne, ale tie dáta sú rozložené viac či menej logaritmicky... takže najviac je ich na "začiatku" a najmenej na "konci".
@MartinTengler
@MartinTengler 4 жыл бұрын
@@eltwarg6388 díky za odpověď, to dává smysl.
@povijarrro
@povijarrro 4 жыл бұрын
Dobrý deň je známa nejaká charakterizácia prirodzenočíselných postupností pre ktoré platí lim_k(#{m;a_m začína cifrou n; m
@vrbic207
@vrbic207 4 жыл бұрын
Dotaz: Lze najít i jinou funkci splňuje danou podmínku škálovatelnosti? Vím nebude to už Brendford, ale jde mi o to splnění té podmínky. Díky za názory.
@danielbriza1279
@danielbriza1279 4 жыл бұрын
Ne
@danpokorny449
@danpokorny449 4 жыл бұрын
Ahoj, mohl by jsi prosím udělat video na přípravu na přijímacky? Myslím že dost lidí by to zaujalo
@michaeloakley7486
@michaeloakley7486 4 жыл бұрын
Prijimacky udela i dement pokud nemá na základce 5ky 😂
4 жыл бұрын
Pánové, vrátili jste mi na chvilku mládí (T - 30) let (mffuk) Díky. Elegantní.
@mispanludensprinck5652
@mispanludensprinck5652 5 жыл бұрын
Kámoš přišel nedávno také s pěkným neintuitivním příkladem "Spider and fly problem". (Zkoušel jsem najít nějaké obecné řešení, kvádr se dá aproximovat jako (x/a)^n+(y/b)^n+(z/c)^n=1 pro n velké sudé, ale rovnice geodetiky se mi nepodařilo vyřešit ani numericky. 😀 Ale je to zajímavý.)
@mispanludensprinck5652
@mispanludensprinck5652 4 жыл бұрын
@pemailv Jj, kvádr ve sférických souřadnicích je možné zhruba parametrizovat takto: (a*cos(u) sin(v), b*sin(u) sin(v), c*cos(v))/((cos(u) sin(v))^n + (sin(u) sin(v))^n + (cos(v))^n)^(1/n), pro n velká sudá.
@berske1226
@berske1226 4 жыл бұрын
Ahoj, uz dlouho mi vrta hlavou jakou vejsku jsi studoval pripadne jaky obor, jestli se muzu optat? Muj tip je matfyz, ale nejsem si tim jisty :D Protoze Tve znalosti matematiky jsou uctyhodne a P.S. take Ti timto moc dekuji za vsechna ta krasna naucna videa, diky kterym jsem letos v pololeti dostal jednicku z matiky! :D
@MrEasters
@MrEasters 4 жыл бұрын
Ahoj, mohl bys udělat video na Grahamovo či Rayovo číslo? :)
@KOPEBR007
@KOPEBR007 4 жыл бұрын
Výborné video! Náhodou som to našiel a zo zvedavosti som začal pozerať. Spomenul som si na maturitu, lebo som si vytiahol práve integrály a derivácie. Ohromne ma to potešilo, lebo JEDNOTKA bola zaručená. Budem vás sledovať ďalej!
@oldrichmarek419
@oldrichmarek419 5 жыл бұрын
A co kdyby jsme ty cisla vymocnili? Fungoval by ten benford stale?
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
Dobra otazka. Vime ze druhe mocniny prirozenych cisel Benforduv zakon splnuji. Talze bych si tipl, ze to bude i tady, ale chtelo by to proverit.
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Tohle je opravdu zajímavá otázka. Projel jsem si to na experimentu a odpověď je, že u mocnin vetších než jedna je to nejspíše pravda. Druhé, třetí, čtvrté, jeden a půlté mocniny dat o počtu obyvatel v ČR splňují Benfordovské rozložení, a to poměrně přesně. To bych taky tipnul, se stejným odůvodněním jaké píše Marek. U odmocnin jsem zaváhal a schválně zatím nedělal experiment, než si tipnu výsledek. Tipnul jsem si, že spiš ne. A opravdu, třeba pro pátou odmocninu vyjde jako nejčastější první cifra čtyřka a pro jiné odmocniny je to jinak. Ale pokaždé zcela nebenfordovsky. Díky za velice podnětný dotaz, M.R.
@oldrichmarek419
@oldrichmarek419 5 жыл бұрын
@@mirkorokyta9694 není za co! :-)
@romanhanajik3185
@romanhanajik3185 5 жыл бұрын
Je to jednoduché: Ak sú zdrojové data ohraničené zhora, tak to neplatí. Ak začinajú nulou a sú zhora neohraničené, tak to platí. Napíšte prácu "Podmienky platnosti Benfordovho zákonu" a dopíšte ma na prvé miesto. Dík za spoluprácu kolegovia. 😇
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
To je hodně odvážné tvrzení. Asi chápu, proč takový článek nechcete sepsat sám. :)
@romanhanajik3185
@romanhanajik3185 5 жыл бұрын
@@mirkorokyta9694 nepovedal som, ze nechcem. Ja som este ani toto video nestihol dokonca dopozerat, tak neviem, ci nemate kontra argument tam dalej, pripadne v dalsom videu. Uz som tuto teoriu zahlasil pred par rokmi vo vlaku cestou do prace pri rozhovore s vyucujucou na VS, ktoru to zaujimalo a vsetky vymenovane serie dat co mala tomu sedeli. Tiez sa jej to zdalo odvazne. 😆 Tak predpokladam, ze ako sa poznam, za par rokov zas niekde splechnem svoju teoriu a mozno sa najde niekto, kto mi ukaze radu, co to popiera. Tych popierajucich je mozno vela, ale mozno nie. Ja mam teraz inu "zabavu", ale mozno (0,5%) sa na to dam, ked tiez podpichujete. 🤗 Ale mate argument proti?
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
@@romanhanajik3185 Pardon, já jsem nechtěl podpichovat, já myslel, že to říkáte jako vtip a tak jsem taky odpověděl "vtipně". :) Takže se omlouvám za nepochopení. Ale pokdu jste to myslel vážně, tak zde je vážná odpověď a není těžká: jakýkoli konečný soubor dat je omezený, a sice svojí největší hodnotou. A přitom pro některé tyto soubory omezených dat Benfordův zákon platí (nepříklad počty obyvatel českých měst) a pro některé ne (například všechna čísla o 90001 do 99999). Pokud byste chtěl příklad na nekonečných souborech dat, tak ten lze vyrobit takto: s oběma zmíněnými soubory provedeme následující úpravu: každý z nich násobme 10, 100, 1000, 10000, .... a postupně je přidávejme k původnímu souboru. Takže například první soubor bude sestávat z počtů obyvatel všech českých měst ke kterým přídáme všechny jejich desetinásobky, stonásobky atd. - vznikne nekonečný soubor neomezených dat, který bude splňovat Bernfordovo rozdělení, protože první cifry se přenásobením 10, 100, atd. nezmění. A podobně když uděláme stejnou operaci se seznamem čísel od 90001 do 99999. Vznikne nekonečný soubor neomezených dat, která nesplňují Benforda, protože všechna začínají cifrou 9. Takže tu máte všechny 4 případy: omezená data, co splňují Benforda, omezená, co nesplňují Benforda, neomezená, co splňují a neomezená, co nesplňují. Mezi omezeností dat a platností Benforda není žádná souvislost.
@romanhanajik3185
@romanhanajik3185 5 жыл бұрын
@@mirkorokyta9694, tak ja som to podpichnutie nebral zle, iba mi bolo jasne, teda predpokladal som, ze predpokladate, že to nemyslim Vážne a preto som sa rozpísal. Nie preto, že by som sa urazil. No a teraz si budem musieť najsť novú definíciu! Pretože som presvedčený, že existuje. Rada čísel napr. 1000-9999 vynasobena 10-10 000 nebude vyhovovat, lebo nevznikla nahodne, ale su vytrhnute z nahodneho rozdelenia. Vznikli "umelo", aj ked nahodne. Takze minimalne obmedzujem tvrdenie na cely rozsah dat vzniknuty nahodne/prirodzene. Je niekde daka stranka, kde su rozne subory dat platne a neplatne tomuto rozdeleniu?
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
@@romanhanajik3185 Na anglické wikipedii pod heslem Benford's law jsou nějaké příklady. Ale ono je to opravdu dost složité a myslím, že není žádná jednoduchá charakterizace. Třeba se ví, že náhodně generovaná čísla Benforda nesplňují, tam je rozdělení počátečních cifer rovnoměrné. Ale když se dělají součiny dvou náhodně generovaných čísel, tak už to k Benfordovi konverguje. Každopádně je dobře, že vás to zaujalo. Zdraví M. R.
@marekpomp664
@marekpomp664 4 жыл бұрын
Drobný problém. Vyzkoušel jsem, jestli opravdu platí B.Z. pro délky českých řek. Vzal jsem seznam 114 českých řek z Wikipedie a jejich celkovou délku. Výsledné relativní četnosti jsou po zaokrouhlení a převedení na procenta: 1 2 3 4 5 6 7 8 9 14 4 21 20 17 9 2 7 6 Což je od B.Z dost daleko. Samozřejmě na Wiki jsou jen řeky delší 35km takže pokud vezmeme i potoky, narostou četnosti vodních toků jejichž délka začíná číslicí 1, 2 a 3. Asi je tady problém v terminologii, nemělo by se říkat "řeky" ale "vodní toky" a vzít delší seznam než Wikipedii. Lépe na tom je rozloha povodí těchto řek, s procentuálním zastoupením prvních číslic: 1 2 3 4 5 6 7 8 9 26 17 18 7 10 6 7 6 4 Což už dokonce projde chisq-testem :-)
@eltwarg6388
@eltwarg6388 4 жыл бұрын
No, ale ak by sa brali až potoky nad 5km, tak najviac bude zasa tokov začínajúcich na 5-ku ;)
@sidlake5954
@sidlake5954 4 жыл бұрын
Slovo JASNĚ tentokrát padlo 247x! Výhercem se stává Otakar Rambousek z Poděbrad, gratulejeme a poslíme pohled z Chrudimi.
@golem664
@golem664 4 жыл бұрын
Mužů se zeptat??? Právě jsem na střední škole v prváku a bereme extrémní kvadratické rovnice. Nikdy jsem nebyl na matematiku exprert a v deváté třídě na základní škole jsem dostal na vysvědčení díky vám 3 a hrozila mi 5. Dále jsem díky vám udělal prijimacky z matematiky. Matematika nikdy nebyla moje silná stránka a vím, že nikdy asi nebude. Je možnost nějaké doucovani od vás. Já bydlím v Praze. Takže jestli ano prosím odpovezte... 🙃🙃🙃
@marekvalasek7251
@marekvalasek7251 4 жыл бұрын
Ahoj. Jasne. Jdi na moje stranky. Mathematicator.com. tam je vse o doucku. Napis mi mail.
@golem664
@golem664 4 жыл бұрын
Aha. Děkuji já jsem váš objevil relativně nedávno takže se tu moc ještě neviznám 🙃🙃🙃
@Aquarius-CZ
@Aquarius-CZ 4 жыл бұрын
Tito pánové mají určitě velmi dobrý intelekt a rozumí číslům. Ale očividně netuší, co je to intuice.
@pbpitko185
@pbpitko185 4 жыл бұрын
Platí benfordov zákov aj pre čísla vo všetkých číelných sústavách, nie len v dekadickej sústave, so základfom 10, ale aj napr. v hexadecimálnej sústave so základom 16, či trebats aj s s divokým základon trebars napr. 7 , 13, 33 a pod. ? Asi bz to malo platiť aj keď to vizerá divoko. Malo by to platiť aj pre dvojkovú sústavu.
@martinstejskal1066
@martinstejskal1066 4 жыл бұрын
Samozřejmě tam platí, ale musí se trochu upravit. V desítkové soustavě rozdělujeme čísla do devíti skupin. Ve videu bylo řečeno, že v pětkové soustavě je rozdělujeme do čtyř skupin. Přesto součet hustoty pravděpodobnosti (v tomto případě čtyř čísel) musí být roven jedné. No a ve dvojkové soustavě máme jednu skupinu - ejhle, všechna čísla začínají jedničkou a to se stoprocentní pravděpodobností!
@rastothesuchsoft6546
@rastothesuchsoft6546 4 жыл бұрын
@@martinstejskal1066 Tak z toho sa dá vyvodiť jeden záver, v dvojkovej sústave platí Benfordov zákon (BZ) bez obmedzenia, teda pokiaľ súbor obsahuje aspoň jednu nenulovú hodnotu. ;) Ale to mi vnuklo myšlienku, že ak pre daný súbor dát neplatí BZ, čo ak by sme súbor previedli do trojkovej číslenej sústavy. Logicky, súbor dát by presahoval cez viac rádov, z čoho vyplýva, že súbor dát by mohol začať spĺňať podmienky BZ. Čo je ale nevýhodou, výpovedná hodnota by bola nižšia, keďže by tam bolo menej skupín. Samozrejme naopak, ak máme súbor dát, povedzme aj cez 10 rádov, a spĺňa podmienky BZ, mohli by sme ho dať povedzme do 40-kovej číselnej sústavy a overiť, či spĺňa podmienky BZ, a výpovedná hodnota by bola vyššia. ;) V každom prípade by bolo zaujímavé toto otestovať. ;)
@izakfunker
@izakfunker 4 жыл бұрын
@@rastothesuchsoft6546 pro zajímavost: výskyt číslice 1 v Benfordovi v dvojkové soustavě 100% trojkové 63%, čtyřkové 50%, pětkové 43%, šestkové 39%, sedmičkové 36%, osmičkové 33,33% devítkové 32%, desítkové 30,1% stovkové 15%, tisícové 10%, desetitisícové 7%
@eltwarg6388
@eltwarg6388 4 жыл бұрын
@@izakfunker Prečo nenapíšeš rovno, že to je: logN(2), kde N je báza sústavy? ;)
@hmmh-qq
@hmmh-qq 5 жыл бұрын
Dá sa to využiť na kontrolu korektnosti generátora pseudonáhodných čísel? Ak vygenerujem obrovský počet čísel a preženiem ich štatistikou, ktorej výsledok sa nebude rovnať s Benfordovým zákonom, tak generátor je chybný?
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Mysím, že ne. Náhodný soubor dat nemusí Benforda splňovat. Benforda splňují jen jisté specifické soubory dat.
@hmmh-qq
@hmmh-qq 5 жыл бұрын
@@mirkorokyta9694 - Ja to skúsim a potom napíšem, ako dopadol výsledok. Podstatný rozdiel je medzi skutočným generátorom napríklad vytvorený fyzikálne technicky a pseudo-generátorom, ktorý funguje len matematicky, čiže dosahovaním nejakej nekonečnej iracionálnej rady čísel, ak ovšem je korektný, inak vznikne nejaká perióda i keď nemusí byť hneď zrejmá.
@AP57532
@AP57532 5 жыл бұрын
@@hmmh-qq : rozložení pseudonáhodného generátoru (jako je funkce random() v různých programovacích jazycích) bývá rovnoměrné (to je vlastnost třeba lineárních kongruenčních generátorů). Běžně se nějakou následnou operací transformuje na nějaké jiné, třeba normální nebo jakékoliv chcete, včetně Benfordova. Takže ověřit správnost té transformace na Benfordovo rozložení by mělo smysl, ale spíš jen pro ujištění, že tam nemáte nějakou programátorskou chybu. Samotný generátor (ten s rovnoměrným rozložením) se ověřuje spoustou testů, je kolem toho celá věda a překvapivě spousta důmyslně vyhlížejících generátorů nevyhoví. Najděte si na netu, je to zajímavé počtení.
@eltwarg6388
@eltwarg6388 4 жыл бұрын
Ak chceš generátor s logaritmickou distribúciou hodnôt (taký, čo generuje niečo ako počty obyvateľov miest), tak potom je to dobrý test... Ale to vlastne testuješ logaritmickosť tej distribúcie.
@frejk2
@frejk2 5 жыл бұрын
Moje teorie Benfordova zákona je taková, že tam, kde tento zákon platí, platí i to, že čím nižší hodnoty, tím jich je více (což je teoreticky i definice tohoto zákona, že ....), ale pokud to vezmeme selským rozumem. Jaké částky se pohybují na našich účtech nejčastěji? Vždy nižší než ty vyšší. Čímž je jasné, že nejvíce jich začne jedničkou. Pokud ale třeba platí a lze dohledat nějakou statistiku, že u každého telefonního čísla budeme sledovat POSLEDNÍ číslo, pak jsem v háji. Pokud ale bude pravděpodobnost prostě jen 1/10, pak moje myšlenka se zakládá na pravdě a lze jí definovat takto: pravděpodobnost výskytu je dána určitým logickým stropem, že čím více toho, tím méně pravděpoboné. Například řeky jsou většinou pravděpodobněji kratší než delší, atd. Vždy tam vstupuje jen ten jeden faktor, který za to může, kde je pomyslný strop a že největší skupina hodnot je právě zpočátku. Na grafu by se dalo zakreslit parabolou či podobnou kuželosečkou. Bude to platit u počtu hvězd v hvězdokupách či počtu planet v galaxiích ... jde o to, že vždy ta pravděpodobnost nižších čísel je vyšší než vyšších, právě díky jakémusi stropu. Je prostě dán nějaký rozsah, ve kterém je největší hustota nejmenších hodnot. Jednoduché jak facka.
@rastothesuchsoft6546
@rastothesuchsoft6546 4 жыл бұрын
To si nepochopil, o to tu vôbec nejde, veď základná podmienka je, aby súbor hodnôt obsahoval čísla z niekoľkých rádov. To, čo tvrdíš, síce môže nastať, ale s najväčšou pravdepodobnosťou by ti zvýšilo počet čísel začínajúcich jedničkou tak, že pravdepdobnosť by bola nad hodnotu 30.1.
@eltwarg6388
@eltwarg6388 4 жыл бұрын
... a navyše: 90 je menej ako 100, takže viac hodnôt by malo začínať 9-kou, či? ;)
@lubos8319
@lubos8319 Жыл бұрын
Tohle ale jistě nebude splňovat hodnota bankovních transakcí :)
@TheOgi22
@TheOgi22 5 жыл бұрын
09:10 - Je väčšia pravdepodobnosť, že budeš platiť niečo za 110€ ako za 910€ 10:54 - Je väčšia pravdepodobnosť, že sa v čechách nachádza viac riek dlhých 100 000 km ako riek dlhých 900 000 km. Môj príklad - Je väčšia pravdepodobnosť, že ľudia budú zarábať 100€ ako 900€. Je väčšia pravdepodobnosť, že strom vyrastie 10m dlhý ako 90m dlhý. Je väčšia pravdepodobnosť, že miniem 100l vody za rok ako 900l vody za rok.
@MarekV82
@MarekV82 5 жыл бұрын
stále ráteš s rovnakým počtom rádov...ale na tom nezáleží. Skúsme Položiť otázku takto: Je väčšia pravdepodobnosť, že ľudia budú zarábať 1000€ ako 900€.? Je väčšia pravdepodobnosť, že strom vyrastie 10m dlhý ako 9m dlhý.? Je väčšia pravdepodobnosť, že miniem 10 000l vody za rok ako 900l vody za rok?
@TheOgi22
@TheOgi22 5 жыл бұрын
@@MarekV82 Lenže vždy pracuješ s ohraničením z hora aj z dola. Teda pri tom poslednom ráde sa ti nazbiera tá pravdepodobnosť. Teda dané otázky znie sú správne položené, lebo v nich skáčeš do ďalšieho rádu a dokonca aj o niekoľko rádov.
@tomasmakal5758
@tomasmakal5758 4 жыл бұрын
@@TheOgi22 ale přesně tato podmínka (pracovat s více řády alespoň přes 4 nebo 5 jak bylo doporučováno) je jednou z podmínek fungování tohoto pravidla.
@TheOgi22
@TheOgi22 4 жыл бұрын
@@tomasmakal5758 A hovorím ja niečo iné? Ja hovorím len to, že celí výsledok ovplyvňuje posledný rád. Toť celé. Či budeš mať po x*10^(10) alebo x*10^(1000000000000000)
@tomasmakal5758
@tomasmakal5758 4 жыл бұрын
@@TheOgi22 to odůvodnění ve vašem první příspěvku je mylné. Právě z toho důvodu, že se ve všech uvedených příkladech omezujete na příliš úzký rozptyl hodnot. Délky řek jsou od jednotek po tisíce a nehledíme na tom kolik je krátkých a kolik dlouhých řek. Plat může být opět od jednotek po statisíce a na Benfordův zákon nemá vliv kolik je lidí se stotisícovým platem s kolik s almužnou. Podstata Benforda leží někde jinde než uvádí váš zakládající příspěvek.
@warfery
@warfery 4 жыл бұрын
Tak mi to nedalo a udělal jsem si v pythonu testovací skript: Náhodně generovaná čísla od 1-999999, 10 milionů opakování. A výsledek? Max. četnost jednoho čísla 11.126% , min. četnost 11.102%, optimálně by mělo být 11,111% (100/9) a to ten genrátor zcela jsitě není optimální. Mám pocit, že Benfordův zákon má co dočinění s gaussovým rozložením vzorků ("maximum" musí být dostatečně široké a musí probíhat přes dostatečný počet řádů (alespoň 2-3?)). Když vezmu např. ty města, tak je hodně "měst" s počtem stovek a tisíců obyvatel, méně desetisícu a ještě méně stotisícových. Čím větší číslo tím menší počet vzorků. Stejně tak při těch platbách, menších plateb bude určitě více než plateb v řádech desetitisíců a statisíců.
@josefdubisar5115
@josefdubisar5115 4 жыл бұрын
Já nevidím důvod, proč by bylo víc měst třeba 1000 než 500 obyvatel. A pak ještě to dělení 2,5 apod. Je v tom něco víc.
@adamfiser7645
@adamfiser7645 3 жыл бұрын
S takto generovanými čísly to nemůže fungovat. Benfordův zákon předpokládá, že každý řád v souboru čísel musí být zastoupen se stejnou pravděpodobností.
@warfery
@warfery 3 жыл бұрын
@@adamfiser7645 To si nemyslím. Pokud by to bylo zcela náhodně, tak si moc nepomůžete. Vysledek bude stejný. Tam zcela jistě hraje roli klesající četnost vzorků s rostoucí hodnotou.
@libusatomkova7907
@libusatomkova7907 2 жыл бұрын
Aj matematika chuti a prináša radost z objavovani.Zaujimave.
@danielbriza1279
@danielbriza1279 4 жыл бұрын
Z pozice laika: Možná to není intuitivní, ale přijde mi tento příklad jdoucí proti intuici jako logický. Není to prvně, co jsem vypozoroval a přemýšlel nad tímto nerovnoměrným rozložením, jen jsem netušil, že už je pro to název "Benfordův zákon". A vysvětlení tohoto jevu podle videa vypadá celkem prostě... Benfordovké rozložení se tedy podle videa vztahuje na soubory dat přirozeného původu. Vezměme si například délky řek, ty prostě mají nějakou délku podle okolností v přírodě, tuto délku se rozhodneme nějak kvantifikovat, a to za pomoci nějak jednotkové míry, vyjde číslo. Zvolíme-li jinou jednotku, vyjde jiné číslo (ale stále půjde o snahu délku řeky kvantifikovat, pouze se hodnoty přeškálují). Jde tedy o pojem "číslo". Číslo jako kvantifikátor jevů v přírodě, přírodou prorostlý - a my jím hodnotíme soubory dat přirozeného původu. Pokud platí, že aby bylo rozložení benfordovské, musí fungovat možnost přeškálování, platí to i naopak. Vyplývá to z definice a grafu funkce na tabuli. A pokud má benfordovské rozdělení platit ve všech řádech současně, tak to bez benfordovského rozdělení nevyjde, aby to šlo donekonečna přeškálovávat. Podle mého názoru to musí být už součástí definice toho, že číslo v dané číselné soustavě lze zapsat ve více možných řádech. Pokud jde o prvočísla, je pro mě zajímavé, že jsou také rozložena tak, že splňují benfordovské rozdělení (je možnost je donekonečna přeškálovávat). Rozložení obyvatel do sídlišť a aglomerací asi funguje podle nějakých přírodních zákonů podobně, jako včely instinktivně vytváří úly tak, aby na tvorbu stěn spotřebovaly co nejméně materiálu (za pomoci šestiúhelníků). Náhodné a přitom přirozeně se tvořící bankovní transakce splňují taky nějaký ten přírodní zákon. Pokud si vezmeme soubor dat nepřirozeného (umělého) původu (toť pak otázka definice, o co se jedná), mohlo by jít skutečně o ty smyšlené bankovní transakce, protože: - přirozeně se tvořící transakce budou (v rámci možností a splnění náležitostí pro dostatečný soubor dat) začínat nejčastěji jedničkou (a končit devítkou díky Baťovi :D); - uměle je bude člověk tvořit nejspíš intuitivně, tj. tak, aby částky začínaly každou číslovkou zhruba stejně často, aby to vypadalo pseudo-věrohodně a nenápadně, případně vytvoří nějaké odchylky od rovnoměrnosti, aby ta snaha o nenápadnost nebyla tak okatá; - počítač částky bude tvořit uměle pomocí tzv. pseudo-náhody, takže od něj nelze čekat benfordovské rozdělení. Z toho mi vyplývá otázka: Znamená to, že když člověk znalý Benfordova zákona bude hypoteticky tvořit falešné bankovní transakce podle benfordovského rozdělení, nebudou jeho transakce formálně odhaleny jako falešné? Jedná se pouze o teoretickou otázku, věřím, že analytikové mají k dispozici více nástrojů k odhalování podobných podvodů.
@danielbriza1279
@danielbriza1279 4 жыл бұрын
@pemailv Jasně, ale na to jsem se ani neptal. ;)
@danielbriza1279
@danielbriza1279 4 жыл бұрын
@pemailv Díky za odpověď... Obsah otázky vám uniká, pokud tvrdíte, že jste na ni odpověděl (její jádro je na konci věty, ne na začátku ve vedlejší větě). A vím, na co jsem se chtěl zeptat, díky za starost. Ale odpověď na ni asi ani znát nepotřebuju, byla to jen teoretická otázka (proto jsem psal "hypoteticky"). A samozřejmě na účetnictví (což je taky soubor dat) jsem se ptal, to jste trefil a ostatně o bankovních transakcích byla řeč ve videu, jestliže si to vybavuju správně. Ale v bankovnictví se zřejmě nevyznám tak dobře jako vy, nebudu si přece dělat patent na rozum.
@danielbriza1279
@danielbriza1279 4 жыл бұрын
@pemailv To asi nechytal, pořadí písmen místo číslic závisí na dalších okolnostech, i když je tím dáno konkrétní číslo. Byl by nutný přepis nehledě na číselnou soustavu a možná by Benfordův zákon ani nikdy nebyl objeven.
@Nirman222
@Nirman222 3 жыл бұрын
Tabulka sumy vyskytu podle pocatecni cifry zrovna Benforduv zakon nesplnuje :P Cas 6:42, druhy sloupec tabulky.
@michalhodovsky8896
@michalhodovsky8896 5 жыл бұрын
Ohledně platnosti Benfordova zákona na počet obyvatel města mě hned napadlo, jestli to platí i pro Fibonacciho posloupnost. Ke konci vidaa je zmíněno, že ano. A jelokož lidé se množí jako králíci :-), pak je zřejmé, že počet obyvatl měst bude odpovídat nějaké hodnotě Fibonaccigo poslounosti.
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
No, to nevím... :) Pokud v počtech obyvatel českých měst spatříte nějakou FIbonacciho posloupnost, dejte mi vědět. :)
@branislavkabat9140
@branislavkabat9140 5 жыл бұрын
Je to vlastne veľmi jednoduché, funguje tu jednoduché drobenie. Okolo nás je najviac menších veci a najmenej tých veľkých. Rovnako tak je teda najviac 3,1 a najmenej 3.9. Preto ze medzi 3. A 4. Je znovu 1 až 9 teda malé 1 až veľké 9. Tak je to aj v kope štrku malých jednotiek je viac ako dvojok a tých je viac ako trojok a nakoniec je tam len jeden veľký kameň čiže deviatka. Je to tak?
@pan_nekdo
@pan_nekdo 5 жыл бұрын
Nevím, jestli se to na mečem takovémto nezakládá, ale jistě to bude složitější, protože zde to závisí na 1. platné cifře nezávisle na velikosti.
@branislavkabat9140
@branislavkabat9140 5 жыл бұрын
@@pan_nekdo musím namietať, pretože táto cifra vždy reprezentuje veľkosť. Aj počet opakujúcich sa jednotiek hoci ničoho, je vlastne veľkosť.
@pan_nekdo
@pan_nekdo 5 жыл бұрын
Video jsem nedokoukal, ale myslím si, že to bude souviset s tím, že v slušném souboru dat vychází medián menší než (aritmetický) průměr.
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Dobrý den, ne takto jednoduché to bohužel není. Pojmy jako "větší věci a menší věci" by závisely na tom, jaké používáte jednotky míry. Co je "malou věci" v metrech (třeba jeden metr) může být "velkou věcí", když to měříme ve stopách nebo v palcích. Vaše úvaha by nevysvětlovala proč teda třeba délky řek splňují Benfordovo rozložení, ať je měříme v metrech, stopách, mílích nebo v čem chcete.
@branislavkabat9140
@branislavkabat9140 5 жыл бұрын
Ja to vidím takto: do jedného mora/9 sa vlievaju veľké rieky/8 tie plnia menšie /7... Nikdy nebude 9 morí a iba jedna mala rieka. A môžeme to merať v čom len chceme. Vzdi je menšieho viac ako veľkého. Mikrosvet aj makro svet. Samozrejme cením si to, ako je to zapísané vo vzorci. Ani milionárov nebude viac ako chudobných.
@MUDRO30
@MUDRO30 5 жыл бұрын
Skúsil som frekvencie tónov zo 6 oktáv (Hz), čo nieje úplne ideálny príklad, lebo šlo o rozsah (55-3520Hz) ničmenej výsledok je zaujímavý! Je benfordovský pre prvé 3 čísla a pre 4 až 9 je viacmenej rovnomerný, 72 tónov : 1- 24 /33,3% 2- 14 /18,0% 3- 8 /11,1% 4- 4 / 5,5% 5- 5 / 6,9% 6- 6 / 8,3% 7- 4 / 5,5% 8- 4 / 5,5% 9- 4 / 5,5% Zaujala ma však databáza čo použil pán docent - počet obyvatelov a myslím, že by bolo zaujímavé zistiť, či by sa táto databáza chovala benfordovsky aj v inej sústave napr. v osmičkovej. :)
@romanhanajik3185
@romanhanajik3185 5 жыл бұрын
stranky statistickeho uradu a wikipedia...
@MUDRO30
@MUDRO30 5 жыл бұрын
@@romanhanajik3185 Prečo ja? Aj ty čosi sprav... a wikipediu nepotrebuješ...
@romanhanajik3185
@romanhanajik3185 5 жыл бұрын
@@MUDRO30 ja len, že taká db je hocikde.
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Ano, použil jsem data, která jsem si stáhl ze stránek Českého statistického úřadu. Benford by měl fungovat v libovolné číselné soustavě, pokud už funguje v nějaké jiné, na závěr našeho videa o tom mluvíme. Ale například v osmičkové soustavě budou trochu jiné procentové hodnoty, budou se odvíjet od logaritmu se základem 8. Zdraví M. R.
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Můžete mi ten experiment s frekvencemi tónů popsat podrobněji? Děkuji, M. R.
@KillerRW
@KillerRW 5 жыл бұрын
Bylo by velice zajímavé vyzkoušet ještě tuto analýzu nad různými číselnými soustavami a možná by to i vedlo k vysvětlení proč to tak vůbec je.
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Dobrý den, trochu se o tom ve videu zmiňujeme, i když jen krátce a v závěru výpočtu: ano, Benford platí i pro jiné číselné soustavy. Ale protože jde o zcela stejný výpočet (jen s jinými integračními mezemi), tak to žádnou novou informaci o charakteru benfordovskách dat bohužel nepřínáší.
@petrsedlak9082
@petrsedlak9082 4 жыл бұрын
To by bylo zajímavé ve dvojkové soustavě, haha.
@rastothesuchsoft6546
@rastothesuchsoft6546 4 жыл бұрын
Mám otázku, alebo hádanku: Čo vyjadruje vzorec 2^(n-k) * (n k) ??? Neviem ako to zapísať tu, (n k) sú myslené kombinácie k-tej triedy z n prvkov bez opakovania. Teda sa to dá zapísať aj takto: 2^(n-k) * (n! / (n-k)! * k!) Pred pár rokmi som sa čosi snažil čosi vyjadriť vzorcom, a vyšlo toto. :-) A bol som veľmi prekvapený, že tak pomerne zložitú vec, je možné vyjadriť takto pomerne jednoduchým vzorčekom. :D (To, že je to zložité je len môj subjektívny názor, keďže som sa s tým pár hodín potrápil.)
@ValsorajKeceloh
@ValsorajKeceloh 4 жыл бұрын
S počtem obyvatel se na to můžeme dívat tak, že nepočítáme lidi v ČR, ale počet malíčků v ČR, počet lidských kostí, počet očí, ... čili také můžeme "trochu podivně" změnit jednotku...
@rastislavserbin9297
@rastislavserbin9297 Жыл бұрын
Este som to nedopozeral, ale mam pocit, ze som prisiel na to pri akych suboroch dat to bude platit. Ak ste to spomunuli dalej ospravedlnujem sa. Suvisi to so vsetkymi pocetnymi datami, ktore nie su vedome generovane, ale popisuju resp vyjadruju pocty, mnozstva atd. cohokolvek, co ma tendenciu v case rast. Rieky najprv pramenili a postupne sa predlzovali. Obce zacinali jednotkou a pocty sa postupne zvysovali. Taktiez platby z uctu suvisia s inflaciou a podobne. A preferencia cisel je potom uz len na zaklade ich prveho vyskytu na cislelnej osi. Zacina sa 1,2,3, atd atd. A kym dobehneme do 9 je viac zaciatkov novych udalosti s 1, menej s 2 atd atd.
@Rosi2001
@Rosi2001 5 жыл бұрын
Zajímavé by bylo vyvrátit tento zákon - že funguje na číslech z praxe nebo mocninách dvojky neni sice intuitivní, ale věřím tomu. O Benfordově zákoně jsem již slyšel pana Rokytu mluvit v pořadu Meteor na Českém rozhlase letos v červenci a od té doby nad tím přemýšlím. Zde nezabíhali příliš do podrobností, ale získal jsem pocit že platí na všech posloupnostech, a to se mi moc nezdá. Jen na vyvrácení nemám moc času se tomu věnovam. Musel bych si najít úplné znění, abych nevyvracel něco co už je přímo definováno jako vlastnost, atd. ... Na webu oeis.org je sbírka posloupností, a prý je tam jedna bláznivá, anebo bych třeba vymyslel vlastní řady čísel. Doporučuju: kzbin.info/www/bejne/qnPCq2RtiaelhMk :)
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
Bemford rozhodne neplati pro vsechny soubory dat. O tom jsme mluvili. Stejne tak se neda rict, jake podminky musi sobor splnovat aby byl benfordovsky. Teda pokud si jako podmi ku nedate hustotu pravdepodobnosti ktera nam vysla :-) Neni to totiz exaktni veta nebo zakon.
@JA-zg1hv
@JA-zg1hv 5 жыл бұрын
Vy jste youtuber.
@alespaclt2121
@alespaclt2121 5 жыл бұрын
LOGICKÉ VYSVĚTLENÍ - když budeme brát třeba 4 mísná čísla počtu obyvatel u obcí v ČR - 1.XXX , 2.XXX až...9.XXX tak je přirozené, že vesnic s počtem obyvatel 1.000 až1.999 bude mnohem více než již menších měst s počtem obyvatel 9.000 až 9.999.
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
Souhlas. To co je pozoruhodne je, ze to klesani cetnosti s poctem obyvatel je jako 1/n.
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Tady bych byl trochu opatrný. Už ve videu ukazujeme, že data o počtu obyvatel splňují Benfordovské rozdělění i tehdy, když je všechna vynásobíme či vydělíme stejným číslem. Váš argument by nevysvětlil, proč tomu tak je. Také by nebyl schopen vysvětlit, proč se i délky řek chovají Benfordovsky. Benforda nemůžeme vysvětlovat pomocí speciální vlastnosti jednoho konkrétního souboru dat (počty lidí) a zcela jasně také selhává na souboru dat, u kterého se omezíme pouze na data jednoho pevného řádu (například jen desetitisíce). Jinak je správné, že si děláte vlastní hypotézy, ale také je dobré si je ověřit na datech: měla by vaše úvaha fungovat např. i na obce s počtem obyvatel mezi 10 a 99? V tomto souboru ovšem začíná jedničkou jen půl procenta dat a devítkou skoro 20%, naprotitomu v souboru 1000 až 9999 jedničkou začíná 57% dat a devítkou 0,8% dat. Nic z toho není benfordovské a je to obojí od sebe dosti vzdálené.
@alespaclt2121
@alespaclt2121 5 жыл бұрын
Omlouvám se, byl to jen právě projev mé intuice (nejsem matematik ale právě díky tématu INTUICE o kterou se zajímám, se mi ukázalo toto zajímavé video). Doplním ještě můj intuitivní názor na ty řeky a Benforda obecně. Tedy opět pouze Intuitivně jsem vytušil, že třeba u řek bude asi 1 ROZHODUJÍCÍ kritérium od 100 do 999 km ve kterém bude naprostá většina údajů. A opět říček od 100 do 199 km bude mnohem více než těch od 900 do 999 km a pokud vezmeme řeky nad 1000 km a nebo říčky pod 99 km - tak těch bude v součtu minimum a ať tam je již struktura jakákoliv - nenaruší to DOMINANTNÍ VLIV VŽDY JEDNÉ KLÍČOVÉ ŘADY. Na závěr se ještě jednou omlouvám protože matematika je pro mě obor který obdivuji - ale nemám k němu žádné skutečné nadání. Každopádně PŘEJI VÁM - SKUTEČNÝM MATEMATIKŮM HODNĚ ZDARU ve Vaší prospěšné činnosti při její popularizaci. Ing. Aleš Paclt
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
@@alespaclt2121 Dobrý večer, to je moc fajn, že se o to zajímáte. Ono na té úvaze částečně něco je, je to úvaha typu "proč se u některých počátečních cifer zdržíme déle". Ale napsal jsem, že se s tím musí opatrně. Podle mého názoru se nemůže zůstat jen u čísel jednoho řádu. U těch řek třeba je divné tvrdit, že těch s délkou 100-199 km je více než těch s délkou 900-999 km, protože kdybychom tytéž řeky měřili v mílích, tak by to znamenalo, že tvrdíme, že řek s délkou 62-124 mil je více než řek s délkou 562-624 mil. To je sice možné, ale problém rozložení prvních cifer to nijak nezdůvodňuje.
@FF-wl1oo
@FF-wl1oo 5 жыл бұрын
To ja mam jeden matematicky paradox, na ktery je kratky i pan Rokyta... Cim dele lezak lezi, tim vice stoji. A ted rozumujte!
@jaroslavreznik7167
@jaroslavreznik7167 4 жыл бұрын
viděl jsem dokument na netlixu, který to považuje sna za jakýsi zázrak a že nikdo pořádně neví proč to tak je...
@vodouch69
@vodouch69 5 жыл бұрын
Zkus udělat rozbor kolik se rovná 2⁰
@vaclavvitous1415
@vaclavvitous1415 5 жыл бұрын
Bude Benford platit, když se změní počet dat? Např vynechají Moravská města/řeky. :)
@janmolcik2398
@janmolcik2398 5 жыл бұрын
IMHO ano, protože odebráním nějakého počtu výsledků z těchto dat (v tomto případě "náhodného" odebrání) by nemělo narušit tu vlastnost škálovatelnosti. Je to jako bychom vzali počet obyvatel z jiného státu - máme jiný vzorek dat ale měl by pro ně platit stejný předpoklad. Ruku do ohně bych za to ale nedal :-D
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Nesmíte odebrat data tak nešikovně, aby vám například zbyla data jen jednoho řádu. To by byl příklad umělého ovlivnění struktury dat, musíte ponechat jejích základní charakteristiku: dostatečně velký soubor dat různých řádů. Ale jinak to samozřejmě zůstane platit, dokud jich bude zůstávat dostatečně mnoho a různýcjh řádů. Vždyť i na řeky českých zemí můžete nahlížet tak, že se vzaly všechny světové řeky a odebraly se ty, které neprotékají ČR. :)
@vikistastny473
@vikistastny473 4 жыл бұрын
tak to je massakr :-) jen tyto 2 mozky by mohly zásobovat energií celou elektrárnu :-) paráda
@mr.schloopka1124
@mr.schloopka1124 5 жыл бұрын
U těch měst to podle mě bude, protože počet obcí s počtem obyvatel klesá. Měst které mají 100 000 obyvatel bude mnohem víc než těch, které mají 400 000. Stejně tak bude mnohem více měst s 10 000 obyvatel, než s 50 000.
@marekvalasek7251
@marekvalasek7251 5 жыл бұрын
To dava smysl.
@oldrichmarek419
@oldrichmarek419 5 жыл бұрын
A 900 000 bude vuc nez 1 000 000 hmmm
@mr.schloopka1124
@mr.schloopka1124 5 жыл бұрын
@@oldrichmarek419 ale já se budu bavit jenom o stejných řádech.
@vaclavtaus6383
@vaclavtaus6383 5 жыл бұрын
Hned na začátku videa pánové upozorňují, že je potřeba použít data, pokud možno od řádu jednotek po řády desetitisíců i více. Vše vysvětlují na příkladu měření velikosti dospělých osob, kdy můžeš použít nekonečně mnoho hodnot a stále budou hodnoty začínat jedničkou, mizivé procento dvojkou a ostatní číslice prostě první nepouziješ.
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
@@mr.schloopka1124 Dobrý den, pokud se omezíme jen na data jednoho konkrétního řádu, tak Benford přestane fungovat. Přímočará statistika ukazuje, že pokud uvažujeme jen obce například "řádu 1", tj. obce s počtem obyvatel mezi 10 a 99, tak v tomto souboru začíná jedničkou jen půl procenta dat a devítkou skoro 20%, naprotitomu v souboru 1000 až 9999 jedničkou začíná 57% dat a devítkou 0,8%. Ani jedno z toho není Benfordovské a obojí se to od sebe dost podstatně liší. Obecně: experimenty ukazují, že Benford funguje až tehdy, když se současně uvažují data alespoň 4 až 5 různých řádů. Tak se lokální rozdíly vykompenzují a ustálí kolem Benfordovského rozdělení. Ruku v ruce se škálovatelností, která je za Benfordem ukryta (jak jsme se snažili ve videu naznačit), je totiž i to, že musí být k dispozici data různých řádů, aby i po přeškálování byla k dispozici "data různých řádů". A ne data jednoho konkrétního řádu a po přeškálování jiného konkreétního. Ten experiment s obcemi 10-99 a obcemi 1000-9999 to ilustruje.
@StanislavBrabec
@StanislavBrabec 4 жыл бұрын
Existuje jedna škála, která vůbec není náhodná, je uměle vytvořená, a přitom také splňuje Benfordův zákon: řady pasivních elektronických součástkek. Ty se vyrábějí tak, aby k libovolné potřebné hodnotě byla k dispozici součástka s odchylkou nejvýše daný počet procent. cs.wikipedia.org/wiki/Vyvolen%C3%A9_%C4%8D%C3%ADslo
@carochodxd6984
@carochodxd6984 5 жыл бұрын
Zdravím pane, udělal bys něco jako "reakci" kzbin.info/www/bejne/fpmsY6lrbc2Erpo na tohle video? Proti typkovi nic nemám a sleduju ho celkem pravidelně,ale pár příkladů co tady ukazuje mi přijde jako nepravda :D tak by mě zajímal názor skutečného matematika :D
@rastothesuchsoft6546
@rastothesuchsoft6546 4 жыл бұрын
Prepáč, ale to je off topic, čo to má spoločné s touto témou?
@baffiak1902
@baffiak1902 4 жыл бұрын
jednoducha odpoved - pokial subor splna podmienku log normalneho rozlozenia, tak bude Benfordove. a prave datasety, ktore ste porovnavali, tak vsetky z nich splnaju podmienku log normalneho rozlozenia, ktore zjednodusene je - vela malych cisel a malo velkych cisel
@eltwarg6388
@eltwarg6388 4 жыл бұрын
Tiež sa divím, čo tam stále riešia ;) Proste od 1 do 2 je v log škále cca 30%, ale od 8 do 9 je holt menej...
@marekkolbaba2217
@marekkolbaba2217 4 жыл бұрын
Jednoduché vše co se překulí přez řád prostě při sčítání vždy začíná nejprve jedničkou a až poté se dostává na další čísla
@pavolremis
@pavolremis 4 жыл бұрын
nesúhlasím z názorom, že keď všetký hodnoty vynásobím konštantou 3,14, tak dostaneme opäť tie isté údaje 1-30%, 2-17%..., pretože keď vstupné údaje 1,00*3,14=3,14 a 1,99*3,14=6,24 tak 30% výsledkov nebude začínať číslom 1, ale číslom v rozmedzí 3-6. Takže keď vstupné dáta budu skôr nízkych hodnôt 1,00-1,27 (30% výsledkov bude začínať 3), tak konečné hodnoty po prenásobení budú iné ako keď budem mať vysoké čísla 1,92-1,99 (30%=6). Hodnota 1,92 predstavuje napríklad číslo 1925846 a skrátený tvar uvádzam iba pre jednoduchosť výpočtu. A hoci aj ostatné čísla sa budú vynásobovať rovnakou konštantou, tak 1/3 všetkých údajov (1) je už vynásobená a tie ďalšie hodnoty by už nemali, tak moc prehovoriť do výsledkov.
@rastothesuchsoft6546
@rastothesuchsoft6546 4 жыл бұрын
Nedalo mi to. Pri násobení konštantou 3.14, sa dostanú všetky čísla začínajúce platnými číslicami v rozmedzí od 3.184713376 do 6.369426752 na miesto, kde budú začínať číslicou 1. A pravdepodobnosť výskytu v tomto rozsahu by mala byť rovnaká ako v rozsahu 1 - 2, teda tie čísla, ktoré začínajú číslicou 1, takže by mala byť 30.1, dá sa to vypočítať, ale nechce sa mi. ;) Nech mi všetci prosím prepáčia nie dobré vyjadrovanie sa, nie som matematik. ;)
@rastothesuchsoft6546
@rastothesuchsoft6546 4 жыл бұрын
Zasa mi to nedalo: log10(6.369426752) - log10(3.184713376) = 0,804100348 - 0,503070352 = 0.30103 :-)
@rastothesuchsoft6546
@rastothesuchsoft6546 4 жыл бұрын
A ešte poznámka, samozrejme, že nedostaneš tie isté údaje. Iba Benfordov zákon bude platiť. ;)
@pavolremis
@pavolremis 4 жыл бұрын
@@rastothesuchsoft6546 práveže nebude platiť lebo tam nebude jednotka na prvom mieste s 30% takže nebude platiť ani to že je jedno v akých jednotkách meriaš, či v palcoch alebo cm, a prekvapuje ma že sa nikto nad tým nepozastavil
@petrsedlak9082
@petrsedlak9082 4 жыл бұрын
@@pavolremis Asi proto, že se do nových dat začínajících 1 dostane mnohem víc těch původních z většího rozsahu cca 3.2-6.36 (3x4=12, 3x5=15, 3x6=18), zatímco ty původní hodnoty mezi 1 a 2 se v nových datech zase rozdělí do čísel začínajících 3-6...
@infernal314
@infernal314 5 жыл бұрын
K výsledku benfordofského rozdělení lze dospět i rychleji a obecněji, neboť z podmínky škálování rovnou plyne, že ta funkce musí být homogenní, a musí mít tedy formu f=a x^\alpha, kde \alpha je neznámý exponent (pouze funkce tohoto tvaru zachycují "samopodobnost", tedy nezávislost na škále). Jeho hodnota plyne z normalizace \int_1^10 x^\alpha dx=1, která vede na transcendentní rovnici, ale výsledek (\alpha=-1) lze snadno uhádnout (hodnota horní meze nemá na výsledek vliv, odtud také invariance na číselné soustavě).
@pavelzajic7636
@pavelzajic7636 4 жыл бұрын
Benfordův zákon = 1/2 Gaussovy křivky ?
@KaelSvalcembelk
@KaelSvalcembelk 4 жыл бұрын
Vůbec ne. To spolu nemá co dělat. Tady mimo jiné pán řekl, jak musí vypadat ta vstupní data. A má to docela dost omezení. Třeba měření výšky lidí tím Benfordem vůbec nezpracuješ. Ale Gaussovu křivku na to jednoduše uplatníš.
@eltwarg6388
@eltwarg6388 4 жыл бұрын
Benfordov zákon platí perfektne na logaritmicky rozložené dáta. Pre normálne rozdelenie, najmä ak je úzke, nefunguje vôbec (ako napríklad to meranie výšky ľudí, čo už spomenul aj Swewsa)
@rastokocour2335
@rastokocour2335 5 жыл бұрын
Ak by som vzal Benfordovský súbor dát (napr.zmieňovaný súbor dĺžok českých riek) a odstránil z každého čísla prvú číslicu, dostanem Benforda ? Nižšie ste to nakusli a odvolali ste sa na dvojice čísel, mňa však zaujímajú práve druhé číslovky v poradí. Pretože ak by to platilo, tak postupným umazávaním prvých čísloviek čísel súboru s dostatočne veľkým rozptylom rádov, tak by som vždy mal dostať dostal Benforda.
@albertmlcoch3570
@albertmlcoch3570 5 жыл бұрын
Pokud by jste umazáním první číslice měl získat znova Berforda tzv. "bez ztráty kytičky", musel by jste z tohoto nového Berforda smazáním (další) číslice opět získat Berforda. Co ale s čísly, která by vám tímto postupem "zmizela"? (protože měla např. pouze dvě platné cifry, jako 83, nebo 32 000) Tím by jste si rychle snižoval jak počet řádů, tak počet samotných vzorků čísel, tedy nemůže být pravda, že po každém odejmutí první číslice zůstane rozložení stejné. (po docela malém počtu iterací dojdete k množině nul, nebo prázdné množině) Bylo by ale zajímavé zjistit, jestli se Berfordovo rozložení z dat postupně vytratí, jak budou ubývat cifry, nebo jestli zmizí hned při prvním kroku.
@eltwarg6388
@eltwarg6388 4 жыл бұрын
Nie, až tak celkom to nefunguje, ale tak trochu áno. Prvá platná číslica sa riadi pri viac-menej logaritmickom rozdelení dát Benfordovým zákonom, druhá a ďalšie sú podružné. Ak by ste ale skúmali prvú dvojicu cifier, prišli by ste na to, že tých hodnôt, čo začínajú 11 je viac, než tých, čo začínajú 12, 13, a postupne až 19. No ten rozdiel je oveľa menej výrazný, ako v prvom ráde. V konečnom dôsledku vám vyjde, že rozloženie "nových" prvých cifier bude asi takéto: 1: 12.94%, 2: 12.36%, 3: 11.85%, 4: 11.39%, 5: 10.98%, 6: 10.61%, 7: 10.26%, 8: 9.95%, 9: 9.66% No a s každým ďalším krokom sa to bude stále viac vyrovnávať (za predpokladu, že máte dosť cifier na odoberanie :)
@saip04
@saip04 5 жыл бұрын
Co delam spatne, resp. kterou podminku (viz 9:00) muj priklad nesplnuje? (Pseudo)nahodna jsou, vuli je neovlivnuji, uzce definovane to neni...: - udelal jsem v excelu 5000 opakovani funkce "=RANDBETWEEN (bottom, top)" - omezene od 1 do 9 999 999 - tedy rekl jsem Excelu at v tomto intervalu vygeneruje 5k nahodnych cisel...a vysledek je rovnormerne rozlozeni: 1 562 11% 2 574 11% 3 568 11% 4 545 11% 5 528 11% 6 520 10% 7 536 11% 8 586 12% 9 581 12% Grand Total 5000 Dekuji.
@MrKatana333
@MrKatana333 5 жыл бұрын
To, co docent Rokyta dokázal, je pouze implikace, že škálovatelnost zaručuje Benforda. Jen tak bez důkazu odhaduji, že rovnoměrné rozdělení není (nikdy?) škálovatelné a že není benfordovské tedy není v rozporu. Trochu argumentace proč není škálovatelné: Všechna čísla bys například vynásobil dvěma. Ta s první cifrou větší než čtyři skončí s jedničkou jako první cifrou, tj. asi padesát procent čísel bude mít jedničku na prvním místě. To rozhodně nebyla pravda pro původní rovnoměrné rozdělení tj. to původní rozdělení není škálovatelné. Dle té jednosměrné implikace nemusí být tedy nutně Benford (z logické stránky věci ale může, není to zakázáno). Je zajímavé, že některá reálná data se takto speciálně, škálovetelně chovají, a proto u nich pozorujeme Benforda. Nicméně jaký typ pravděpodobnostního rozdělení Benforda zaručuje, o tom právě docent Rokyta říká, že to není jasné... Škoda :(
@saip04
@saip04 5 жыл бұрын
@@MrKatana333 super, dekuji :)
@AP57532
@AP57532 5 жыл бұрын
Neděláte nic špatně, pouze jste vygeneroval rovnoměrné rozložení (které funkce random z definice dělá) a to je jiné, než rozložení dat pocházejích z reality. Pokud chcete náhodný generátor, který vám vygeneruje třeba výkazy pro orgány Evropské unie tak, aby prošly Benfordovým testem, zkuste místo toho použít e^r, kde r je náhodné číslo s rovnoměrným rozložením v intervalu třeba (-10,10). Podobně bude fungovat třeba součin několika náhodných čísel v intervalu
@peterkrammer8968
@peterkrammer8968 5 жыл бұрын
Nerobite spatne nic.. ale rovnomerne rozdelene cisla v exceli su umelo vytvorene.. nie prirodzene. Sice splnate podmienku prechodu dat, cez viac radov. Avsak nie je ziadny dovod aby tieto data splnali podmienku zachovania rozdelenia najvyssej cifry pri skalovani (tieto data su proste umele). To , ze to cisla z prirody a mnohych realnych pozorovani to splnaju je na hlbsie zamyslenie - ze preco je to prave tak. Pan docent sa toho velmi pekne dotkol prave myslienkou, ze prirode moze byt v podstate jedno, ci dlzku riek meriame v metroch, palcoch ci stopach. Nezabudajte tiez, ze Vase takto vygenerovane data su len pseudo-nahodne.
@mirkorokyta9694
@mirkorokyta9694 5 жыл бұрын
Dobrý den, všechny reakce na váš dotaz (Kratky, Krammer, AP57...) jsou správně a k věci. Já bych jen poznamenal, že bych byl nerad, abych vzbudil dojem, že všechny soubory dat musí být benfordovské. :) Tak tomu není. Benfordovská data jsou hodně speciální soubory dat, a spíš je to naopak: divíme se, že to tu a tam něco splňuje, a ptáme se proč vlastně. A ano, nepodávám žádnou charakteristiku benfordovských dat, jen ukazuju implikaci: pokud škálování nezmění rozložení prvních cifer, máme co do činění s benfordovskými daty.
@dus5855
@dus5855 4 жыл бұрын
Druhá a další číslice mají víceméně rovnoměrné rozdělení pravděpodobnosti. A je mezi nimi nula. Mezi prvními platnými číslicemi nula není a rozložení je nestejnoměrné. Takže: pravděpodobnost nuly (jakkoliv to zní ujetě a ukřižováníhodně) se distribuuje mezi ostatní číslice. A to tak, že čím nižší číslice, tím si toho od té chybějící nuly přivlastní víc - vyskytuje se po "přeskočení nuly" blíž k tomuto "jevu". Může mít tento blábol nějakou matematickou oporu?
@milanlesko8737
@milanlesko8737 5 жыл бұрын
Mám taký myšlienkový pochod. Ten „Benfordův zákon“ nefunguje preto, lebo to vyplýva z usporiadania „arabského“ zápisu čísla? Ak použijeme binárnu sústavu, tak samozrejme jednička bude mať zastúpenie na začiatku čísla 100%. Keď čísla (údaje) rozpíšeme v osmičkovej, potom v desiatkovej a nakoniec v šestnáckovej sústave, tak počítam, že sa pravdepodobnosť použitia čísel zasa pekne rozostúpi podľa podobného grafu ako ste prezentovali. Vlastne ta pravdepodobnosť použitia konkrétneho čísla na začiatku súvisí so zápisom, nie so samotnými udajmi. Rozmýšľam, ak by ste čísla zapísali napr. „rímskym“ spôsobom (MDCLXVI), trafila by sa štatistika do tej istej krivky? A ešte jedna vec, skúšal niekto urobiť štatistiku použitia číslice, ktoré je v číslach na druhom, prípadne inom mieste? Ako by to dopadlo?
@icinko92
@icinko92 5 жыл бұрын
Absolutne suhlasim Toto je podla mna iba o sposobe zapisu cisiel
@albertmlcoch3570
@albertmlcoch3570 5 жыл бұрын
S římskými číslicemi vám toto nemůže vyjít, protože u nich záleží na řádu, s kterým počítáte. U souboru hodnot 1 až 10 000 vám tedy zákonitě musí vyjít jiné rozložení prvních písmen, než u souboru třeba 100 až 1 000 000. (Neplatí podmínka přeškálování) K teorii, že jde jen o způsob zápisu: to by ale nijak nevysvětlilo, proč to na některé druhy dat pasuje a na některé ne, když by šlo jen o zápis.
@rastothesuchsoft6546
@rastothesuchsoft6546 4 жыл бұрын
Myslím si, že to so spôsobom zápisu čísiel vôbec nesúvisí. Jednoducho to v realite funguje tak, že vo všeobecne prirodzene sa vyskytujúcich hodnotách, ak ich v súbore dát zoradíme podľa poradia, zrejme zistíme, že hodnoty v takto zoradenom súbore nenarastajú nejakým "pričítaným" prírastkom, ale skôr podielovým prírastkom. Chcem tým povedať, že "realita" nepričítava, ale násobí. To spôsobuje, že čím vyššie číslo, tým vyšší prírastok pre nasledujúce číslo. Samozrejme priemerný prírastok. Tu je zaujímavé, že ak si vytvorím súbor dát umelo, napr. násobením číslom 1.1, tak to pekne vidieť, ako sa prírastky zvyšujú. Niekde tuto bude zakopaná pointa tohto zaujímavého javu. :-)
@milanlesko8737
@milanlesko8737 4 жыл бұрын
@@rastothesuchsoft6546 Písal som si s p. Docentom a áno, súvisí to aj so zápisom (preto sa to volá pozičný zápis)
@milanlesko8737
@milanlesko8737 4 жыл бұрын
@@rastothesuchsoft6546 Odpoveď p. Docenta: Dobrý den, Benfordův zákon opravdu souvisí s tzv. pozičním zápisem čísel. To znamená, že záleží nejen na použitých symbolech, 1,2,3... ale také na jejich pozici v rámci zápisu čísla. Je-li některý symbol (cifra) na pozici stovek, hraje jinou roli než tatáž cifra na pozici desítek. Není tolik důležité v jaké číselné soustavě pracujeme, jestli v trojkové, osmičkové nebo desítkové. Charakter Benfordova zákonva zůstane stejný, mění se jenom konkrétní procentuální zastoupení. Tím charakterem myslím to, že ať už zapisujeme v desítkové nebo v osmičkové soustavě, tak na první pozici bude vždy nejčastější cifrou jednička, jen to budou jiná procenta v jiné číselné soustavě. Konkrétně, při zápisu v desítkové soustavě to bude procentuálně v 100*log10(2) případech, v osmičkové soustavě by to bylo v 100*log8(2) případech atd. Pod log10 myslím logaritmus o základu 10, log8 znamená logaritmus o základu 8. Atd. Vidíte, že to funguje: ve dovujkové soustavě je jednička skutečně a první pozici v 100*log2(2) = 100% případů. V případě zápisu římskými číslicemi takový zákon neplatí. Římská čísla nejsou poziční v tom smyslu, že písmeno M bude vždy tisíc, tedy MM budou dva tisíce, CC dvě sta atd. Druhá pozice toho druhého M nebo druhého C nemění jeho hodnotu. Ještě bych chtěl podotknout, že data, která splňují Benfordův zákon, nejsou náhodná data. Pokud budete generovat zcela náhodný soubor dat, nebude jejich první cifra splňovat Benfordovo rozložení. Ta data musí v sobě mít něco, co bychom mohli nazvat "multiplikativní charakter" (tj. musí tam být nějak skryto násobení). Jedním z těch případů je např. ono škálování, o kterém jsme mluvili ve videu (škálování je vlastně násobení), další možnost jsou například mocniny dvojky (násobení mnoha dvojek), faktoriály atd. (o těch taky byla řeč). To nejsou náhodná data, jejich vznik je nějakým způsobem spjat s procesem násobení. Ptáte se na to, jestli je známo, jak se chovají například druhé cifry u souboru Benfordovských dat. Ano, to je známo: i na druhém místě převažuje jednička, ale už ne tak výrazně. Existuje i vzorec, který říká, v kolika procentech asi můžeme čekat jedničku, dvojku, atd. na druhém místě v pozičním zápisu. Při zkoumání, jaké rozložení mají další cifry (třetí, čtvrtá, atd...) zjišťujeme, že se stále více blížíme rovnoměrnému rozdělení. Ohledně tohoto posledního odstavce zvažujeme s Markem, že natočíme ještě Benfordkovský sequel, ve kterém se touto problematikou budeme zabývat. Zdraví M. Rokyta
@BigJuris
@BigJuris 4 жыл бұрын
Vim proc to tak je 😉
@daliborvanek5639
@daliborvanek5639 4 жыл бұрын
Proč mne to nepřekvapuje
O matematice s Mirko Rokytou - Otázky publika - Součet řady 1/k^2
25:18
Množiny - úvod
18:40
Mgr. Lukáš Macek
Рет қаралды 597
Monty hall problem - Jak nás klame intuice 2 - S docentem Mirko Rokytou
14:07
O matematice s Mirko Rokytou 3 - Kolik je 1+2+3+4+5+... ?
29:57
Marek Valášek
Рет қаралды 47 М.
Luboš Pick - Jak napálit matfyzáka (MFF-FPF 14.12.2017)
1:15:54
Zbyněk Kubáček: Čo a ako by sa mal z matematiky učiť nematurant?
44:15
Matematika pro život
Рет қаралды 122 М.