Blog
Oversigt
QQ-plot - Stammer stikprøven fra normalfordeling?
Jens Axel Søgaard, 19. august, 2024
Et QQ-plot kan bruges til visuelt at afgøre om et datasæt stammer fra en normalfordeling.
Hvis et observationssæt kan beskrives ved hjælp af en normalfordeling (dvs. hvis et histogram for observationerne er “klokkeformet”), så kan man “nemt” udregne en hel række af interessante tal. Man kan for eksempel udregne sandsynligheden for, at en måling ligger i et konkret interval.
På engelsk kaldes et QQ-plot for normaldelingen ofte et “Normal probability plot”. Når man står med et observationssæt, vil man derfor ofte begynde sin statistiske undersøgelse med at finde den bagvedliggende fordeling. Det er her QQ-plottet (fraktil-fraktil-plottet) kommer ind i billedet. Det kan nemlig bruges til grafisk at sammenligne en stikprøve med en teoretisk fordeling. Her vil vi se på sammenligning med en normalfordeling.
Eksempel: Længde af vinger på husfluer
I forbindelse med en undersøgelse af insektmidlers effekt på fluer indsamlede R.R. Sokal og P.E. Hunter i 1955 data vedrørende husfluer. De målte flere egenskaber på hver flue, men her skal vi kun se på længden af fluernes vinger.
I tabellen nedenfor er længden målt i tiendedel-millimeter. Målingen 36 betyder, at fluen havde en vingelængde på 3.6 mm.
36 37 38 38 39 39 40 40 40 40
41 41 41 41 41 41 42 42 42 42
42 42 42 43 43 43 43 43 43 43
43 44 44 44 44 44 44 44 44 44
45 45 45 45 45 45 45 45 45 45
46 46 46 46 46 46 46 46 46 46
47 47 47 47 47 47 47 47 47 48
48 48 48 48 48 48 48 49 49 49
49 49 49 49 49 50 50 50 50 50
50 51 51 51 51 51 52 52 53 53
54 55
Et prikplot giver et hurtigt overblik:
Vi skal snart se på, hvordan punkterne udregnes. Observationerne bruges til at udregne punkterne i følgende diagram (et QQ-plot).
Sammen med punkterne er indtegnet en reference-linje.
QQ-plottet er indrettet sådan, at stikprøver fra normalfordelte populationer tilnærmelsesvist giver rette linjer på et QQ-plot. I diagrammet ser vi, at punkterne følger linjen nogenlunde, så det er rimeligt at antage, at længderne følger en normalfordeling. Det smarte ved QQ-plottet er, at det er nemt visuelt at tjekke, om punkter ligger på en ret linje.
Men en tæthedsfunktion for en normalfordeling er klokkeformet - og fordelingsfunktionen har en graf, der ligner et S. Så hvordan får man noget med normalfordelinger til følge en ret linje?
Tæthedsfunktion \(f\) \(\quad\) \(\quad\) \(\quad\) Fordelingsfunktion \(F\).
Normalfordelinger og rette linjer
En normalfordeling er entydigt bestemt ud fra de to parametre µ og \(σ\). Det græske bogstav µ (udtales "my") svarer til et dansk \(m\). Det græske bogstav \(σ\) (udtales "sigma") svarer til et dansk \(s\). Tænker vi på den klokkeformede graf for tæthedsfunktionen, så bestemmer middelværdien µ placeringen af “centrum” og spredningen \(σ\) bestemmer om klokken er flad og bred eller høj og smal.
Lad os sige, at vores data stammer fra en normalfordeling med middelværdi µ og spredning \(σ\). Så kan fordelingsfunktionen \(F\) skrives som: \[F(x) = Φ\left(\frac{x-\mu}{σ}\right), \] Standardnormalfordelingen \(N(0,1)\) har middelværdi 0 og spredning 1. her er \(Φ\) (store phi) fordelingsfunktion for standardnormalfordelingen. Grafen for \(F\) er som sagt \(S\)-formet.
Da \(Φ\) er voksende, ved vi, at \(Φ\) har en omvendt funktion. Grafen for den omvendte af \(Φ\):
Hvis vi bruger den omvendte funktion af \(Φ\) på begge sider, får vi: \[Φ^{-1}(F(x)) = Φ^{-1}\left(Φ\left(\frac{x-\mu}{σ}\right)\right) \] Da en funktion og dens omvendte ophæver hinanden, har vi: \[Φ^{-1}(F(x)) = \frac{x-\mu}{σ} \] Hvis vi dividerer \(σ\) op i hvert led, haves: \[Φ^{-1}(F(x)) = \frac{1}{σ}x + \frac{-\mu}{σ} \] Det betyder, at kurven \[y = Φ^{-1}(F(x)) \] er en ret linje med hældning \(a=\frac{1}{σ}\) og konstantled \(b=\frac{-\mu}{σ}\).
Med andre ord, i stedet for at tegne grafen for fordelingsfunktionen \(F\) direkte, så kan man tage omvendt \(Φ^{-1}\) først - og så bliver grafen en ret linje.
Kumuleret frekvens
Vi vender nu tilbage til at studere vores observationer af længde af fluevinger. Vores observationer var (i voksende rækkefølge): \[x_1 = 36, \quad x_2 = 37, \quad \ldots, \quad x_{102}=55 \] Der regnes som om alle observationerne er forskellige. Antallet \(n\) af observationer er \(n=102\). Hver enkeltobservation udgør altså \(\frac{1}{n}=\frac{1}{102}\approx 1\%\) af alle observationer. Den kumulerede frekvens for den \(i\)'te observationer er: \[\textrm{kumuleret frekvens for }x_i = i\cdot \frac{1}{n} = \frac{i}{n} \] I eksemplet: \[\textrm{kumuleret frekvens for }x_i = \frac{i}{102} \]
Koblingen mellem kumulerede frekvenser og fordelingsfunktionen
Et histogram i statistik svarer til tæthedsfunktionen i sandsynlighedsregning. De kumulerede frekvenser i statistisk svarer til fordelingsfunktionen i sandsynlighedsregning. Det vil sige, sumkurven svarer til grafen for fordelingsfunktionen.
Histogrammet og sumkurven bruger dataene fra flueeksperimentet.
Histogram \(\quad\) \(\quad\) \(\quad\) \(\quad\) \(\quad\) \(\quad\) Sumkurve
Vi ved, at kurven \[y = Φ^{-1}(F(x)) \] er en ret linje, når \(F\) er en fordelingsfunktion for en normalfordeling. Punkterne på kurven har formen \[\left(x, Φ^{-1}(F(x))\right). \] Det er derfor oplagt, at forsøge plotte punkterne \[\left(x_i, Φ^{-1}(\textrm{kumuleret frekvens for }x_i)\right) = \left(x_i, Φ^{-1}\left(\frac{i}{n}\right)\right). \]
Der er dog et teknisk problem. Funktionen \(Φ^{-1}\) er ikke defineret, når den kumulerede frekvens er \(100\%\).
Justerede kumulerede frekvenser
En løsning på problemet med er at justere \(y\)-værdiene en anelse: \[\left(x_i, Φ^{-1}\left(\frac{i-\frac{1}{2}}{n}\right)\right) \] For meget små datasæt med mindre end 10 observationer, bruger mange professionelle programmer en anden, lignende justering. Statistikere har afprøvet og regnet på denne justering og har fundet ud af, at den fungerer godt for de fleste datasæt. Justeringen svarer til at bruge det midterste punkt i en “overligger” i histogrammet i stedet for overliggerens yderste højre punkt.
Den metode Geogebra bruger hedder “Filliben’s estimat”. Denne metode bruges af NSpire, Maple (både med og uden \(gympakke)\) og af WordMats øverste diagram (med titlen “normal plot”). Programmet Geogebra bruger en anden metode til at justere punkterne.
Målingerne af fluernes vingelængder giver dette QQ-plot.
Afrunding
Vær opmærksom på, at linjen på QQ-plottet ikke er en regressionslinje. Det er en referencelinje, der tegnet på for at hjælpe brugeren til at afgøre om punkterne ligger nogenlunde på en ret linje.
Hvis man på baggrund af QQ-plottet accepterer hypotesen, at observationerne i datasættet stammer fra en normalfordeling, så er næste trin at bestemme middelværdien µ og spredningen \(σ\) for fordelingen. Det gøres ved at udregne stikprøvemiddelværdi og standardafvigelse for stikprøven.
I STX \(A\)-formelsamlingen er det formel (217a) og (218a). \[\mu = \frac{x_1 + x_2 + \ldots + x_n}{n} \] \[\sigma = \sqrt{\frac{ (x_1-\mu)^2 + (x_2-\mu)^2 + \ldots + (x_n-\mu)^2}{n-1}} \] Bruger man NSpire eller Maple, så er det disse tal, der bruges til at tegne referencelinjerne i QQ-plottet. NSpire skriver ligningen på formen: \[y = \frac{x-\mu}{\sigma} \] Man kan med andre ord aflæse \(\mu\) og \(\sigma\) på QQ-plottet.
En sidste ting: Hvis man er utilpas ved at afgøre om et datasæt er normalfordelt ved på øjemål at sammenligne punkter med en ret linje - ja så kan man i stedet udføre Shapiro and Wilk's W-Test for normalfordeling. Testen er indbygget i f.eks. Maple.
QQ-plots for ikke-normalfordelte observationer
Eksemplet med fluevinger viste, at data som stammer fra en normalfordelt population, giver et QQ-diagram, hvor punkterne tilnærmelsesvist ligger på linje.
Hvordan ser et QQ-plot ud, når punkterne ikke stammer fra en normalfordelt population?
I den uniforme fordeling \(U(0,1)\) er der lige stor tæthed for alle udfald mellem 0 og 1.
Det er tydeligt, at punkterne ikke følger referencelinjen. I forhold til en normalfordeling er der for mange observationer i halerne. Det er tydeligt, at punkterne ikke følger referencelinjen. Igen er det halerne, der opfører sig anderledes end hos en normalfordeling.
Det er tydeligt, at punkterne ikke følger referencelinjen.
Her er det svært at se om punkterne følger linjen - eller om der er systematik i afvigelserne. En statistisk test som f.eks. Shapiro-Wilk ville være på sin plads at bruge i stedet for QQ-plottet.
Her stammer dataene fra en normalfordelt population, så punkterne burde følge linjen. Som om man kan se, må man dog være forberedt på, at punkterne ikke følger referencelinjen helt præcist.
Når antallet af observationer er lille, så vil man særligt se afvigelser fra referencelinjen ved observationene længst fra middelværdien.
Kilder
Datasættet for længde af fluevinger er rekonstrueret fra:
"A morphometric analysis of ddt-resistant and non-resistant house fly strains"
Robert R. Sokal og Preston E. Hunter
Standardmetoden til at justere punkterne på QQ-plottet er beskrevet dels på siden Normal probability plot dels på siden Q-Q Plot.
Er man interesseret i at læse teorien bag, så kig på:
"Statistical estimates and transformed beta variables"
Blom, G.
New York: John Wiley and Sons
1958
Du kan låne en digital udgave hos Internet Archive.
Geogebras metode til at justere punkterne hedder Filliben's estimat og er beskrevet på Wikipedia.
Er du interesseret i teorien bag denne metode, så kig på:
"The Probability Plot Correlation Coefficient Test for Normality"
Filliben, J. J.
1975
Artiklen kan findes via Google Scholar.
Bemærk, at Filliben bygger på Bloms arbejde.
Andel af population, stikprøve og konfidensinterval
Jens Axel Søgaard, 13. maj, 2024
En bestemt andel \(p\) af en population har en bestemt egenskab. Vi ønsker, at give et estimat på andelens størrelse ved at undersøge en stikprøve.
Eksempler
\[\begin{array}{l|l|l} \textrm{Situation} & \textrm{Population} & \textrm{Egenskab} \\ \hline \textrm{Meningsmaaling} & \textrm{Vaelgere i DK} & \textrm{Vil stemme paa A} \\ \textrm{Kvalitetskontrol} & \textrm{Producerede skruer} & \textrm{Fejlfri} \\ \textrm{Kundeundersoegelse} & \textrm{Sodavandsdrikkere} & \textrm{Kan bedst lide Pepsi} \\ \textrm{Medicinalforsoeg} & \textrm{Patienter med sygdom X} & \textrm{Bliver bedre ved at faa pille A} \end{array} \]
For at finde et estimat for andelen \(p\) udtages en stikprøve på \(n\) elementer fra befolkningen. Hvis \(k\) ud af \(n\) elementer i stikprøven besidder egenskaben, så er stikprøveandelen: \[\hat{p} = \frac{k}{n} \] Hvis størrelsen \(n\) af stikprøven har en fornuftig størrelse, så forventer vi at estimatet \(\hat{p}\) er tæt på den ukendte andel \(p\).
Jo større stikprøven er, jo bedre bliver estimatet. Et konfidensinterval bruges til at vise præcisionen af estimatet \(\hat{p}\).
Siden Wikipedia: Binomial proportion confidence interval har en fin oversigt over forskellige metoder til at udregne konfidensinterval for “andel af population”. Lad os sige, at vi har valgt en bestemt metode at udregne konfidensintervaller. Forestil dig så, at vi gentagne gange udtager en stikprøve og udregner et tilhørende konfidensinterval. Hvis man med den valgte metode kan forvente, at ca. 95% af konfidensintervallerne indeholder andelen \(p\), kalder man konfidensintervallerne for 95%-konfidensintervaller.
Hvis man gentagne gange udtager stikprøver af størrelse \(n\), så er antallet \(k\) af elementer i stikprøven med den ønskede egenskab binomialfordelt \(k\sim \textrm{bi}(n,p)\).
Metoden kaldes
“konfidensinterval vha. normalfordelingsapproksimation” eller “Walds metode”.
Den mest benyttede metode til at udregning af et konfidensinterval udnytter, at binomialfordelingen kan tilnærmes med en normalfordeling, når \(n\) ikke er for lille og når \(p\) hverken er for tæt på 0 eller 1. I praksis er tilnærmelsen god nok, når både middelværdien \(n\cdot p\) og \(n\cdot (1-p)\) er 5 eller større.
Normalfordelingsapproksimationen giver denne formel: Funktionen \(Φ\) er fordelingsfunktionen for standardnormalfordelingen med middelværdi 0 og spredning 1. \[P(\textrm{mellem } a \textrm{ og } b \textrm{ succeser}) \approx Φ\left(\frac{b+\frac{1}{2}-μ}{σ}\right) - Φ\left(\frac{a-\frac{1}{2}-μ}{σ}\right), \] hvor \(μ=n\cdot p\) er middelværdien og \(σ=\sqrt{n\cdot p\cdot (1-p)}.\)
Om normalfordelingen ved vi, at: \[ \begin{align} P(\textrm{mellem } μ-σ \textrm{ og } μ+σ \textrm{ succeser}) &\approx 68\% \\\\ P(\textrm{mellem } μ-2σ \textrm{ og } μ+2σ \textrm{ succeser}) &\approx 95\% \\\\ P(\textrm{mellem } μ-3σ \textrm{ og } μ+3σ \textrm{ succeser}) &\approx 99.7\% \\ \end{align} \] Sandsynligheden for at \(k\) falder i intervallet fra \(μ-2σ\) til \(μ+2σ\) er derfor ca. 95%. Da \(\hat{p}=\frac{k}{n}\) kan vi omskrive intervallet for \(k\) til et interval for \(\hat{p}\). \[\begin{array}{rcccl} μ-2σ & ≤& k & ≤ & μ+2σ \\ \frac{μ-2σ}{n} & ≤ & \frac{k}{n} & ≤ & \frac{μ+2σ}{n} \\ \frac{μ-2σ}{n} & ≤& \hat{p} & ≤ & \frac{μ+2σ}{n} \\ \end{array} \] De to grænser omskrives: \[\begin{array}{rl} \frac{μ-2σ}{n} & = \frac{μ}{n} - 2 \frac{σ}{n} = \frac{n\cdot p}{n} - 2 \frac{σ}{\sqrt{n^2}} \\ & = p - 2 \frac{\sqrt{n\cdot p\cdot (1-p)}}{\sqrt{n^2}} = p - 2 \sqrt{\frac{n\cdot p\cdot (1-p)}{n^2}} = p - 2 \sqrt{\frac{p\cdot (1-p)}{n}} \\ \end{array} \] Tilsvarende er: \[\frac{μ+2σ}{n} = p + 2 \sqrt{\frac{p\cdot (1-p)}{n}} \] Vi har derfor et interval, hvori \(\hat{p}\) kan ligge i: \[\left[ p - 2 \sqrt{\frac{p\cdot (1-p)}{n}} \ ; p + 2 \sqrt{\frac{p\cdot (1-p)}{n}} \right] \] Eneste problem er at intervallet afhænger af den ukendte andel \(p\). Heldigvis kan sætningen “Store Tals Lov” bruges. Den siger groft sagt, at hvis størrelsen \(n\) af stikprøven er stor nok, så vil \(\hat{p}\) være tæt på \(p\).
Et 95%-konfidensinterval for \(k\) ved en stikprøve størrelse på \(n\) kan derfor skrives: Husk at tjekke, at både middelværdien \(n\cdot p\) og \(n\cdot (1-p)\) er 5 eller større, hver gang du bruger denne formel for konfidensinterval. \[\left[ \hat{p} - 2 \sqrt{\frac{\hat{p}\cdot (1-\hat{p})}{n}} \ ; \hat{p} + 2 \sqrt{\frac{\hat{p}\cdot (1-\hat{p})}{n}} \right] \] Størrelsen \[∆p = 2 \sqrt{\frac{\hat{p}\cdot (1-\hat{p})}{n}} \]kaldes den statistiske usikkerhed (ved et signifikansniveau på 5%).
På grund af \(\sqrt{n}\) i formlen for den statistiske usikkerhed skal stikprøvestørrelsen \(n\) firedobles for at halvere den statistiske usikkerhed.
Konfidensinterval og hypotesetest
Vi ønsker at teste om en andel \(p\) af populationen har en bestemt egenskab. Til det brug udtages en stikprøve af størrelse \(n\) og det viser sig, at \(k\) elementer i stikprøven har egenskaben.
Nulhypotese
Antag, at andelen af populationen med egenskaben er \(p\).
Forventning
Bemærk, at nulhypotesen bruges til at bestemme forventningen.
Denne formel for konfidensinterval svarer til en test med signifikansniveauet \(5\%\).
Med en stikprøvestørrelse på \(n\) forventer vi, at observere en andel i intervallet: \[\left[ p - 2 \sqrt{\frac{p\cdot (1-p)}{n}} \ ; p + 2 \sqrt{\frac{p\cdot (1-p)}{n}} \right] \]
Observation
En stikprøve på \(n\) elementer udtages. Vi observerer \(k\) elementer i stikprøven med egenskaben. Den tilhørende andel er \(\hat{p}=\frac{k}{n}\).
Accept eller forkastning
Hvis den observerede andel \(\hat{p}\) tilhører konfidensintervallet, er alt som forventet. Derfor forkastes nulhypotesen ikke. (Nulhypotesen accepteres).
Hvis den observerede andel \(\hat{p}\) ikke tilhører konfidensintervallet, passer det observerede ikke med forventningen. Derfor forkastes nulhypotesen.


I en hypotesetest for andel af population kan konfidensintervallet fortolkes som testens acceptmængde.
Da formlen for konfidensintervallet er fundet ved at bruge normalfordelingsapproksimationen til en binomialfordeling, så virker metoden kun, hvis både middelværdien \(n\cdot p\) og \(n\cdot (1-p)\) er 5 eller større.
Minus minus giver plus - for viderekommere
Jens Axel Søgaard, 26. marts, 2024
Du har sikkert hørt reglen
"Minus minus giver plus."
mange, mange gange.
Reglen dækker over følgende tre regneregler: \[ \begin{align} -(-a) &= a\\ a-(-b) &= a+b\\ (-a)\cdot (-b) &= a\cdot b \end{align} \]
Vi skal her forsøge at besvare spørgsmålet “hvorfor gælder reglerne”. Undervejs ser vi også på “spillereglerne”, når regneregler skal forklares.
Den ultrakorte forklaring er, at reglerne er konsekvenser af nogle “grundregneregler” for tallene. De grundantagelser vi har om tallene kaldes aksiomer. Disse antagelser skal ikke bevises. Aksiomerne giver i første omgang at der findes to tal 0 (nul) og 1 (et) med specielle egenskaber. Derudover er regler for addition (plus) og multiplikation (gange). Grundregnereglerne er meget simple. Det svære er altså ikke at forstå grundregnereglerne, men derimod at gennemskue, hvordan de kan bruges til at bevise mere komplicerede regler (uden snyde ved at komme til at bruge en regel, man ikke har bevist).
Talområder
I gymnasiet har du set, at tallene deles op i flere typer. \[\begin{alignat}{2} ℕ, & \textrm{ de } \textit{ naturlige\ tal} && \quad 1, 2, 3, \ldots \\ ℤ, & \textrm{ de } \textit{ hele\ tal} && \quad 0, ±1, ±2, ±3, \ldots \\ ℚ, & \textrm{ de } \textit{ rationale\ tal} && \quad \textrm{ alle broeker }\frac{p}{q}, \textrm{ hvor } p \textrm{ og } q \textrm{ er hele tal og }q≠0 \\ ℝ, & \textrm{ de } \textit{ reelle\ tal} && \quad \textrm{ alle uendelige decimalbroeker} \\ \end{alignat} \] Historisk har man gradvis udvidet talbegrebet, når man er stødt på problemer, der ikke kunne løses med de allerede kendte tal.
De forskellige typer har det tilfælles, at de alle har to regneoperationer addition (\(+\)) og multiplikation (\(\cdot \)). De to regneoperationer opfylder derudover en række regneregler, som også er fælles for alle taltyperne. I stedet for at have en meget lang liste af regneregler har man besluttet at lave en kort liste af grundregneregler, som gælder for alle talområder. Man kan så bruge grundregnereglerne til at bevise mere komplicerede regneregler - og disse kommer så til at gælde for alle talområderne på en gang. Der findes flere talområder end dem, vi har listet ovenfor.
Definition (Talområde)
Et talområde 𝕋 er en mængde. Elementerne i 𝕋 vil vi kalde tal. Til et talområde hører to regneoperationer addition (\(+\)) og multiplikation (\(\cdot \)) som opfylder en række regneregler.

Næste afsnit introducerer lovene. Resultatet når to tal adderes eller multiplikation igen et tal. Derudover skal regneoperationerne hver især opfylde de kommutative og associative love. Endelig skal regneoperationene addition og multiplikation "arbejde pænt sammen", de skal nemlig opfylde den distributive lov.

Talområder, hvor der findes to tal 0 og 1 som opfylder: For alle tal \(a\) gælder: \(a+0=t\) For alle tal \(a\) gælder: \(a\cdot 1=t\) For alle tal \(a\) findes et tal \(m\), så \(a+m=0\). kaldes for ringe.
Tallet 0 kaldes ringens nul-element og tallet 1 kaldes ringens et-element.
Tallet \(m\) kaldes skrives \(-a\) og kaldes det modsatte element af \(a\).

Et talområde kaldes et legeme, hvis det dels er en ring dels opfylder, at: For alle tal \(a≠0\) findes et tal \(r\), så \(a\cdot r=1\). Tallet \(r\) skrives \(\frac{1}{a}\) eller \(a^{-1}\) kaldes den reciprokke af tallet \(a\).
Eksempler
De naturlige tal ℕ er et talområde, men er ikke en ring (og derfor heller ikke et legeme). En ring skal nemlig indeholde et nul, men det mangler i de naturlige tal.
De hele tal ℤ er et eksempel på et talområde som også er en ring. For at være en ring skal der nemlig være et nul-element - og alle tallene skal have et modsat tal. Det opfylder ℤ. Til gengæld er ℤ ikke et legeme. Tallet 2 har for eksempel den reciprokke \(\frac{1}{2}\), men da \(\frac{1}{2}\) ikke er et helt tal er den reciprokke ikke med i ℤ.
Talområderne \(ℚ\) og ℝ er begge legemer. Her har alle tal pånær 0 nemlig en reciprok (og de øvrige regler er også opfyldt).
Lovene
De kommutative love for addition og multiplikation. For alle tal \(a\) og \(b\) gælder: \(\quad a+b=b+a\) For alle tal \(a\) og \(b\) gælder: \(\quad a\cdot b=b\cdot a\)
De associative love for addition og multiplikation. For alle tal \(a\), \(b\) og \(c\) gælder: \(\quad (a+b)+c=a+(b+c)\) For alle tal \(a\), \(b\) og \(c\) gælder: \(\quad (a\cdot b)\cdot c=a\cdot (b\cdot c)\)
Den distributive lov. For alle tal \(a\), \(b\) og \(c\) gælder: \(\quad a\cdot (b+c)=a\cdot b+a\cdot c\) For alle tal \(a\), \(b\) og \(c\) gælder: \(\quad (a+b)\cdot c=a\cdot c+b\cdot c\)
Fortegnsminus
Vi begynder med den første regneregel: \[-(-a) = a \] Minustegnene i denne regneregel er fortegnsminusser.
For at kunne forklare denne regnereglen skal vi have styr på, hvad fortegnsminusset betyder. Den relevante regel er:
Vi har her valgt bogstavet \(m\), for \(m\) er det modsatte tal af \(a\). For ethvert tal \(a\) findes et tal \(m\) med egenskaben: \(a + m = 0.\)
Hvis \(a\) for eksempel er tallet 3, så er \(m\) tallet -3, for \(3+(-3)=0\).
I reglen står kun, at der findes mindst et tal \(b\) med egenskaben \(a+b=0\).
Er der i vores eksempel andre muligheder end \(m=-3\)?
Forestil dig, at der findes et tal \(a\) og to tal \(m_1\) og \(m_2\) med: \[a+m_1 = 0 \quad \textrm{ og } \quad a+m_2=0 \] Så gælder: Her bruges den associative lov. \[m_1 = m_1+0 = m_1+(a+m_2) = (m_1+a)+m_2 = 0+m_2 = m_2 \] Der findes altså et og kun et tal, der lagt til \(a\) giver 0.
Vi lader nu \(-a\) (udtalt “minus a”) være det entydige tal, som lagt \(a\) til giver 0.
For ethvert tal \(a\) findes et og kun et tal \(-a\) med egenskaben: \[a + (-a) = 0. \]
Hvilken egenskab har tallet \(-(-a)\) så?
Det må være det tal som man kan lægge til \(-a\) for at få 0. \[-a + (-(-a)) = 0 \] Men vi ved ved jo, at \[-a + a = a + (-a) = 0, \] så både \(a\) og \(-(-a))\) kan lægges til \(-a\) for at få nul. Men da der kun findes et sådant tal, må \(-(-a)\) og \(a\) være samme tal. Konklusionen er altså, at: \[-(-a) = a \]
Fratrækningsminus
I den næste regneregel \[a-(-b) = a+b \] er der to forskellige minustegn. Det første minustegn er et fratrækningsminus og minusset i parentesen er et fortegnsminus. For at kunne bevise reglen skal vi først se på, hvad fratrækningsminusset betyder.
For alle tal \(a\) og \(b\) sættes: \(a-b = a+(-b)\)
Vi kan nu regne på \(a-(-b)\). \[a-(-b) = a + (-(-b)) = a + b \] Det første lighedstegn skyldes betydningen af fratrækningsminusset. Det andet lighedstegn skyldes vores allerede beviste regel om fortegnsminusser.
Minus gange minus
Vi er nu klar til at se på regnereglen: \[(-a)\cdot (-b) = a\cdot b \] De to minusser er begge fortegnsminusser. Det vi ved om tallene \(-a\) og \(-b\) er: \[a+(-a)=0 \quad \textrm{ og } \quad b+(-b)=0 \] Vi skal derfor på en eller anden måde bruge disse ligninger for at komme frem til hvad \((-a)\cdot (-b)\) giver. Vi får ideen at gange \((-b)\) på den første ligning, for så dukker \((-a)\cdot (-b)\) op. Dernæst bruges aksiom 5 (den distributive lov) til at gange ind i parentesen. I udregningerne bruges et aksiom ad gangen. \[ \begin{align} a+(-a) &= 0\\ (a+(-a))\cdot (-b) &= 0\cdot (-b)\\ (a+(-a))\cdot (-b) &= 0\\ a\cdot (-b)+(-a)\cdot (-b) &= 0 \end{align} \] Vi ser, at \((-a)\cdot (-b)\) er det tal, der skal lægges til \(a\cdot (-b)\) for at give 0, så: \[-(a\cdot (-b)) = (-a)\cdot (-b) \] For at komme videre skal vi vide noget om \(a\cdot (-b)\). Derfor ganger vi nu \(a\) på den anden ligning. I udregningerne bruges en grundregel ad gangen. \[ \begin{align} b+(-b) &= 0\\ a\cdot (b+(-b)) &= a\cdot 0\\ a\cdot (b+(-b)) &= 0\\ a\cdot b + a\cdot (-b) &= 0 \end{align} \] Vi ser, at \(a\cdot (-b)\) er det tal, der lagt til \(a\cdot b\) giver 0. Det vil sige: \[-(a\cdot b) = a\cdot (-b) \]
Vi har så: \[(-a)\cdot (-b) = -(a\cdot (-b)) = -( -(a\cdot b) ) = a\cdot b \] Hvis du går tilbage og tjekker udregningerne, vil du se, at vi kun har brugt reglerne for ringe. Vores minus-minus-regler gælder altså for alle ringe. Reglerne gælder altså for både ℤ, ℚ og ℝ. Men reglen gælder ikke for de naturlige tal ℕ. Kan du se, hvorfor reglerne ikke fungerer for ℕ?
Udfordring: Den reciprokke er entydig
I dette afsnit skal undersøge den reciprokke for et tal \(a\). Du skal altså arbejde med legemer. I et legeme har man reglen: For alle tal \(a≠0\) findes et tal \(r\), så \(a\cdot r=1\). Tallet \(r\) skrives \(\frac{1}{a}\) eller \(a^{-1}\) kaldes den reciprokke af tallet \(a\).
Din første udfordring er at bevise, at tallet \(r\) er entydigt.
Det vil sige, antag der findes et tal \(a≠0\) og to tal \(r_1\) og \(r_2\) så: \[a\cdot r_1 \quad \textrm{ og } \quad a\cdot r_2=1 \] Problemet er så at finde mellemregningerne i udregningen: \[r_1 = \ldots = r_2 \] Tallet \(r\) kaldes den reciprokke af \(a\).
Din anden udfordring er at bevise, at \[\frac{1}{\left(\frac{1}{a}\right)} = a \] for alle tal \(a≠0\).
Udfordring: Alternativt bevis
I videoen "Negative × Negative = Positive in 5 Levels -- Elementary to Math Major" vises denne udregning: \[ \begin{align} (-a)\cdot (-b) &= (-a)\cdot (-b) + a \cdot (0)\\ &= (-a)\cdot (-b) + a \cdot (-b+b)\\ &= (-a)\cdot (-b) + a\cdot (-b) + a\cdot b\\ &= (-b)\cdot (-a+a) + a\cdot b\\ &= (-b)\cdot (0) + a\cdot b\\ &= a\cdot b \end{align} \] Umiddelbart ser det kort ud, men der er brugt mere end en grundantagelse per omskrivning.
Udfordringen består i at indsætte mellemregninger, så der kun bruges et aksiom per omskrivning.
Kan du gennemskue, hvordan man har fået ideen til omskrivningen?