datagott > wetenschap

Peter (17.07.2005, 19:51)
Hallo lezer,

Laat ik allereerst beginnen met de opmerking dat ik een complete leek
ben op het gebied van wiskunde. Het enige dat ik weet is dat het
probleem wat ik heb oplosbaar zou moeten zijn, maar hoe is mij een
raadsel. Het zit als volgt:

Ik heb de volgende coordinaten:

(x, y, z)
=========
(0, 0, 0)
(5, 2, 500)
(25, 2.48, 2000)
(100, 4.68, 5000)
(250, 8.1, 10000)

Binnen deze coordinaten wil ik graag voor elke x en z waarde binnen het
bereik van de opgegeven coordinaten de bijbehorende y waarde kunnen
berekenen.
Ik heb geprobeerd het figuur bij bovenstaande coordinaten te
visualiseren en heb het gevoel dat het niet bepaald gemakkelijk is,
maar toch ook niet onmogelijk.
Iemand die me kan helpen?

Peter
jan hauben (17.07.2005, 22:12)
> Laat ik allereerst beginnen met de opmerking dat ik een complete leek [..]
> (100, 4.68, 5000)
> (250, 8.1, 10000)
> Binnen deze coordinaten wil ik graag voor elke x en z waarde binnen het
> bereik van de opgegeven coordinaten de bijbehorende y waarde kunnen
> berekenen.
> Ik heb geprobeerd het figuur bij bovenstaande coordinaten te
> visualiseren en heb het gevoel dat het niet bepaald gemakkelijk is,
> maar toch ook niet onmogelijk.
> Iemand die me kan helpen?


je hebt maar 3 punten nodig om een vlak te beschrijven
de vergelijking van een 3D-vlak is in de aard van
(x - x0)/a + (y - y0)/b + (z - z0)/c = 0
als het punt (0,0,0) op het vlak ligt is x0 = y0 = z0 = 0
dan heb je een stelsel van vergelijkingen
[x1 y1 z1;x2 y2 z2;x3 y3 z3;x4 y4 z4;x5 y5 z5]*[1/a;1/b;1/c] = 0
maar als je effe kijkt zie je zo dat die punten niet coplanair zijn, de
gradient is niet constant
het is altijd mogelijk om een ellipso´de te plotten door 5 punten

als het toch een vlak moet zijn, kun je er een vlak door proberen te fitten
omdat het stelsel overgedimensioneerd is kun je best een kleinste kwadraten
benadering gebruiken
dat je op de volgende manier kunt reduceren
je wil x en z ifv van y dus y = a*x + b*z + c
dit geeft
[sum((xi^2) sum(xi*zi) sum(xi);sum(xi*zi) sum(zi^2) sum(zi);sum(xi) sum(zi)
1]*[a;b;c] = [sum(xi*yi) sum(yi*zi) sum(yi)]
de oplossing van dit stelsel geeft het vlak waarvoor de afstand tot de 5
punten minimaal is
omdat je niet wiskundig aangelegd bent
a = -0.0523
b = 0.0021
c = -0.4208
deze fit heeft een maximale kwadratische fout van 2.5898 voor punt 2, dus
het is niet echt ideaal
je zou ook de relatieve fout op het resultaat kunnen proberen minimaliseren

ik hoop dat je er iets aan hebt
Dave Langers (18.07.2005, 12:34)
> Ik heb de volgende coordinaten:
> (x, y, z)
> =========
> (0, 0, 0)
> (5, 2, 500)
> (25, 2.48, 2000)
> (100, 4.68, 5000)
> (250, 8.1, 10000)
> Binnen deze coordinaten wil ik graag voor elke x en z waarde binnen het
> bereik van de opgegeven coordinaten de bijbehorende y waarde kunnen
> berekenen.


Het valt me op dat de gegeven punten redelijk op een lijn liggen, dus
dan is het fitten van een vlak erdoorheen nogal onnauwkeurig. Het
probleem is een beetje slecht geconditioneerd om zomaar de eerste de
beste fittechniek op los te laten in mijn ogen.
Weet je wat voor soort vlak er doorheen moet? Heb je niet een z-waarde
voor (x,y)=(0,100) of zo? Oftewel, vertel eens iets meer over de
achtergrond van het probleem.
J. J. Lodder (18.07.2005, 17:42)
Peter <poostwoud> wrote:

[..]
> (25, 2.48, 2000)
> (100, 4.68, 5000)
> (250, 8.1, 10000)
> Binnen deze coordinaten wil ik graag voor elke x en z waarde binnen het
> bereik van de opgegeven coordinaten de bijbehorende y waarde kunnen
> berekenen.
> Ik heb geprobeerd het figuur bij bovenstaande coordinaten te
> visualiseren en heb het gevoel dat het niet bepaald gemakkelijk is,
> maar toch ook niet onmogelijk.


Drie punten bepalen een vlak, en je hebt er 5,
dus drie uit 5 = 5!/3!2! = 10 vlakken.

Die snijden elkaar uiteraard, en bepalen diverse volumes.

Bedenk dus wat je nu eigenlijk wilt,

Jan
Peter (18.07.2005, 17:45)
Beste Dave,

Het vraagstuk zit als volgt:

Stel ik huur een computerserver voor extra capaciteit binnen mijn
netwerk en wordt daarbij belast voor de hoeveelheid schijfruimte en
dataoverdracht.
De betekenis van de coordinaten zijn:

x = schijfruimte (in Mb)
y = kosten (in Euro)
z = dataoverdracht (in Mb per maand)

De coordinaten die ik heb gegeven zijn de tarieven die aan mij worden
gerekend. Ik ben op zoek naar antwoorden voor de volgende vragen:

* Ik wil kunnen berekenen wat de kosten zijn voor elke schijfruimte x
binnen het bereik van 0 en 250 Mb en dataoverdracht tussen de 0 en
10.000 Mb.

* Ik vraag me af of er een verband bestaat tussen de schijfruimte en de
dataoverdracht, maw wat moet ik betalen als ik alleen schijfruimte
gebruik.

Dat is alles wat ik heb, ik hoop dat je me verder kunt helpen.

Peter

Dave Langers schreef:
[..]
Gert de Korte (18.07.2005, 18:08)
"Peter" <poostwoud>

> Ik vraag me af of er een verband bestaat tussen de schijfruimte en de
> dataoverdracht


geen enkel

> maw wat moet ik betalen als ik alleen schijfruimte
> gebruik.


Wat staat er in je waterdichte kontrakt?

GdK
Dave Langers (19.07.2005, 12:58)
>>>(x, y, z)
>>>=========
>>>(0, 0, 0)
>>>(5, 2, 500)
>>>(25, 2.48, 2000)
>>>(100, 4.68, 5000)
>>>(250, 8.1, 10000)


> * Ik wil kunnen berekenen wat de kosten zijn voor elke schijfruimte x
> binnen het bereik van 0 en 250 Mb en dataoverdracht tussen de 0 en
> 10.000 Mb.
> * Ik vraag me af of er een verband bestaat tussen de schijfruimte en de
> dataoverdracht, maw wat moet ik betalen als ik alleen schijfruimte
> gebruik.
> Dat is alles wat ik heb, ik hoop dat je me verder kunt helpen.


In je getallenset correleren de x zeer sterk met de z. Dit betekent dat
het niet te doen is om te bepalen of de afhankelijkheid in y nu komt
door de x of door de z.
Vergelijk het maar met iemand die de lengte van een staf ijzer meet als
functie van de temperatuur in celsius en fahrenheit, en die vervolgens
wil weten of de uitzetting nu komt door een stijging op de
celsiusschaal, of op de fahrenheitschaal. Da's onzinnig en onmogelijk.
In jouw geval is de vraag niet onzinnig, maar het is net zo onmogelijk.
Eigenlijk probeer je te extrapoleren naar omstandigheden waarvoor je in
de verste verte geen data hebt, en dat gaat meestal mis. Als je nu info
over een pakket had met heel veel schijfruimte en weinig overdracht, of
omgekeerd heel weinig schijfruimte en veel overdracht, dan was het iets
realistischer. Maar dat is juist wat je wil bepalen lijkt het.
Wat voor methode je ook gebruikt, als ze al een uitkomst geven zijn ze
voor dit probleem met deze gegevens onbetrouwbaar.
Jos Horikx (19.07.2005, 13:47)
On Tue, 19 Jul 2005 12:58:46 +0200, Dave Langers
<voornaam> wrote:

>In je getallenset correleren de x zeer sterk met de z.


Inderdaad. De juiste term hiervoor is "multicollineariteit". Voor
de ge-interesseerde medemens heb ik alvast een google-search
uitgevoerd op (oa) deze term (maar dan in de engelse spelling):

[..]

JH
Peter (19.07.2005, 20:09)
Beste Dave,

Dat is erg jammer... Erg bedankt voor je tijd en je duidelijke uitleg
voor aan een wiskundeleek!

Met vriendelijke groet,

Peter

Dave Langers schreef:
[..]
Soortgelijke onderwerpen