Reidar Conradi, NTNU: "Kommentar til to-siders artikkel av journalist Per Kristian Bjørkeng i Aftenposten søndag 5.7 2009, om Bibliotekenes nemesis, web-søkeunivers og digitale opphavsretter
-- epost-brev av 7. juli 2009

@@@@@@@@@@@@Her følger tre sammenslåtte eposter. - reidar @@@@@@@@@@@@@

From: Reidar Conradi <reidarconradi@googlemail.com>
Date: 2009/7/7
Subject: Biblioteker: opphavsretter
To: per.kristian.bjorkeng@aftenposten.no
Cc: Reidar Conradi <reidarconradi@googlemail.com>, conradi@idi.ntnu.no

Hei, gratulerer med en meget interessant og velskrevet artikkel om Bibliotekenes nemesis" i Aftenpostens kulturseksjon, søndag 5. juli 2009, s.10-11. De nåværende bibliotekenes rolle synes rimelig uavklart i Internettets tidsalder. Jeg har to kommentarer her.

1. Minimalt plassbehov og tilsvarende pris for digitaliserte media med dagens datateknologi.

Digitaliserte media har omtrent nullkost for bearbeiding, fremvisning, lagring og overføring.

Ifølge mine kollegaer som jobber med Internett-søkemaskiner, kan hele Internettets søkeunivers (milliarder av nettsteder med iboende tekstinnhold) få plass i én skoeske!
Men korreksjon nedenfor i epost fra dr.ing. og sjef for Trondheimskontoret til søkemotorfirmaet FAST/Microsoft, Øystein Torbjørnsen:
Det blir 17 skoesker à 10 liter, eller en skuffseksjon i kjøkkenbenken !!

Nesten alt skrevet tekstmateriale etter 1990 er allerede på digital form, og fordobles i volum ca. hvert annet år. Hvis man i tillegg kan skanne inn mesteparten av det resterende tekstmaterialet fra før 1990, og gjøre dette søkbart - slik Google er i full sving med - betyr det at man for første gang i historien får nesten all verdens skrevne kunnskap tilgjengelig på fingertupps avstand. I tillegg er ca. halvparten av verdens mennesker tilkoplet "nettet". Potensialet til denne "alle-mot-alt-og-alle" tilgjengeligheten er uhyre interessant. Jorda er blitt "flat", ved at alle kan bidra på rimelig like vilkår. For eksempel er 1,5 millioner nordmenn medlem av nettsamfunnet Facebook, og frivillige bidragsytere til nettleksikonet Wikipedia har nedlagt 60 000 årsverk.

Tilbake til bibliotekenes rolle: Hvis et bibliotek om noen år vil ha tilgang til "all" skreven kunnskap som rent materielt kan rommes i noen få skoesker, hva skal vi da med store marmorkledde bygninger med kilometervis av antakelig tomme hyllekilometre? Problemstillingen gjelder det nye Deichmanske bibliotek i Bjørvika i Oslo, såvel som de planlagte nybygg ved universitetsbibliotekene ved NTNU i Trondheim og ved St Andrews University i Skottland - for å ta noen eksempler.

2. Eierskap vs. opphavsrett

I artikkelen din snakker du om skillet mellom å "eie" musikk og ha "tilgang" til den.

Terminologien er viktig her. Offentliggjorte åndsverk som skjønnlitteratur, vitenskapelige artikler, musikk eller malerier kan ikke "eies", selv ikke av den såkalte "opphavsmannen". Verkenes idéinnhold er mao. felleseie - det er derfor de blir gjort offentlige. Opphavsmannen er videre beskyttet av Bernkonvensjonen mot endringer i selve åndsverket og har automatisk opphavsrett til egne åndsverk.

Slike opphavsretter kan derimot eies og følgelig selges, kjøpes og kommersielt utnyttes til f.eks. å lage kopier av åndsverket. Sony kjøpte opphavsrettene til Disneys tegnefilmer og tegneserier, men Carl Barks sine Donald-tegninger kunne bare endres av ham selv så lenge han levde. Og jeg har opphavsrett til en tekst (et mulig åndsverk) slik som denne meldingen, selv om den er lagret i en fysisk datamaskin eid av andre. Alle fysiske gjenstander kan i prinsipp "eies", f.eks. en CD eller et bokeksemplar som begge utrykker et åndsverk.

Så Einsteins formel E = m c^2 eller en beskrivelse av funksjonalistisk arkitektur "eies" av ingen, selv ikke av sin opphavsmann. Derimot kan en tekstkopi av et vitenskapelig fysikktidsskrift eller av en arkitekturlærebok, som beskriver ovennevnte fenomener, være tilgjengelig kun etter betaling til et forlag. Denne åndsverk-kopien kan "eies" - med restriksjoner på videre kopiering - dvs. kjøpes og selges. Det er denne kopieringen ifm. digitale media og Internett som opphavsdebatten dreier seg om. Jeg har ingen enkel og rettferdig løsning på dette, men nullpris ser ut til å fungere godt for programvare i form av Åpen Kildekode slik som i operativsystemet Linux. :-)

Se også på min hjemmeside/blogg om lokal debatt om opphavsrett til intellektuelt arbeid/åndsverk ved NTNU: Reidar Conradi, IDI, NTNU: "IP- og IPR-reglement ved NTNU - kampen om kunnskapen"; kort versjon per 9. sept. 2008.

- mvh, reidar, 918,97029

@@@@@@@@@@@@@@ ANSLAG FOR DATAVOLUM PÅ WWW/Internettet @@@@@@@@@@@@@@@@@@@

Siste versjon 3 fra 10. juni 2010: likevel mindre enn én skoeske

Date: Torsdag, 10. juni 2010 13:47
From: Øystein Torbjørnsen
To: Reidar Conradi
Subject: Revidert regnestykke for å lagre Internett/web-data

Fra Øystein:
Min reviderte beregning er basert på microSDHC flash minnebrikker. Disse brukes typisk i mobiltelefoner. De største som kan kjøpes nå, har en kapasitet på 32 GB.

Kapasitet: 32 GB.
Fysisk størrelse: 11mmx15mmx1mm, dvs. 165 mm^3.
Vekt: 0,5 g (ca.).

Søkbare delen av Internett: 58 milliarder websider, 25 KB per side; dvs.
(58 x 10^9) x (25 x 10^3) Byte = 1,45 x 10^15 B = 1,45 petaB.

Trenger da (1,45 x 10^15) / (32 x 10^9) = 45 313 brikker.

Dette gir et volum på 165 mm^3 x 45313 = 7,425 x 10^6 mm^3 = ca. 7,5 liter og vekt ca. 22 kg - dvs. 3/4 av en skoeske på 10 liter. En skoeske på 10 liter kan således romme 2 petaB.

NB. Dette estimatet inneholder (som tidligere) ikke kontakter og kabling for å koble sammen alle disse brikkene.

Hilsen: Øystein Torbjørnsen, +47 4801 1172,
http://www.microsoft.com/enterprisesearch

Forrige versjon 2: heller 17 skoesker for å lagre alle Internett-data

*From:* Øystein Torbjørnsen
*Sent:* 8. juli 2009 10:50
*To:* 'Reidar.Conradi@idi.ntnu.no'
*Subject:* Størrelse på web index

Hei Reidar,

For å være sikker på det kjappe "skoeske-estimatet" jeg gjorde tidligere, så fant jeg noen kilder og regnet på det. Det ser ut til at jeg bommet med en faktor 17. Det trenges ca. 17 skoesker for å lagre den indekserte delen av Internettet (1,25 petaB).

Antall websider på Internettet: se http://www.worldwidewebsize.com/.
Her antar man at under 50 milliarder sider er indeksert. Google har tidligere sagt at de kjenner til 1000 milliarder web-linker, men dette er ofte dynamisk innhold.

Så trenger vi å vite størrelsen på en webside (nettside på norsk):
se http://www.websiteoptimization.com/speed/tweak/average-web-page/
Middelstørrelsen av en webside oppgis her til: 312 KB (25 KB uten scripts og bilder) -- Reidar: dvs. som en tredjedels bok.

Her velger jeg å utelukke skripts og bilder siden vi snakker om det som er søkbart. Egentlig er mesteparten av de 25 KB HTML-tags og andre formateringskommandoer, så tallet er egentlig enda mindre. Ett sted har jeg sett at den gjennomsnittlige websiden inneholder mindre enn 500 ord, eller 2500 B med 5 tegn per ord.

Total web-størrelse: 50x10^9 x 25x10^3 B = 1250 x 10^12 B = 1250 teraB = 1,25 petaB. = 2500 laptop disker.

(f.eks. Seagate ST9500325AS, kapasitet = 500GB,
størrelse = 9,5 mm x 69,9 mm x 100,5 mm = 67 000 mm^3, vekt = 99 g).

Dvs. vekt 250 kg og 167 liter (17 skoesker).

Skoeske: 125mm x 230mm x 340mm = 9 775 000 mm3 = ca. 10 liter.

PS: Når diskene er i bruk, så kan de ikke pakkes så tett. Trenger plass for luft for kjøling.

Hilsen
*Øystein Torbjørnsen* | Microsoft | Enterprise Search Group | Partner SDE Lead |
d: +47 2301 1172 | m: +47 4801 1172 | http://www.microsoft.com/enterprisesearch

Første versjon 1 fra januar 2009: én skoeske for å lagre alle Internett-data?

Dvs. i januar 2009 anslo kollega Øystein Torbjørnsen fra FAST at alle indekserte data på Internettet (litt over en petaB eller 10^15 Byte) kunne rommes i én skoeske (FAST var forøvrig oppkjøpt av Microsoft på det tidspunktet).
- reidar

@@@@@@@@@@@ EN SISTE KOMMENTARHILSEN FRA REIDAR @@@@@@@@@@@@@@@@@

Date: Wed, 8 Jul 2009 23:31:47 +0200
Subject: Fwd: FW: Størrelse på web index
From: Reidar Conradi <reidarconradi@googlemail.com>
To: Øystein Torbjørnsen <Takk for spennende info.
167 liter er faktisk nøyaktig volumet til ett fat olje!

Ellers: anta 10 milliarder (10 giga) "utgitte" bøker samlet i verdens biblioteker og med 1 MB hver, dvs. 10 petaB eller 5 skoesker (50 liter).

Tilføyd 24.7.2010: anta 100 milloner produserte spille- og TV-filmer i farger i hele verden siden år 1900. Hver film antas å ha 3 basisfarger og 1000 x 1000 bildepunkter per bilderamme, så vi trenger 0,375 MB per bilderamme. Med 25 rammer per sekund og filmvarighet på 2 timer eller 7200 sekunder er vi oppe i 67,5 GB per film. Men med moderne TV-bildekomprimering (MPEG-5 standard) i DVD-format kan dette plassbehovet reduseres med en faktor 100 (kun 1% "forskjellig" informasjon per bilderamme), så vi er nede i 0,675 gigaB eller én gigaB i praksis. Dvs. at alle verdens filmer til nå trenger (100 x 10^6) x 10^9 B = 100 petaB, som kan rommes i 50 skoesker (500 liter).
Kanskje alt dette kan rommes i din mobiltelefon om 20 år? :-)

- reidar, p.t. nesten på ferie


File: http://www.idi.ntnu.no/~conradi/IT-debate/size-googlespace-10jul09.html.

Reidar.Conradi@idi.ntnu.no
Last modified: Sat Jul 24 15:38:40 MEST 2010